# ASL 测试数据? > **创建日期?* 2025-11-15 > **维护人:** ASL 开发团? > **用途:** 用于测试 AI 智能文献模块的准确率和质? --- ## 📋 数据集概? 本目录包含用于测?ASL 模块各项功能的测试数据集,包括: | 测试类型 | 文件?| 数据?| 状?| |---------|--------|--------|------| | **标题摘要初筛** | `screening/` | 199 ?| ?待导?| | **PDF 全文提取** | `pdf-extraction/` | 待补?| ?待补?| --- ## 📁 文件夹结? ``` 03-测试数据/ ├── README.md ?当前文件 ? ├── screening/ ?标题摘要初筛测试数据 ? ├── literature-list-199.xlsx ?199 篇文献列表(标题+摘要? ? ├── picos-criteria.txt ?PICOS 标准定义 ? ├── inclusion-criteria.txt ?纳入标准 ? ├── exclusion-criteria.txt ?排除标准 ? └── gold-standard.json ?人工标注的正确结果(金标准) ? └── pdf-extraction/ ?PDF 全文提取测试数据 ├── sample-01-rct.pdf ?RCT 研究样本 ├── sample-02-cohort.pdf ?队列研究样本 ├── sample-03-with-tables.pdf ?包含复杂表格的样? ├── sample-04-chinese.pdf ?中文文献样本 └── README.md ``` --- ## 🎯 使用方法 ### 1. 导入测试数据 **请按以下步骤导入您的测试数据?* #### ?)标题摘要初筛测试数? **文件清单?* - `literature-list-199.xlsx`?99 篇英文文献列? - `picos-criteria.txt`:PICOS 标准(Population, Intervention, Comparison, Outcome, Study Design? - `gold-standard.json`:人工标注的正确结果 **Excel 文件格式要求?* ``` 列名(必须)? - Title(标题) - Abstract(摘要) - DOI(可选) - Authors(作者,可选) - Year(年份,可选) - Journal(期刊,可选) 示例? | Title | Abstract | DOI | Authors | Year | Journal | |--------------------------------|---------------------------|---------------|--------------|------|---------| | Effect of aspirin on ... | Background: ... | 10.1038/... | Smith J, ... | 2020 | NEJM | ``` **PICOS 标准格式?* ```txt # PICOS 标准 ## Population(人群) - 成年高血压患者(年龄 ?18 岁) - 无心血管疾病史 ## Intervention(干预) - 每日服用阿司匹林 100mg ## Comparison(对照) - 安慰剂或无治? ## Outcome(结局? - 主要结局:心血管事件发生率 - 次要结局:全因死亡率 ## Study Design(研究设计) - 随机对照试验(RCT? - 队列研究(Cohort Study? ``` **金标准格式(JSON):** ```json { "metadata": { "total": 199, "annotatedBy": "医学专家姓名", "annotatedDate": "2025-11-15", "expectedAccuracy": 0.90 }, "results": [ { "id": 1, "doi": "10.1038/nature12373", "title": "...", "decision": "include", "reason": "符合 PICO 标准:人群为成年高血压患者,干预为阿司匹?..", "confidence": 1.0 }, { "id": 2, "decision": "exclude", "reason": "不符合纳入标准:人群为儿童患?, "confidence": 0.95 } ] } ``` #### ?)PDF 全文提取测试数据 **建议准备的样本类型:** - RCT 研究(随机对照试验) - 队列研究(Cohort Study? - 包含复杂表格的文? - 包含数学公式的文? - 中文医学文献(测试语言检测) **样本数量建议?* 5-10 ? ### 2. 运行测试 #### ?)标题摘要初筛测? ```bash # 进入后端目录 cd AIclinicalresearch/backend # 运行初筛测试 npm run test:asl:screening # 或者手动测试: # 1. 启动后端服务 npm run dev # 2. 通过前端上传 literature-list-199.xlsx # 3. 配置 PICOS 标准(复?picos-criteria.txt 内容? # 4. 运行批量筛? # 5. 导出结果,与 gold-standard.json 对比 ``` #### ?)评估准确率 ```bash # 自动评估准确率(与金标准对比? npm run test:asl:evaluate -- \ --result ./screening-result.json \ --gold-standard ./gold-standard.json # 输出示例? # ?准确? 92.5% # ?一致率: 88.9% # ⚠️ 假阳性率: 5.2% # ⚠️ 假阴性率: 2.3% ``` ### 3. 质量指标 | 指标 | MVP 目标 | V1.0 目标 | V2.0 目标 | |------|---------|----------|----------| | **准确?* | ?85% | ?90% | ?95% | | **一致率**(双模型?| ?80% | ?85% | ?90% | | **假阳性率** | ?10% | ?5% | ?3% | | **假阴性率** | ?5% | ?3% | ?2% | --- ## 📊 测试数据统计 ### 标题摘要初筛数据? **基本信息?* - **总数?*: 199 ? - **数据来源**: [请填写数据来源] - **领域**: 医学/临床研究 - **语言**: 英文 - **年份范围**: [请填写] **预期分布?* ``` 纳入(Include? ~45 篇(23%? 排除(Exclude? ~132 篇(66%? 不确定(Uncertain? ~22 篇(11%? ``` **研究类型分布(预估)?* ``` RCT: ~60 篇(30%? 队列研究: ~50 篇(25%? 病例对照: ~30 篇(15%? 横断面研? ~30 篇(15%? 其他: ~29 篇(15%? ``` ### PDF 全文提取数据? **待补?* --- ## ⚠️ 数据使用注意事项 ### 1. 版权声明 - 本测试数据集仅用?ASL 模块开发和测试 - 不得用于商业用? - 不得公开分发或传? - 请遵守原文献的版权许? ### 2. 数据隐私 - 确保测试数据不包含敏感信? - 如包含患者数据,必须已脱敏处? - 遵守 GDPR、HIPAA 等数据保护法? ### 3. 质量要求 - **金标准必须由医学专家标注** - 标注人需具备相关领域专业知识 - 标注过程需有质量控制机? - 建议双人独立标注,冲突需第三方仲? --- ## 🔄 数据更新记录 | 日期 | 更新内容 | 更新?| |------|---------|--------| | 2025-11-15 | 创建测试数据目录结构 | ASL 团队 | | 待更?| 导入 199 篇文献测试数?| - | | 待更?| 添加 PDF 样本数据 | - | --- ## 📞 联系方式 如有问题,请联系? - **项目负责?*: [姓名] - **邮箱**: [邮箱] - **文档维护**: [文档路径] --- ## 📚 相关文档 - [标题摘要初筛测试用例](../02-标题摘要初筛测试用例.md) - [测试计划](../01-测试计划.md) - [文献处理技术选型](../../02-技术设?07-文献处理技术选型.md) - [质量保障与可追溯策略](../../02-技术设?06-质量保障与可追溯策略.md) --- **下一步行动:** 1. ?创建测试数据目录结构 2. ?导入您的 199 篇文献测试数据(`literature-list-199.xlsx`? 3. ?创建 PICOS 标准文件(`picos-criteria.txt`? 4. ?准备金标准标注(`gold-standard.json`? 5. ?补充 PDF 样本数据