Completed: - Unifuncs DeepSearch API site coverage test (18 medical sites, 9 tier-1 available) - ClinicalTrials.gov dedicated test (4 strategies, English query + depth>=10 works best) - Deep Research V2.0 development plan (5-day phased delivery) - DeepResearch engine capability guide (docs/02-common-capability/) - Test scripts: test-unifuncs-site-coverage.ts, test-unifuncs-clinicaltrials.ts Key findings: - Tier-1 sites: PubMed(28), ClinicalTrials(38), NCBI(18), Scholar(10), Cochrane(4), CNKI(7), SinoMed(9), GeenMedical(5), VIP(1) - Paid databases (WoS/Embase/Scopus/Ovid) cannot be accessed (no credential support) - ClinicalTrials.gov requires English queries with max_depth>=10 Updated: ASL module status doc, system status doc, common capability list Co-authored-by: Cursor <cursoragent@cursor.com>
4.5 KiB
4.5 KiB
Unifuncs DeepSearch API 网站覆盖能力测试记录
日期: 2026-02-22
目的: 在 Deep Research V2.0 开发前,验证 Unifuncs API 对中国医生常用医学期刊网站的搜索能力
结论: 18 个站点测试完毕,9 个一级可用,8 个二级可达,1 个超时(已通过专项测试解决)
1. 测试背景
V2.0 升级需要明确 Unifuncs DeepSearch API 能覆盖哪些医学期刊网站,以便在前端展示可选数据源。本次测试覆盖了 7 个最关注站点 + 11 个其他常用站点,共 18 个。
2. 测试配置
- 脚本:
backend/scripts/test-unifuncs-site-coverage.ts - 模式:异步模式(create_task + query_task 轮询)
- 查询:
他汀类药物预防心血管疾病的随机对照试验和Meta分析,近5年高质量研究 - max_depth:5(测试用低深度加快速度)
- 超时:600 秒
- 并行:18 个任务同时创建、各自轮询
3. 全站测试结果
3.1 Top 7 最关注站点
| 序号 | 站点 | 状态 | 站内链接 | 其他链接 | 搜索/阅读 | 耗时 |
|---|---|---|---|---|---|---|
| 1 | PubMed | ✅ | 28 | 0 | 9/29 | 177s |
| 2 | ClinicalTrials.gov | ⏰ 超时 | 0 | 0 | 0/0 | 611s |
| 3 | 中华医学期刊网 | ⚠️ | 0 | 12 | 41/17 | 376s |
| 4 | 中国知网 CNKI | ✅ | 7 | 0 | 40/6 | 189s |
| 5 | 万方数据 | ⚠️ | 0 | 7 | 42/15 | 258s |
| 6 | 维普 VIP | ✅ | 1 | 0 | 33/3 | 153s |
| 7 | 中国临床试验注册中心 | ⚠️ | 0 | 7 | 36/11 | 200s |
3.2 其他常用站点
| 序号 | 站点 | 状态 | 站内链接 | 其他链接 | 搜索/阅读 | 耗时 |
|---|---|---|---|---|---|---|
| 8 | CBM/SinoMed | ✅ | 9 | 1 | 17/12 | 200s |
| 9 | Web of Science | ⚠️ | 0 | 6 | 41/4 | 211s |
| 10 | Embase | ⚠️ | 0 | 14 | 24/24 | 247s |
| 11 | Cochrane Library | ✅ | 4 | 7 | 38/12 | 235s |
| 12 | Google Scholar | ✅ | 10 | 0 | 22/26 | 247s |
| 13 | Ovid | ⚠️ | 0 | 0 | 18/0 | 95s |
| 14 | Scopus | ⚠️ | 0 | 15 | 36/30 | 305s |
| 15 | 中国中医药数据库 | ⚠️ | 0 | 22 | 30/19 | 317s |
| 16 | GeenMedical | ✅ | 5 | 0 | 38/3 | 131s |
| 17 | NSTL | ⚠️ | 0 | 0 | 27/0 | 96s |
| 18 | NCBI (全站) | ✅ | 18 | 0 | 24/19 | 246s |
4. ClinicalTrials.gov 专项测试
ClinicalTrials.gov 在全站测试中超时,进行了 4 种策略对比测试:
脚本:backend/scripts/test-unifuncs-clinicaltrials.ts
| 策略 | 查询语言 | domain_scope | max_depth | 耗时 | CT 链接 | NCT 编号 |
|---|---|---|---|---|---|---|
| A 英文+限定CT | English | clinicaltrials.gov | 10 | 120s | 38 | 37 |
| B 英文+不限域 | English | 不限 | 10 | 145s | 13 | 12 |
| C 中文+限定CT+高深度 | 中文 | clinicaltrials.gov | 15 | 179s | 22 | 21 |
| D 简短英文+限定CT | English | clinicaltrials.gov | 5 | 179s | 21 | 20 |
结论:ClinicalTrials.gov 完全可用!策略 A(英文查询 + 限定域名 + max_depth=10)效果最佳,120 秒获取 38 个链接。上次超时原因是中文查询 + 低深度组合。
5. 关键发现
可用性总结
- 一级可用(9 个):PubMed, ClinicalTrials.gov, NCBI/PMC, Google Scholar, CBM/SinoMed, CNKI, GeenMedical, Cochrane Library, 维普
- 二级可达(8 个):中华医学期刊网, 万方, 中国临床试验注册中心, 中国中医药数据库, Scopus, Embase, Web of Science, NSTL
- 需特殊策略(1 个):ClinicalTrials.gov → 必须英文查询 + max_depth≥10
关于付费库
Unifuncs API 不支持传入用户名密码登录搜索。付费库(Web of Science, Embase, Scopus, Ovid)只能访问公开摘要页面。
6. V2.0 前端数据源配置建议
根据测试结果,前端数据源选择分三档:
- 推荐:PubMed, ClinicalTrials.gov, NCBI/PMC, Google Scholar, Cochrane Library, CNKI, CBM/SinoMed, GeenMedical, 维普
- 可选:中华医学期刊网, 万方数据, 中国临床试验注册中心, 中国中医药数据库
- 暂不支持:Web of Science, Embase, Scopus, Ovid, NSTL
7. 产出物
| 产出 | 路径 |
|---|---|
| 全站覆盖测试脚本 | backend/scripts/test-unifuncs-site-coverage.ts |
| ClinicalTrials 专项测试脚本 | backend/scripts/test-unifuncs-clinicaltrials.ts |
| DeepSearch API 使用指南 | docs/02-通用能力层/04-DeepResearch引擎/01-Unifuncs DeepSearch API 使用指南.md |
| V2.0 开发计划 | docs/03-业务模块/ASL-AI智能文献/04-开发计划/07-Deep Research V2.0 开发计划.md |