Files
AIclinicalresearch/docs/03-业务模块/ASL-AI智能文献/05-开发记录/2026-02-22_Unifuncs API网站覆盖能力测试.md
HaHafeng b06daecacd feat(asl): Add Deep Research V2.0 development plan and Unifuncs API site coverage testing
Completed:
- Unifuncs DeepSearch API site coverage test (18 medical sites, 9 tier-1 available)
- ClinicalTrials.gov dedicated test (4 strategies, English query + depth>=10 works best)
- Deep Research V2.0 development plan (5-day phased delivery)
- DeepResearch engine capability guide (docs/02-common-capability/)
- Test scripts: test-unifuncs-site-coverage.ts, test-unifuncs-clinicaltrials.ts

Key findings:
- Tier-1 sites: PubMed(28), ClinicalTrials(38), NCBI(18), Scholar(10), Cochrane(4), CNKI(7), SinoMed(9), GeenMedical(5), VIP(1)
- Paid databases (WoS/Embase/Scopus/Ovid) cannot be accessed (no credential support)
- ClinicalTrials.gov requires English queries with max_depth>=10

Updated: ASL module status doc, system status doc, common capability list
Co-authored-by: Cursor <cursoragent@cursor.com>
2026-02-22 22:44:41 +08:00

4.5 KiB
Raw Permalink Blame History

Unifuncs DeepSearch API 网站覆盖能力测试记录

日期: 2026-02-22
目的: 在 Deep Research V2.0 开发前,验证 Unifuncs API 对中国医生常用医学期刊网站的搜索能力
结论: 18 个站点测试完毕9 个一级可用8 个二级可达1 个超时(已通过专项测试解决)


1. 测试背景

V2.0 升级需要明确 Unifuncs DeepSearch API 能覆盖哪些医学期刊网站,以便在前端展示可选数据源。本次测试覆盖了 7 个最关注站点 + 11 个其他常用站点,共 18 个。

2. 测试配置

  • 脚本backend/scripts/test-unifuncs-site-coverage.ts
  • 模式异步模式create_task + query_task 轮询)
  • 查询他汀类药物预防心血管疾病的随机对照试验和Meta分析近5年高质量研究
  • max_depth5测试用低深度加快速度
  • 超时600 秒
  • 并行18 个任务同时创建、各自轮询

3. 全站测试结果

3.1 Top 7 最关注站点

序号 站点 状态 站内链接 其他链接 搜索/阅读 耗时
1 PubMed 28 0 9/29 177s
2 ClinicalTrials.gov 超时 0 0 0/0 611s
3 中华医学期刊网 ⚠️ 0 12 41/17 376s
4 中国知网 CNKI 7 0 40/6 189s
5 万方数据 ⚠️ 0 7 42/15 258s
6 维普 VIP 1 0 33/3 153s
7 中国临床试验注册中心 ⚠️ 0 7 36/11 200s

3.2 其他常用站点

序号 站点 状态 站内链接 其他链接 搜索/阅读 耗时
8 CBM/SinoMed 9 1 17/12 200s
9 Web of Science ⚠️ 0 6 41/4 211s
10 Embase ⚠️ 0 14 24/24 247s
11 Cochrane Library 4 7 38/12 235s
12 Google Scholar 10 0 22/26 247s
13 Ovid ⚠️ 0 0 18/0 95s
14 Scopus ⚠️ 0 15 36/30 305s
15 中国中医药数据库 ⚠️ 0 22 30/19 317s
16 GeenMedical 5 0 38/3 131s
17 NSTL ⚠️ 0 0 27/0 96s
18 NCBI (全站) 18 0 24/19 246s

4. ClinicalTrials.gov 专项测试

ClinicalTrials.gov 在全站测试中超时,进行了 4 种策略对比测试:

脚本backend/scripts/test-unifuncs-clinicaltrials.ts

策略 查询语言 domain_scope max_depth 耗时 CT 链接 NCT 编号
A 英文+限定CT English clinicaltrials.gov 10 120s 38 37
B 英文+不限域 English 不限 10 145s 13 12
C 中文+限定CT+高深度 中文 clinicaltrials.gov 15 179s 22 21
D 简短英文+限定CT English clinicaltrials.gov 5 179s 21 20

结论ClinicalTrials.gov 完全可用!策略 A英文查询 + 限定域名 + max_depth=10效果最佳120 秒获取 38 个链接。上次超时原因是中文查询 + 低深度组合。

5. 关键发现

可用性总结

  • 一级可用9 个)PubMed, ClinicalTrials.gov, NCBI/PMC, Google Scholar, CBM/SinoMed, CNKI, GeenMedical, Cochrane Library, 维普
  • 二级可达8 个):中华医学期刊网, 万方, 中国临床试验注册中心, 中国中医药数据库, Scopus, Embase, Web of Science, NSTL
  • 需特殊策略1 个)ClinicalTrials.gov → 必须英文查询 + max_depth≥10

关于付费库

Unifuncs API 不支持传入用户名密码登录搜索。付费库Web of Science, Embase, Scopus, Ovid只能访问公开摘要页面。

6. V2.0 前端数据源配置建议

根据测试结果,前端数据源选择分三档:

  • 推荐PubMed, ClinicalTrials.gov, NCBI/PMC, Google Scholar, Cochrane Library, CNKI, CBM/SinoMed, GeenMedical, 维普
  • 可选:中华医学期刊网, 万方数据, 中国临床试验注册中心, 中国中医药数据库
  • 暂不支持Web of Science, Embase, Scopus, Ovid, NSTL

7. 产出物

产出 路径
全站覆盖测试脚本 backend/scripts/test-unifuncs-site-coverage.ts
ClinicalTrials 专项测试脚本 backend/scripts/test-unifuncs-clinicaltrials.ts
DeepSearch API 使用指南 docs/02-通用能力层/04-DeepResearch引擎/01-Unifuncs DeepSearch API 使用指南.md
V2.0 开发计划 docs/03-业务模块/ASL-AI智能文献/04-开发计划/07-Deep Research V2.0 开发计划.md