Files
AIclinicalresearch/docs/03-业务模块/ASL-AI智能文献/05-开发记录/2026-02-22_Unifuncs API网站覆盖能力测试.md
HaHafeng b06daecacd feat(asl): Add Deep Research V2.0 development plan and Unifuncs API site coverage testing
Completed:
- Unifuncs DeepSearch API site coverage test (18 medical sites, 9 tier-1 available)
- ClinicalTrials.gov dedicated test (4 strategies, English query + depth>=10 works best)
- Deep Research V2.0 development plan (5-day phased delivery)
- DeepResearch engine capability guide (docs/02-common-capability/)
- Test scripts: test-unifuncs-site-coverage.ts, test-unifuncs-clinicaltrials.ts

Key findings:
- Tier-1 sites: PubMed(28), ClinicalTrials(38), NCBI(18), Scholar(10), Cochrane(4), CNKI(7), SinoMed(9), GeenMedical(5), VIP(1)
- Paid databases (WoS/Embase/Scopus/Ovid) cannot be accessed (no credential support)
- ClinicalTrials.gov requires English queries with max_depth>=10

Updated: ASL module status doc, system status doc, common capability list
Co-authored-by: Cursor <cursoragent@cursor.com>
2026-02-22 22:44:41 +08:00

94 lines
4.5 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# Unifuncs DeepSearch API 网站覆盖能力测试记录
> **日期:** 2026-02-22
> **目的:** 在 Deep Research V2.0 开发前,验证 Unifuncs API 对中国医生常用医学期刊网站的搜索能力
> **结论:** 18 个站点测试完毕9 个一级可用8 个二级可达1 个超时(已通过专项测试解决)
---
## 1. 测试背景
V2.0 升级需要明确 Unifuncs DeepSearch API 能覆盖哪些医学期刊网站,以便在前端展示可选数据源。本次测试覆盖了 7 个最关注站点 + 11 个其他常用站点,共 18 个。
## 2. 测试配置
- **脚本**`backend/scripts/test-unifuncs-site-coverage.ts`
- **模式**异步模式create_task + query_task 轮询)
- **查询**`他汀类药物预防心血管疾病的随机对照试验和Meta分析近5年高质量研究`
- **max_depth**5测试用低深度加快速度
- **超时**600 秒
- **并行**18 个任务同时创建、各自轮询
## 3. 全站测试结果
### 3.1 Top 7 最关注站点
| 序号 | 站点 | 状态 | 站内链接 | 其他链接 | 搜索/阅读 | 耗时 |
|------|------|------|---------|---------|-----------|------|
| 1 | PubMed | ✅ | 28 | 0 | 9/29 | 177s |
| 2 | ClinicalTrials.gov | ⏰ 超时 | 0 | 0 | 0/0 | 611s |
| 3 | 中华医学期刊网 | ⚠️ | 0 | 12 | 41/17 | 376s |
| 4 | 中国知网 CNKI | ✅ | 7 | 0 | 40/6 | 189s |
| 5 | 万方数据 | ⚠️ | 0 | 7 | 42/15 | 258s |
| 6 | 维普 VIP | ✅ | 1 | 0 | 33/3 | 153s |
| 7 | 中国临床试验注册中心 | ⚠️ | 0 | 7 | 36/11 | 200s |
### 3.2 其他常用站点
| 序号 | 站点 | 状态 | 站内链接 | 其他链接 | 搜索/阅读 | 耗时 |
|------|------|------|---------|---------|-----------|------|
| 8 | CBM/SinoMed | ✅ | 9 | 1 | 17/12 | 200s |
| 9 | Web of Science | ⚠️ | 0 | 6 | 41/4 | 211s |
| 10 | Embase | ⚠️ | 0 | 14 | 24/24 | 247s |
| 11 | Cochrane Library | ✅ | 4 | 7 | 38/12 | 235s |
| 12 | Google Scholar | ✅ | 10 | 0 | 22/26 | 247s |
| 13 | Ovid | ⚠️ | 0 | 0 | 18/0 | 95s |
| 14 | Scopus | ⚠️ | 0 | 15 | 36/30 | 305s |
| 15 | 中国中医药数据库 | ⚠️ | 0 | 22 | 30/19 | 317s |
| 16 | GeenMedical | ✅ | 5 | 0 | 38/3 | 131s |
| 17 | NSTL | ⚠️ | 0 | 0 | 27/0 | 96s |
| 18 | NCBI (全站) | ✅ | 18 | 0 | 24/19 | 246s |
## 4. ClinicalTrials.gov 专项测试
ClinicalTrials.gov 在全站测试中超时,进行了 4 种策略对比测试:
**脚本**`backend/scripts/test-unifuncs-clinicaltrials.ts`
| 策略 | 查询语言 | domain_scope | max_depth | 耗时 | CT 链接 | NCT 编号 |
|------|---------|-------------|-----------|------|---------|---------|
| A 英文+限定CT | English | clinicaltrials.gov | 10 | **120s** | **38** | **37** |
| B 英文+不限域 | English | 不限 | 10 | 145s | 13 | 12 |
| C 中文+限定CT+高深度 | 中文 | clinicaltrials.gov | 15 | 179s | 22 | 21 |
| D 简短英文+限定CT | English | clinicaltrials.gov | 5 | 179s | 21 | 20 |
**结论**ClinicalTrials.gov **完全可用**!策略 A英文查询 + 限定域名 + max_depth=10效果最佳120 秒获取 38 个链接。上次超时原因是中文查询 + 低深度组合。
## 5. 关键发现
### 可用性总结
- **一级可用9 个)**PubMed, ClinicalTrials.gov, NCBI/PMC, Google Scholar, CBM/SinoMed, CNKI, GeenMedical, Cochrane Library, 维普
- **二级可达8 个)**:中华医学期刊网, 万方, 中国临床试验注册中心, 中国中医药数据库, Scopus, Embase, Web of Science, NSTL
- **需特殊策略1 个)**ClinicalTrials.gov → 必须英文查询 + max_depth≥10
### 关于付费库
Unifuncs API **不支持传入用户名密码**登录搜索。付费库Web of Science, Embase, Scopus, Ovid只能访问公开摘要页面。
## 6. V2.0 前端数据源配置建议
根据测试结果,前端数据源选择分三档:
- **推荐**PubMed, ClinicalTrials.gov, NCBI/PMC, Google Scholar, Cochrane Library, CNKI, CBM/SinoMed, GeenMedical, 维普
- **可选**:中华医学期刊网, 万方数据, 中国临床试验注册中心, 中国中医药数据库
- **暂不支持**Web of Science, Embase, Scopus, Ovid, NSTL
## 7. 产出物
| 产出 | 路径 |
|------|------|
| 全站覆盖测试脚本 | `backend/scripts/test-unifuncs-site-coverage.ts` |
| ClinicalTrials 专项测试脚本 | `backend/scripts/test-unifuncs-clinicaltrials.ts` |
| DeepSearch API 使用指南 | `docs/02-通用能力层/04-DeepResearch引擎/01-Unifuncs DeepSearch API 使用指南.md` |
| V2.0 开发计划 | `docs/03-业务模块/ASL-AI智能文献/04-开发计划/07-Deep Research V2.0 开发计划.md` |