feat(asl): Add Deep Research V2.0 development plan and Unifuncs API site coverage testing

Completed:
- Unifuncs DeepSearch API site coverage test (18 medical sites, 9 tier-1 available)
- ClinicalTrials.gov dedicated test (4 strategies, English query + depth>=10 works best)
- Deep Research V2.0 development plan (5-day phased delivery)
- DeepResearch engine capability guide (docs/02-common-capability/)
- Test scripts: test-unifuncs-site-coverage.ts, test-unifuncs-clinicaltrials.ts

Key findings:
- Tier-1 sites: PubMed(28), ClinicalTrials(38), NCBI(18), Scholar(10), Cochrane(4), CNKI(7), SinoMed(9), GeenMedical(5), VIP(1)
- Paid databases (WoS/Embase/Scopus/Ovid) cannot be accessed (no credential support)
- ClinicalTrials.gov requires English queries with max_depth>=10

Updated: ASL module status doc, system status doc, common capability list
Co-authored-by: Cursor <cursoragent@cursor.com>
This commit is contained in:
2026-02-22 22:44:41 +08:00
parent 3446909ff7
commit b06daecacd
12 changed files with 2662 additions and 27 deletions

View File

@@ -0,0 +1,93 @@
# Unifuncs DeepSearch API 网站覆盖能力测试记录
> **日期:** 2026-02-22
> **目的:** 在 Deep Research V2.0 开发前,验证 Unifuncs API 对中国医生常用医学期刊网站的搜索能力
> **结论:** 18 个站点测试完毕9 个一级可用8 个二级可达1 个超时(已通过专项测试解决)
---
## 1. 测试背景
V2.0 升级需要明确 Unifuncs DeepSearch API 能覆盖哪些医学期刊网站,以便在前端展示可选数据源。本次测试覆盖了 7 个最关注站点 + 11 个其他常用站点,共 18 个。
## 2. 测试配置
- **脚本**`backend/scripts/test-unifuncs-site-coverage.ts`
- **模式**异步模式create_task + query_task 轮询)
- **查询**`他汀类药物预防心血管疾病的随机对照试验和Meta分析近5年高质量研究`
- **max_depth**5测试用低深度加快速度
- **超时**600 秒
- **并行**18 个任务同时创建、各自轮询
## 3. 全站测试结果
### 3.1 Top 7 最关注站点
| 序号 | 站点 | 状态 | 站内链接 | 其他链接 | 搜索/阅读 | 耗时 |
|------|------|------|---------|---------|-----------|------|
| 1 | PubMed | ✅ | 28 | 0 | 9/29 | 177s |
| 2 | ClinicalTrials.gov | ⏰ 超时 | 0 | 0 | 0/0 | 611s |
| 3 | 中华医学期刊网 | ⚠️ | 0 | 12 | 41/17 | 376s |
| 4 | 中国知网 CNKI | ✅ | 7 | 0 | 40/6 | 189s |
| 5 | 万方数据 | ⚠️ | 0 | 7 | 42/15 | 258s |
| 6 | 维普 VIP | ✅ | 1 | 0 | 33/3 | 153s |
| 7 | 中国临床试验注册中心 | ⚠️ | 0 | 7 | 36/11 | 200s |
### 3.2 其他常用站点
| 序号 | 站点 | 状态 | 站内链接 | 其他链接 | 搜索/阅读 | 耗时 |
|------|------|------|---------|---------|-----------|------|
| 8 | CBM/SinoMed | ✅ | 9 | 1 | 17/12 | 200s |
| 9 | Web of Science | ⚠️ | 0 | 6 | 41/4 | 211s |
| 10 | Embase | ⚠️ | 0 | 14 | 24/24 | 247s |
| 11 | Cochrane Library | ✅ | 4 | 7 | 38/12 | 235s |
| 12 | Google Scholar | ✅ | 10 | 0 | 22/26 | 247s |
| 13 | Ovid | ⚠️ | 0 | 0 | 18/0 | 95s |
| 14 | Scopus | ⚠️ | 0 | 15 | 36/30 | 305s |
| 15 | 中国中医药数据库 | ⚠️ | 0 | 22 | 30/19 | 317s |
| 16 | GeenMedical | ✅ | 5 | 0 | 38/3 | 131s |
| 17 | NSTL | ⚠️ | 0 | 0 | 27/0 | 96s |
| 18 | NCBI (全站) | ✅ | 18 | 0 | 24/19 | 246s |
## 4. ClinicalTrials.gov 专项测试
ClinicalTrials.gov 在全站测试中超时,进行了 4 种策略对比测试:
**脚本**`backend/scripts/test-unifuncs-clinicaltrials.ts`
| 策略 | 查询语言 | domain_scope | max_depth | 耗时 | CT 链接 | NCT 编号 |
|------|---------|-------------|-----------|------|---------|---------|
| A 英文+限定CT | English | clinicaltrials.gov | 10 | **120s** | **38** | **37** |
| B 英文+不限域 | English | 不限 | 10 | 145s | 13 | 12 |
| C 中文+限定CT+高深度 | 中文 | clinicaltrials.gov | 15 | 179s | 22 | 21 |
| D 简短英文+限定CT | English | clinicaltrials.gov | 5 | 179s | 21 | 20 |
**结论**ClinicalTrials.gov **完全可用**!策略 A英文查询 + 限定域名 + max_depth=10效果最佳120 秒获取 38 个链接。上次超时原因是中文查询 + 低深度组合。
## 5. 关键发现
### 可用性总结
- **一级可用9 个)**PubMed, ClinicalTrials.gov, NCBI/PMC, Google Scholar, CBM/SinoMed, CNKI, GeenMedical, Cochrane Library, 维普
- **二级可达8 个)**:中华医学期刊网, 万方, 中国临床试验注册中心, 中国中医药数据库, Scopus, Embase, Web of Science, NSTL
- **需特殊策略1 个)**ClinicalTrials.gov → 必须英文查询 + max_depth≥10
### 关于付费库
Unifuncs API **不支持传入用户名密码**登录搜索。付费库Web of Science, Embase, Scopus, Ovid只能访问公开摘要页面。
## 6. V2.0 前端数据源配置建议
根据测试结果,前端数据源选择分三档:
- **推荐**PubMed, ClinicalTrials.gov, NCBI/PMC, Google Scholar, Cochrane Library, CNKI, CBM/SinoMed, GeenMedical, 维普
- **可选**:中华医学期刊网, 万方数据, 中国临床试验注册中心, 中国中医药数据库
- **暂不支持**Web of Science, Embase, Scopus, Ovid, NSTL
## 7. 产出物
| 产出 | 路径 |
|------|------|
| 全站覆盖测试脚本 | `backend/scripts/test-unifuncs-site-coverage.ts` |
| ClinicalTrials 专项测试脚本 | `backend/scripts/test-unifuncs-clinicaltrials.ts` |
| DeepSearch API 使用指南 | `docs/02-通用能力层/04-DeepResearch引擎/01-Unifuncs DeepSearch API 使用指南.md` |
| V2.0 开发计划 | `docs/03-业务模块/ASL-AI智能文献/04-开发计划/07-Deep Research V2.0 开发计划.md` |