feat(asl): Add Deep Research V2.0 development plan and Unifuncs API site coverage testing

Completed:
- Unifuncs DeepSearch API site coverage test (18 medical sites, 9 tier-1 available)
- ClinicalTrials.gov dedicated test (4 strategies, English query + depth>=10 works best)
- Deep Research V2.0 development plan (5-day phased delivery)
- DeepResearch engine capability guide (docs/02-common-capability/)
- Test scripts: test-unifuncs-site-coverage.ts, test-unifuncs-clinicaltrials.ts

Key findings:
- Tier-1 sites: PubMed(28), ClinicalTrials(38), NCBI(18), Scholar(10), Cochrane(4), CNKI(7), SinoMed(9), GeenMedical(5), VIP(1)
- Paid databases (WoS/Embase/Scopus/Ovid) cannot be accessed (no credential support)
- ClinicalTrials.gov requires English queries with max_depth>=10

Updated: ASL module status doc, system status doc, common capability list
Co-authored-by: Cursor <cursoragent@cursor.com>
This commit is contained in:
2026-02-22 22:44:41 +08:00
parent 3446909ff7
commit b06daecacd
12 changed files with 2662 additions and 27 deletions

View File

@@ -1,10 +1,13 @@
# AI智能文献模块 - 当前状态与开发指南
> **文档版本:** v1.5
> **文档版本:** v1.6
> **创建日期:** 2025-11-21
> **维护者:** AI智能文献开发团队
> **最后更新:** 2026-01-18 🆕 **智能文献检索DeepSearchMVP完成**
> **重大进展:** unifuncs DeepSearch API 集成 - AI驱动的 PubMed 自动检索
> **最后更新:** 2026-02-22 🆕 **Deep Research V2.0 开发计划确认 + Unifuncs API 网站覆盖测试完成**
> **重大进展:**
> - 🆕 2026-02-22V2.0 开发计划确认!四步瀑布流 + 异步模式 + HITL 需求确认 + 务实结果展示
> - 🆕 2026-02-22Unifuncs API 网站覆盖测试完成18 站点实测9 个一级可用ClinicalTrials.gov 专项验证通过
> - 2026-01-18智能文献检索DeepSearchMVP完成 - unifuncs API 集成
> **文档目的:** 反映模块真实状态,帮助新开发人员快速上手
---
@@ -27,17 +30,50 @@
AI智能文献模块是一个基于大语言模型LLM的文献筛选系统用于帮助研究人员根据PICOS标准自动筛选文献。
### 当前状态
- **开发阶段**:🚧 标题摘要初筛MVP已完成全文复筛后端已完成智能文献检索MVP已完成
- **开发阶段**:🚧 V1.x 完成V2.0 Deep Research 开发计划已确认,即将启动
- **已完成功能**
- ✅ 标题摘要初筛Title & Abstract Screening- 完整流程
- ✅ 全文复筛后端Day 2-5- LLM服务 + API + Excel导出
-**智能文献检索DeepSearchMVP** - unifuncs API 集成SSE 实时流式
- **开发中功能**
- 🚧 全文复筛前端UIDay 6-8预计2.5天)
- **模型支持**DeepSeek-V3 + Qwen-Max 双模型筛选 + unifuncs DeepSearch
-**智能文献检索DeepSearchV1.x MVP** - unifuncs API 集成SSE 实时流式
- **Unifuncs API 网站覆盖测试** - 18 站点实测9 个一级可用
- **Deep Research V2.0 开发计划** - 完整技术方案、API 契约、5 天分阶段计划
- **V2.0 开发中**
- 🚧 Deep Research V2.0 — 四步瀑布流Landing→配置→HITL→终端→结果
- 🚧 异步模式改造SSE → Unifuncs create_task/query_task
- 🚧 需求扩写 + HITL 确认 + Agent 终端 + 简洁结果展示 + Word 导出
- **模型支持**DeepSeek-V3需求扩写 + unifuncs s2深度搜索 + Qwen-Max筛选
- **部署状态**:✅ 本地开发环境运行正常
### 🆕 智能文献检索 DeepSearch2026-01-18 MVP完成
### 🆕 Deep Research V2.02026-02-22 开发计划确认
**V2.0 核心升级:**
- 四步瀑布流Landing → 配置 → HITL 策略确认 → Agent 终端 → 结果展示
- LLM 需求扩写DeepSeek-V3粗略输入 → 结构化自然语言检索指令书
- Human-in-the-Loop用户可编辑修改 AI 生成的检索需求
- **异步模式**SSE → Unifuncs create_task/query_task + pg-boss 队列(离开页面不中断)
- Agent 终端:暗色主题 + 分类结构化日志(每 3-5s 弹出一条)
- 简洁结果展示AI 综合报告Markdown+ 文献清单表格 + Word 导出
- **多站点搜索**9 个一级可用站点,用户可在前端选择数据源
**V2.0 确认可用数据源2026-02-22 实测):**
| 站点 | 站内链接数 | 说明 |
|------|-----------|------|
| PubMed | 28 | 核心数据源,效果最佳 |
| ClinicalTrials.gov | 38 | 必须英文查询max_depth≥10 |
| NCBI/PMC | 18 | 含 PMC 全文链接 |
| Google Scholar | 10 | 跨库聚合 |
| CBM/SinoMed | 9 | 中文生物医学 |
| CNKI | 7 | 中文核心期刊 |
| GeenMedical | 5 | 医学搜索引擎 |
| Cochrane Library | 4 | 系统综述金标准 |
| 维普 | 1 | 中文库 |
**开发计划**5 天分阶段交付,详见 `04-开发计划/07-Deep Research V2.0 开发计划.md`
**通用能力指南**`docs/02-通用能力层/04-DeepResearch引擎/01-Unifuncs DeepSearch API 使用指南.md`
### 智能文献检索 DeepSearch V1.x2026-01-18 MVP完成
**功能概述:**
- AI 驱动的自动化 PubMed 文献检索
@@ -50,19 +86,15 @@ AI智能文献模块是一个基于大语言模型LLM的文献筛选系统
- Server-Sent Events (SSE) 实时流式通信
- 数据库存储:`asl_schema.asl_research_tasks`
**API 端点:**
**API 端点V1.x保留兼容**
- `POST /api/v1/asl/research/stream` - SSE 流式检索
- `POST /api/v1/asl/research/tasks` - 异步任务创建(备用)
- `POST /api/v1/asl/research/tasks` - 异步任务创建
- `GET /api/v1/asl/research/tasks/:taskId/status` - 任务状态查询
**前端入口**
- 路由:`/literature/research/search`
- 菜单AI智能文献 → 2. 智能文献检索
**已知限制:**
- ⚠️ SSE 模式,离开页面任务中断
- ⚠️ 每次检索成本约 0.3 元unifuncs API
- ⏳ 搜索历史、高级筛选等功能待开发
**已知限制V2.0 将解决)**
- ⚠️ SSE 模式,离开页面任务中断 → V2.0 用异步模式解决
- ⚠️ 仅搜索 PubMedV2.0 支持 9 个数据源
- ⏳ 无需求扩写、无 HITL → V2.0 新增
### 🏆 Postgres-Only 架构改造2025-12-13完成