feat(asl): Complete Deep Research V2.0 core development

Backend:
- Add SSE streaming client (unifuncsSseClient) replacing async polling
- Add paragraph-based reasoning parser with mergeConsecutiveThinking
- Add requirement expansion service (DeepSeek-V3 PICOS+MeSH)
- Add Word export service with Pandoc, inline hyperlinks, reference link expansion
- Add deep research V2 worker with 2s log flush and Chinese source prompt
- Add 5 curated data sources config (PubMed/ClinicalTrials/Cochrane/CNKI/MedJournals)
- Add 4 API endpoints (generate-requirement/tasks/task-status/export-word)
- Update Prisma schema with 6 new V2.0 fields on AslResearchTask
- Add DB migration for V2.0 fields
- Simplify ASL_DEEP_RESEARCH_EXPANSION prompt (remove strategy section)

Frontend:
- Add waterfall-flow DeepResearchPage (phase 0-4 progressive reveal)
- Add LandingView, SetupPanel, StrategyConfirm, AgentTerminal, ResultsView
- Add react-markdown + remark-gfm for report rendering
- Add custom link component showing visible URLs after references
- Add useDeepResearchTask polling hook
- Add deep research TypeScript types

Tests:
- Add E2E test, smoke test, and Chinese data source test scripts

Docs:
- Update ASL module status (v2.0 - core features complete)
- Update system status (v6.1 - ASL V2.0 milestone)
- Update Unifuncs DeepSearch API guide (v2.0 - SSE mode + Chinese source results)
- Update module auth specification (test script guidelines)
- Update V2.0 development plan

Co-authored-by: Cursor <cursoragent@cursor.com>
This commit is contained in:
2026-02-23 13:21:52 +08:00
parent b06daecacd
commit 8f06d4f929
39 changed files with 5605 additions and 417 deletions

View File

@@ -1,11 +1,11 @@
# AIclinicalresearch 系统当前状态与开发指南
> **文档版本:** v6.0
> **文档版本:** v6.1
> **创建日期:** 2025-11-28
> **维护者:** 开发团队
> **最后更新:** 2026-02-22
> **最后更新:** 2026-02-23
> **🎉 重大里程碑:**
> - **🆕 2026-02-22ASL Deep Research V2.0 开发计划确认 + Unifuncs API 网站覆盖测试完成!** 18站点实测9个一级可用ClinicalTrials.gov 专项验证通过
> - **🆕 2026-02-23ASL Deep Research V2.0 核心功能完成!** SSE 实时流 + 段落化思考 + 瀑布流 UI + Markdown 渲染 + 引用链接可见 + Word 导出 + 中文数据源
> - **🆕 2026-02-22SSA Phase I-IV 开发完成!** Session 黑板 + 对话层 LLM + 方法咨询 + 对话驱动分析E2E 107/107 通过
> - **2026-02-21SSA QPER 智能化主线闭环完成!** Q→P→E→R 四层架构全部开发完成,端到端 40/40 测试通过
> - **2026-02-20SSA Phase 2A 前端集成完成!** 多步骤工作流端到端 + V11 UI联调 + Block-based 架构共识
@@ -26,11 +26,12 @@
> - **2026-01-24Protocol Agent 框架完成!** 可复用Agent框架+5阶段对话流程
> - **2026-01-22OSS 存储集成完成!** 阿里云 OSS 正式接入平台基础层
>
> **🆕 最新进展ASL V2.0 + SSA Phase I-IV 2026-02-22**
> - ✅ **🎉 ASL Deep Research V2.0 开发计划确认** — 四步瀑布流 + 异步模式 + HITL + 多站点搜索 + Word 导出
> - ✅ **Unifuncs API 网站覆盖测试完成** — 18 站点实测9 个一级可用PubMed/ClinicalTrials/NCBI/Scholar/Cochrane/CNKI/SinoMed/GeenMedical/维普)
> - ✅ **ClinicalTrials.gov 专项验证通过** — 英文查询 + max_depth≥10120s 获取 38 个 NCT 编号链接
> - ✅ **DeepSearch 通用能力指南发布** — `docs/02-通用能力层/04-DeepResearch引擎/`
> **🆕 最新进展ASL V2.0 核心完成 2026-02-23**
> - ✅ **🎉 ASL Deep Research V2.0 核心功能完成** — SSE 流式架构 + 瀑布流 UI + HITL + 5 精选数据源 + Word 导出
> - ✅ **SSE 流式替代轮询** — 实时推送 AI 思考过程reasoning_content段落化日志聚合
> - ✅ **Markdown 渲染 + 引用链接可见化** — react-markdown 正确渲染报告,`[6]` 后显示完整 URL
> - ✅ **中文数据源专项测试** — CNKI/中华医学期刊网 domain_scope 有效,混合源建议分批搜索
> - ✅ **DeepSearch 通用能力指南 v2.0** — `docs/02-通用能力层/04-DeepResearch引擎/`
> - ✅ **🎉 SSA Phase I-IV 全部开发完成** — Session 黑板 + 意图路由器 + 对话层 LLM + 方法咨询 + AskUser 标准化 + 对话驱动分析 + QPER 集成
> - ✅ **SSA E2E 测试全部通过** — Phase I 31/31 + Phase II 38/38 + Phase III 13/13 + Phase IV 25/25 = 共 107 项
>
@@ -70,7 +71,7 @@
|---------|---------|---------|---------|---------|--------|
| **AIA** | AI智能问答 | 12个智能体 + Protocol Agent全流程方案 | ⭐⭐⭐⭐⭐ | 🎉 **V3.1 MVP完整交付90%** - 一键生成+Word导出 | **P0** |
| **PKB** | 个人知识库 | RAG问答、私人文献库 | ⭐⭐⭐ | 🎉 **Dify已替换自研RAG上线95%** | P1 |
| **ASL** | AI智能文献 | 文献筛选、Deep Research、证据图谱 | ⭐⭐⭐⭐⭐ | 🚀 **V2.0 计划确认65%** - Unifuncs 18站实测 + 5天开发计划 | **P0** |
| **ASL** | AI智能文献 | 文献筛选、Deep Research、证据图谱 | ⭐⭐⭐⭐⭐ | 🎉 **V2.0 核心完成80%** - SSE流式+瀑布流UI+HITL+Word导出+中文数据源 | **P0** |
| **DC** | 数据清洗整理 | ETL + 医学NER百万行级数据 | ⭐⭐⭐⭐⭐ | ✅ **Tool B完成 + Tool C 99%(异步架构+性能优化-99%+多指标转换+7大功能** | **P0** |
| **IIT** | IIT Manager Agent | AI驱动IIT研究助手 - 双脑架构+REDCap集成 | ⭐⭐⭐⭐⭐ | 🎉 **事件级质控V3.1完成设计100%代码60%** | **P0** |
| **SSA** | 智能统计分析 | **QPER架构** + 四层七工具 + 对话层LLM + 意图路由器 | ⭐⭐⭐⭐⭐ | 🎉 **Phase I-IV 开发完成** — QPER闭环 + Session黑板 + 意图路由 + 对话LLM + 方法咨询 + 对话驱动分析E2E 107/107 | **P1** |
@@ -158,9 +159,39 @@
---
## 🚀 当前开发状态2026-02-22
## 🚀 当前开发状态2026-02-23
### 🎉 最新进展:SSA Phase I-IV 开发完成2026-02-22
### 🎉 最新进展:ASL Deep Research V2.0 核心功能完成2026-02-23
#### ✅ ASL Deep Research V2.0 核心开发完成
**重大里程碑:从 V1.x 单一 PubMed SSE 搜索升级为多数据源、实时流式、段落化思考的完整深度检索系统!**
| 功能 | 技术实现 | 状态 |
|------|---------|------|
| SSE 流式架构 | unifuncsSseClient → OpenAI Compatible SSE替代 create_task/query_task 轮询 | ✅ |
| 段落化思考日志 | reasoningParser 按段落聚合 + mergeConsecutiveThinking200+ 字符批量解析 | ✅ |
| 引用链接可见化 | react-markdown 自定义 `<a>` 组件 + Word 端 expandReferenceLinks() | ✅ |
| 瀑布流 UI | phase 0-4 渐进展开,已完成步骤折叠为摘要卡片 | ✅ |
| LLM 需求扩写 | DeepSeek-V3 PICOS+MeSH 结构化扩写Prompt 管理系统可配置 | ✅ |
| HITL 策略确认 | 用户可编辑/保存/确认检索指令,单列布局 + PICOS 摘要卡片 | ✅ |
| Markdown 报告渲染 | react-markdown + remark-gfm正确渲染标题/链接/列表/加粗 | ✅ |
| Word 导出 | Pandoc 微服务,文献标题内嵌超链接,引用展开为可见 URL | ✅ |
| 中文数据源 | CNKI/中华医学期刊网动态 prompt + 专项测试脚本验证 | ✅ |
| 5 精选数据源 | PubMed/ClinicalTrials.gov/Cochrane/CNKI/中华医学期刊网 | ✅ |
| 数据库扩展 | 6 个新字段targetSources/confirmedRequirement/aiIntentSummary/executionLogs/synthesisReport/resultList | ✅ |
**关键技术决策**
-**SSE 替代轮询**:解决"等很久才一股脑显示"问题reasoning_content 实时推送
-**段落化日志**:从逐行碎片到连贯段落,思考过程可读性大幅提升
-**引用链接可见**`[6]` 后追加完整 URL方便复制分享Web+Word 双端)
**相关文档**
- 模块状态:`docs/03-业务模块/ASL-AI智能文献/00-模块当前状态与开发指南.md`
- 开发计划:`docs/03-业务模块/ASL-AI智能文献/04-开发计划/07-Deep Research V2.0 开发计划.md`
- API 指南:`docs/02-通用能力层/04-DeepResearch引擎/01-Unifuncs DeepSearch API 使用指南.md`
### 🎉 SSA Phase I-IV 开发完成2026-02-22
#### ✅ SSA 智能对话与工具体系 Phase I-IV 全部完成2026-02-22
@@ -1462,7 +1493,7 @@ npm run dev # http://localhost:3000
### 模块完成度
-**已完成**AIA V2.085%核心功能完成、平台基础层100%、RVW95%、通用能力层升级100%)、**PKB95%Dify已替换** 🎉
- 🚧 **开发中****ASL65%V2.0 计划确认 + 18站Unifuncs测试完成**、DCTool C 98%Tool B后端100%Tool B前端0%、IIT60%Phase 1.5完成)、**SSAQPER主线100% + Phase I-IV 全部完成E2E 107/107Phase VI 待启动)** 🎉
- 🚧 **开发中****ASL80%,🎉 V2.0 核心功能完成SSE流式+瀑布流UI+HITL+Word导出+中文数据源**、DCTool C 98%Tool B后端100%Tool B前端0%、IIT60%Phase 1.5完成)、**SSAQPER主线100% + Phase I-IV 全部完成E2E 107/107Phase VI 待启动)** 🎉
- 📋 **未开始**ST
### 部署完成度
@@ -1612,9 +1643,9 @@ if (items.length >= 50) {
---
**文档版本**v5.9
**最后更新**2026-02-22
**本次更新**SSA Phase I-IV 全部开发完成E2E 107/107 通过,开发计划 v1.8
**文档版本**v6.1
**最后更新**2026-02-23
**本次更新**ASL Deep Research V2.0 核心功能完成SSE流式+段落化思考+引用链接可见化+瀑布流UI+Word导出+中文数据源)
---