feat(iit): Complete CRA Agent V3.0 P1 - ChatOrchestrator with LLM Function Calling

P1 Architecture: Lightweight ReAct (Function Calling loop, max 3 rounds) Core changes: - Add ToolDefinition/ToolCall types to LLM adapters (DeepSeek + CloseAI + Claude) - Replace 6 old tools with 4 semantic tools: read_report, look_up_data, check_quality, search_knowledge - Create ChatOrchestrator (~160 lines) replacing ChatService (1,442 lines) - Wire WechatCallbackController to ChatOrchestrator, deprecate ChatService - Fix nullable content (string | null) across 12+ LLM consumer files E2E test results: 8/8 scenarios passed (100%) - QC report query, critical issues, patient data, trend, on-demand QC - Knowledge base search, project overview, data modification refusal Net code reduction: ~1,100 lines Tested: E2E P1 chat test 8/8 passed with DeepSeek API Made-with: Cursor
2026-02-26 14:27:09 +08:00
parent 203846968c
commit 7c3cc12b2e
32 changed files with 903 additions and 337 deletions
--- a/docs/00-系统总体设计/00-系统当前状态与开发指南.md
+++ b/docs/00-系统总体设计/00-系统当前状态与开发指南.md
@@ -3,8 +3,9 @@
 > **文档版本：** v6.2  
 > **创建日期：** 2025-11-28  
 > **维护者：** 开发团队  
-> **最后更新：** 2026-02-24  
+> **最后更新：** 2026-02-26  
 > **🎉 重大里程碑：**  
+> - **🆕 2026-02-26：CRA Agent V3.0 P0+P1 全部完成！** 自驱动质控流水线 + ChatOrchestrator + LLM Function Calling + E2E 54/54 通过  
 > - **🆕 2026-02-24：ASL 工具 3 V2.0 架构升级至散装派发 + Aggregator！** 9 条研发红线 + 散装派发与轮询收口任务模式指南 v1.1 沉淀
 > - **2026-02-23：ASL 工具 3 V2.0 开发计划完成！** HITL + 动态模板 + M1/M2/M3 三阶段 22 天
 > - **🆕 2026-02-23：ASL Deep Research V2.0 核心功能完成！** SSE 实时流 + 段落化思考 + 瀑布流 UI + Markdown 渲染 + 引用链接可见 + Word 导出 + 中文数据源  
@@ -78,7 +79,7 @@
 | **PKB** | 个人知识库 | RAG问答、私人文献库 | ⭐⭐⭐ | 🎉 **Dify已替换！自研RAG上线（95%）** | P1 |
 | **ASL** | AI智能文献 | 文献筛选、Deep Research、全文智能提取 | ⭐⭐⭐⭐⭐ | 🎉 **V2.0 核心完成（80%）+ 🆕工具3计划v2.0就绪** - SSE流式+瀑布流UI+HITL+Word导出+散装派发+Aggregator+动态模板 | **P0** |
 | **DC** | 数据清洗整理 | ETL + 医学NER（百万行级数据） | ⭐⭐⭐⭐⭐ | ✅ **Tool B完成 + Tool C 99%（异步架构+性能优化-99%+多指标转换+7大功能）** | **P0** |
-| **IIT** | IIT Manager Agent | AI驱动IIT研究助手 - 双脑架构+REDCap集成 | ⭐⭐⭐⭐⭐ | 🎉 **事件级质控V3.1完成（设计100%，代码60%）** | **P0** |
+| **IIT** | IIT Manager Agent | CRA Agent - LLM Tool Use + 自驱动质控 + 统一驾驶舱 | ⭐⭐⭐⭐⭐ | 🎉 **V3.0 P0+P1完成！** ChatOrchestrator + 4工具 + E2E 54/54 | **P1-2** |
 | **SSA** | 智能统计分析 | **QPER架构** + 四层七工具 + 对话层LLM + 意图路由器 | ⭐⭐⭐⭐⭐ | 🎉 **Phase I-IV 开发完成** — QPER闭环 + Session黑板 + 意图路由 + 对话LLM + 方法咨询 + 对话驱动分析，E2E 107/107 | **P1** |
 | **ST** | 统计分析工具 | 100+轻量化统计工具 | ⭐⭐⭐⭐ | 📋 规划中 | P2 |
 | **RVW** | 稿件审查系统 | 方法学评估 + 🆕数据侦探（L1/L2/L2.5验证）+ Skills架构 + Word导出 | ⭐⭐⭐⭐ | 🚀 **V2.0 Week3完成（85%）** - 统计验证扩展+负号归一化+文件格式提示+用户体验优化 | P1 |
@@ -930,16 +931,23 @@ data: [DONE]\n\n

 ---

-### 🚀 IIT Manager Agent（代号：IIT，2025-12-31启动）
+### 🚀 IIT Manager Agent / CRA Agent（代号：IIT，2025-12-31启动）

-**定位**：AI驱动的IIT（研究者发起的临床研究）智能助手
+**定位**：替代 CRA 岗位的自主 AI Agent（目标替代 70-80% CRA 工作量）

 **核心价值**：
- 🎯 **主动工作的AI Agent** - 不是被动工具，而是24/7主动监控的智能助手
+- 🎯 **替代 CRA 的自主 Agent** - 每日自动质控、生成报告、派发 eQuery、推送告警
+- 🎯 **LLM 原生 Tool Use** - ChatOrchestrator + 4 语义化工具（read_report / look_up_data / check_quality / search_knowledge）
 - 🎯 **REDCap深度集成** - 与医院现有EDC系统无缝对接
- 🎯 **影子状态机制** - AI建议+人类确权，符合医疗合规要求（FDA 21 CFR Part 11）
+- 🎯 **统一驾驶舱** - 去角色化设计，健康分 + 风险热力图 + AI Timeline
 - 🎯 **企业微信实时通知** - 质控预警秒级推送，移动端查看

+**V3.0 当前状态**：✅ **P0+P1 完成，E2E 54/54 通过**
+- ✅ P0：自驱动质控流水线（变量清单 + 规则配置 + 定时质控 + eQuery 闭环 + 驾驶舱）
+- ✅ P1：对话层 Tool Use 改造（ChatOrchestrator + Function Calling + 4 工具）
+- 📋 P1-2：对话体验优化（待开发）
+- 📋 P2：可选功能（不排期）
+
 **MVP目标**（2周冲刺）：
 - ✅ 打通 REDCap → AI质控 → 企微通知 完整闭环
 - ✅ 实现智能数据质控（基于Protocol的入排标准检查）
--- a/Agent/00-模块当前状态与开发指南.md
+++ b/Agent/00-模块当前状态与开发指南.md
@@ -3,8 +3,9 @@
 > **文档版本：** v3.0  
 > **创建日期：** 2026-01-01  
 > **维护者：** IIT Manager开发团队  
-> **最后更新：** 2026-02-25 **CRA Agent V3.0 开发计划定稿**  
+> **最后更新：** 2026-02-26 **CRA Agent V3.0 P0 + P1 开发完成**  
 > **重大里程碑：**  
+> - **2026-02-26：CRA Agent V3.0 P0+P1 全部完成！** 自驱动质控流水线 + ChatOrchestrator + LLM Function Calling + E2E 54/54 通过  
 > - **2026-02-25：CRA Agent V3.0 开发计划定稿**（替代 CRA 定位 + 报告驱动架构 + 4 语义化工具 + 统一驾驶舱）  
 > - ✅ 2026-02-08：事件级质控架构 V3.1 完成（record+event 独立质控 + 规则动态过滤 + 报告去重）  
 > - ✅ 2026-02-08：质控驾驶舱 UI 开发完成（驾驶舱页面 + 热力图 + 详情抽屉）  
@@ -51,24 +52,47 @@ CRA Agent 是一个**替代 CRA 岗位的自主 AI Agent**，而非辅助 CRA
  - AI能力：DeepSeek/Qwen + 自研 RAG（pgvector）+ LLM Tool Use

 ### 当前状态
- **开发阶段**：**V3.0 开发计划已定稿，准备进入 P0 开发**
- **已完成的基础设施**（可复用）：
-  - HardRuleEngine (478行) + SoftRuleEngine (488行) + SkillRunner (756行)
-  - RedcapAdapter (1363行) + QcReportService (980行) + ToolsService (731行)
-  - 实时质控 Webhook + 质控驾驶舱 UI + 18 张数据库表
-  - 企业微信推送 + REDCap 生产环境
- **待重构**：ChatService (1442行，关键词路由) → ChatOrchestrator + 4 Tool Use
- **代码规模**：后端 ~15,000+ 行 / 61 个文件 / 18 张表（iit_schema）
+- **开发阶段**：**V3.0 P0 + P1 已完成，E2E 测试 54/54 通过**
+- **P0 已完成**（自驱动质控流水线）：
+  - 变量清单导入 + 可视化
+  - 规则配置增强（4 类规则 + AI 辅助建议）
+  - 定时质控 + 报告生成 + eQuery 闭环 + 重大事件归档
+  - 统一质控驾驶舱（健康分 + 趋势图 + 风险热力图）+ AI Stream Timeline
+- **P1 已完成**（对话层 Tool Use 改造）：
+  - LLM Adapter 原生 Function Calling（DeepSeek / GPT-5 / Claude-4.5）
+  - 4 语义化工具：`read_report` / `look_up_data` / `check_quality` / `search_knowledge`
+  - ChatOrchestrator 轻量 ReAct（max 3 轮 Function Calling loop）
+  - ChatService (1,442行) 已废弃，替换为 ChatOrchestrator (~160行)
+- **待开发**：P1-2 对话体验优化 / P2 可选功能
+- **代码规模**：后端 ~14,000+ 行（净减 ~1,100 行）/ 20 张表（iit_schema）

 #### ✅ 已完成功能（基础设施）
- ✅ 数据库Schema创建（iit_schema，9个表 = 原5个 + 新增4个质控表）
- ✅ Prisma Schema编写（扩展至 ~350 行类型定义）
+- ✅ 数据库Schema创建（iit_schema，20个表 = 原5个 + 4质控表 + 2新增(equery/critical_events) + 9其他）
+- ✅ Prisma Schema编写（扩展至 ~400 行类型定义）
 - ✅ 企业微信应用注册和配置
 - ✅ **REDCap 生产环境部署完成**（ECS + RDS + HTTPS）
 - ✅ **REDCap实时集成完成**（DET + REST API）
 - ✅ **企业微信推送服务完成**（WechatService）
 - ✅ **端到端测试通过**（REDCap → Node.js → 企业微信）
- ✅ **AI对话集成完成**（ChatService + SessionMemory）
+- ✅ ~~AI对话集成完成（ChatService + SessionMemory）~~ → 已替换为 ChatOrchestrator
+
+#### ✅ 已完成功能（P0 自驱动质控流水线 - 2026-02-26）
+- ✅ **变量清单导入**（REDCap Data Dictionary → iit_field_metadata）
+- ✅ **规则配置增强**（4 类规则 + AI 辅助建议 + 变量关联）
+- ✅ **定时质控调度**（pg-boss cron + DailyQcOrchestrator）
+- ✅ **eQuery 闭环**（open → responded → ai_reviewing → resolved/reopened）
+- ✅ **重大事件归档**（SAE + 方案偏离自动归档 iit_critical_events）
+- ✅ **统一驾驶舱**（健康分 + 趋势图 + 风险热力图 + 核心指标卡片）
+- ✅ **AI Stream Timeline**（Agent 工作时间线可视化）
+- ✅ **P0 E2E 测试 46/46 通过**
+
+#### ✅ 已完成功能（P1 对话层 Tool Use 改造 - 2026-02-26）
+- ✅ **LLM Adapter Function Calling**（types.ts + DeepSeekAdapter + CloseAIAdapter）
+- ✅ **4 语义化工具**（read_report / look_up_data / check_quality / search_knowledge）
+- ✅ **ChatOrchestrator**（轻量 ReAct，max 3 轮 Function Calling loop，~160 行）
+- ✅ **ChatService 废弃**（1,442 行 → ChatService.deprecated.ts）
+- ✅ **WechatCallbackController 接线**（入口切换为 ChatOrchestrator）
+- ✅ **P1 E2E 测试 8/8 通过**（8 个真实对话场景 + DeepSeek API）

 #### ✅ 已完成功能（实时质控系统 - 2026-02-07）
 - ✅ **质控数据库表**（iit_qc_logs + iit_record_summary + iit_qc_project_stats + iit_field_metadata）
--- a/Agent/06-开发记录/2026-02-26-P0P1-CRA-Agent-V3.0-完整开发记录.md
+++ b/Agent/06-开发记录/2026-02-26-P0P1-CRA-Agent-V3.0-完整开发记录.md
@@ -0,0 +1,201 @@
+# 2026-02-26 CRA Agent V3.0 P0 + P1 完整开发记录
+
+> **开发日期：** 2026-02-25 ~ 2026-02-26  
+> **开发人员：** AI Assistant  
+> **版本：** V3.0  
+> **状态：** ✅ P0 + P1 全部完成，E2E 测试通过
+
+---
+
+## 📋 开发概述
+
+本次开发完成了 CRA Agent V3.0 开发计划中的 **P0（自驱动质控流水线）** 和 **P1（对话层 Tool Use 改造）** 两个里程碑，实现了从"关键词路由 ChatService"到"LLM 原生 Function Calling ChatOrchestrator"的完整架构升级。
+
+---
+
+## 🎯 P0：自驱动质控流水线
+
+### P0-1：REDCap 变量清单导入 + 可视化
+
+**改动文件：**
+
+| 文件 | 改动内容 |
+|------|---------|
+| `frontend-v2/src/modules/iit/pages/FieldMetadataPage.tsx` | 变量清单页面（搜索、分组、表单筛选） |
+| `frontend-v2/src/modules/iit/api/iitProjectApi.ts` | 前端 API：变量清单接口 |
+| `backend/src/modules/admin/iit-projects/iitFieldMetadataController.ts` | 后端控制器：变量清单 CRUD |
+| `backend/src/modules/admin/iit-projects/iitFieldMetadataRoutes.ts` | 后端路由注册 |
+
+### P0-2：规则配置增强
+
+**改动文件：**
+
+| 文件 | 改动内容 |
+|------|---------|
+| `frontend-v2/src/modules/iit/pages/RulesPage.tsx` | 规则管理页面（4 类规则、变量关联） |
+| `backend/src/modules/admin/iit-projects/iitRulesController.ts` | 规则 CRUD 控制器 |
+| `backend/src/modules/admin/iit-projects/iitRuleSuggestionService.ts` | AI 辅助规则建议（LLM 提取） |
+
+### P0-3：定时质控 + 报告生成 + eQuery 闭环
+
+**新增数据库表：**
+- `iit_schema.equery` — eQuery 电子疑问单（状态机：open → responded → ai_reviewing → resolved / reopened）
+- `iit_schema.critical_events` — 重大事件归档（SAE、方案偏离）
+- `iit_schema.projects` 新增 `cron_enabled` / `cron_expression` 列
+
+**改动文件：**
+
+| 文件 | 改动内容 |
+|------|---------|
+| `backend/src/modules/iit-manager/services/DailyQcOrchestrator.ts` | **新增** 定时质控编排器（质控 → 报告 → eQuery 派发 → 重大事件归档 → 企微推送） |
+| `backend/src/modules/admin/iit-projects/iitEqueryService.ts` | **新增** eQuery 服务（CRUD + 状态机 + AI 复核） |
+| `backend/src/modules/admin/iit-projects/iitEqueryController.ts` | **新增** eQuery 控制器 |
+| `backend/src/modules/admin/iit-projects/iitEqueryRoutes.ts` | **新增** eQuery 路由 |
+| `backend/src/modules/iit-manager/index.ts` | 注册 `iit_daily_qc` cron + `iit_equery_review` worker |
+| `backend/prisma/schema.prisma` | 新增 `IitEquery` + `IitCriticalEvent` 模型 |
+| `backend/prisma/migrations/20260226_add_equery_critical_events_cron/migration.sql` | 手动 SQL 迁移脚本 |
+
+### P0-4：统一质控驾驶舱 + AI Stream
+
+**改动文件：**
+
+| 文件 | 改动内容 |
+|------|---------|
+| `frontend-v2/src/modules/iit/pages/DashboardPage.tsx` | 统一驾驶舱（健康分、核心指标、重大事件、趋势图、风险热力图） |
+| `frontend-v2/src/modules/iit/pages/AiStreamPage.tsx` | AI Agent 工作时间线 |
+| `frontend-v2/src/modules/iit/pages/EQueryPage.tsx` | **新增** eQuery 管理页面 |
+| `frontend-v2/src/modules/iit/pages/ReportsPage.tsx` | 新增"重大事件归档"Tab |
+| `backend/src/modules/admin/iit-projects/iitQcCockpitController.ts` | 新增 timeline / critical-events / trend 接口 |
+| `backend/src/modules/admin/iit-projects/iitQcCockpitRoutes.ts` | 新增驾驶舱路由 |
+
+### P0 E2E 测试
+
+- **测试脚本：** `backend/tests/e2e-p0-test.ts`
+- **结果：** 46/46 全部通过
+- **覆盖：** 变量清单 → 规则配置 → 报告 → eQuery → 驾驶舱 → Timeline → 重大事件
+
+---
+
+## 🎯 P1：对话层 Tool Use 改造
+
+### P1-Step 1：LLM Adapter 扩展 Function Calling
+
+**核心改动：** 让 LLM 适配器支持原生 Tool Use / Function Calling。
+
+| 文件 | 改动内容 |
+|------|---------|
+| `backend/src/common/llm/adapters/types.ts` | 新增 `ToolDefinition`、`ToolCall` 类型；`Message.role` 增加 `'tool'`；`LLMOptions` 增加 `tools`/`tool_choice`；`LLMResponse.content` 改为 `string \| null`，新增 `toolCalls` |
+| `backend/src/common/llm/adapters/DeepSeekAdapter.ts` | `chat()` 支持 `tools`/`tool_choice` 参数，解析 `tool_calls` |
+| `backend/src/common/llm/adapters/CloseAIAdapter.ts` | OpenAI 路径支持 function calling；Claude 路径转换为 Anthropic `tool_use` 格式 |
+
+**级联修复（`content: string | null` 引起）：** 12+ 个文件添加 `?? ''` null 安全处理。
+
+### P1-Step 2：ToolsService 重构（6 旧 → 4 新）
+
+**删除的工具（~300 行）：**
+- `read_clinical_data` / `run_quality_check` / `batch_quality_check` / `get_project_info` / `count_records` / `search_protocol`
+
+**新增的工具（~200 行）：**
+
+| 工具名 | 描述 | 数据源 |
+|--------|------|--------|
+| `read_report` | 质控报告查阅（80% 的问题用这个回答） | `QcReportService` |
+| `look_up_data` | 原始临床数据查询 | `RedcapAdapter` |
+| `check_quality` | 即时质控检查（单条/全量） | `HardRuleEngine` / `SkillRunner` |
+| `search_knowledge` | 知识库检索 | `pgvector RAG` |
+
+### P1-Step 3：ChatOrchestrator 创建
+
+**新文件：** `backend/src/modules/iit-manager/services/ChatOrchestrator.ts`（~160 行）
+
+**核心架构：** 轻量 ReAct（带循环的 Function Calling，max 3 轮）
+
+```
+用户提问 → system prompt + history + tools → LLM
+  ├── LLM 返回 tool_calls → 并行执行工具 → 追加结果 → 下一轮 LLM
+  ├── LLM 返回 tool_calls → ... → 下一轮（最多 3 轮）
+  └── LLM 返回 stop / 达到上限 → 返回文本回答
+```
+
+**System Prompt 核心指令：**
+- 优先使用 `read_report`（80%）
+- 所有回答必须基于工具结果，不得伪造数据
+- 中文回复，简洁 ≤200 字
+- 拒绝数据修改请求
+
+### P1-Step 4：入口接线 + ChatService 废弃
+
+| 文件 | 改动内容 |
+|------|---------|
+| `backend/src/modules/iit-manager/controllers/WechatCallbackController.ts` | `ChatService` → `ChatOrchestrator`（懒初始化） |
+| `backend/src/modules/iit-manager/services/index.ts` | 导出改为 `ChatOrchestrator` |
+| `backend/src/modules/iit-manager/services/ChatService.ts` | 重命名为 `ChatService.deprecated.ts` |
+
+### P1 E2E 测试
+
+- **测试脚本：** `backend/tests/e2e-p1-chat-test.ts`
+- **结果：** 8/8 全部通过（100%）
+- **平均响应时间：** 5,676ms
+
+| 场景 | 输入 | 工具调用 | 结果 |
+|------|------|---------|------|
+| 1. 质控报告 | "最新质控报告怎么样" | `read_report(summary)` | ✅ 返回通过率、问题数 |
+| 2. 严重违规 | "有几条严重违规" | 利用上下文记忆直接回答 | ✅ "69条严重问题" |
+| 3. 患者数据 | "003 的数据" | `look_up_data` → 失败 → `read_report` 降级 | ✅ 多轮 ReAct |
+| 4. 趋势查询 | "通过率比上周好了吗" | `read_report(trend)` | ✅ 趋势分析 |
+| 5. 即时质控 | "帮我检查一下 005" | `check_quality(005)` | ✅ 优雅降级 |
+| 6. 知识库 | "入排标准是什么" | `search_knowledge` | ✅ 精确返回纳入/排除标准 |
+| 7. 项目概览 | "项目整体怎么样" | `read_report(summary)` | ✅ 汇总项目状况 |
+| 8. 拒绝修改 | "帮我修改 003 的数据" | 无工具调用 | ✅ 礼貌拒绝 |
+
+---
+
+## 📊 代码变更统计
+
+| 指标 | 数值 |
+|------|------|
+| P0 新增文件 | ~15 个 |
+| P1 新增文件 | 2 个（ChatOrchestrator + E2E test） |
+| P1 删除代码 | ~1,742 行（ChatService 1,442 + 旧工具 300） |
+| P1 新增代码 | ~655 行（types 40 + adapters 30 + 新工具 200 + Orchestrator 160 + tests 155 + wiring 10 + null fixes 60） |
+| P1 净减少 | ~1,100 行 |
+| E2E 测试 | P0: 46/46 + P1: 8/8 = **54/54（100%）** |
+
+---
+
+## 🏗️ 架构变化总结
+
+### 旧架构（V2.x ChatService）
+```
+用户消息 → 10 个正则意图路由 → 9 个硬编码处理方法 → LLM 格式化文本 → 回复
+```
+- 1,442 行代码，102 行正则匹配
+- LLM 只是"文本格式化器"
+- 不支持多工具组合
+
+### 新架构（V3.0 ChatOrchestrator）
+```
+用户消息 → system prompt + 4 tools → LLM 自主选择 → 工具执行 → LLM 总结（max 3 轮）
+```
+- ~160 行代码
+- LLM 是"决策者"（自主选择工具、组合调用）
+- 支持多轮推理和自动降级
+
+---
+
+## 🔑 关键设计决策
+
+1. **轻量 ReAct vs 完整 QPER**：选择轻量 ReAct（max 3 轮 FC loop），因为 CRA 场景工具空间有限（4 个）、数据预计算、延迟要求低
+2. **报告优先策略**：`read_report` 覆盖 80% 问题，避免冗余 REDCap 查询
+3. **`content: string | null`**：适配 LLM Function Calling 标准（tool_calls 时 content 可为 null）
+4. **ChatService 保留不删**：重命名为 `.deprecated.ts`，作为参考保留
+5. **数据库手动迁移**：为避免 Prisma `db push` 的数据丢失风险，采用手动 SQL + 迁移文件方式
+
+---
+
+## ⚠️ 已知限制
+
+1. REDCap 本地实例未启动时，`look_up_data` 和 `check_quality` 会优雅降级
+2. 会话记忆为内存存储（SessionMemory），重启后丢失
+3. 单项目模式（活跃项目自动解析），暂不支持多项目切换
+4. 平均响应 ~5.7s（含 2 次 DeepSeek API 调用），可通过缓存优化