docs(iit): Add CRA Agent V3.0 development plan and update module status guide

V3.0 Plan:
- Finalize CRA Agent V3.0 development plan (replace CRA positioning)
- Add unified CRA QC platform PRD
- Add HTML UI prototype (dashboard, AI stream, eQuery, reports)
- Architecture: report-driven + LLM Tool Use + 4 semantic tools

Module Status Update:
- Update architecture from dual-brain V2.9.1 to V3.0 Tool Use
- Update DB schema inventory (5 tables -> 18 tables)
- Update code stats (577 lines -> 15,000+ lines / 61 files)
- Update next steps to V3.0 P0 roadmap
- Archive old phase plans (ReAct engine, IntentService)
- Add V3.0 document references (plan, PRD, prototype)

Co-authored-by: Cursor <cursoragent@cursor.com>
This commit is contained in:
2026-02-25 22:04:00 +08:00
parent f0736dbca1
commit 31b0433195
5 changed files with 1689 additions and 251 deletions

View File

@@ -0,0 +1,129 @@
# 统一数字 CRA 质控平台 产品需求文档 (PRD)
**文档版本**V3.0(统一视角与白盒化平台版)
**关联开发计划**[CRA Agent V3.0 最终开发计划](./V3.0全新开发计划.md)
**目标受众**:研发团队、架构师、项目决策委员会
**核心系统角色**AI 监查大脑主导者、全员协作方PI、DM、CRC
---
## 一、产品哲学与核心定位
### 1.1 产品背景与痛点重构
传统临床研究不仅受困于 CRA 人力成本高昂,更受困于**"信息孤岛与黑盒效应"**——PI 看不到具体过程CRC 被动防御质疑CRA 疲于人工核查。本产品致力于彻底变革临床质控模式:不仅要**用 AI 替代传统 CRA 的重体力审核工作**,更要打破系统的角色壁垒,建立一个**"全员可见、完全透明、单一真相Single Source of Truth"**的统一数字平台。
> **关键定位**CRA Agent 不是给 CRA 用的助手——它就是 CRA。目标是替代 70-80% 的 CRA 岗位工作(详见 [V3.0 开发计划 §1.2](./V3.0全新开发计划.md))。
### 1.2 核心产品目标
1. **去中心化的统一视角**:废除传统系统中森严的"PI 视角"与"CRC 视角"。全员登录同一平台,按数据粒度(概览 → 过程 → 细节 → 资产)自由穿透。
2. **AI 白盒化Trust Building**:将 AI 的工作从"黑盒后台"移至前台。通过"实时工作流水AI Stream"展示 AI 的每一次推理和调用,建立人类对 AI 的绝对信任。
3. **长期临床资产沉淀**不只做实时纠错更要对整个临床试验的生命周期负责。自动生成阶段性质控报告建立重大事件SAE/PD的永久档案库。
4. **全自动 eQuery 闭环**AI 独立发现异常、派发质疑、接收 CRC 修正信号、执行二次复核并自动关闭,实现"无人化"质控闭环。
5. **AI 视觉 SDV远期**AI 审核 CRC 上传的原始凭证(多模态视觉核对)并自动闭环。
---
## 二、统一平台架构与入口定义(核心功能层)
系统取消角色隔离,采用**"逻辑深度递进"**的统一四级架构。
### 2.1 第一级 — 全局概览(项目健康度大盘 Dashboard
- **定位**:团队宏观把控的首选视图。
- **功能模块**
- **健康度评分**:基于通过率、待处理 eQuery、重大事件的综合评分
- **全局核心数据卡片**:整体数据合规率、待处理 eQuery 数、AI 已自动审查表单数、累计重大事件数
- **高亮事件预警**:瀑布流展示近期 SAE 与重大 PD支持直接下钻
- **趋势图**:质控通过率随时间的变化折线图
### 2.2 第二级 — AI 监查过程(工作流水 AI Stream
- **定位**:向全员展示的"AI 劳动透明账本",白盒化的核心实现。
- **功能模块**
- **实时 Timeline**:动态滚动的瀑布流,精确记录 Agent 的完整动作链。示例:"*10:24 监听 EDC 保存事件 → 扫描 P005 实验室表 → 调用 12 条硬逻辑耗时 0.2 秒 → 提取 ALT 异常并关联不良事件表 → 发现记录缺失 → 派发 eQuery-1029*"
- **自动闭环展示**:清晰记录 AI 接收到 CRC 修正信号后,执行二次复核并自动关闭质疑的动作
- **数据来源**`iit_agent_trace` 表 + `iit_qc_logs`
### 2.3 第三级 — 细节与协作eQuery 管理 + 问题列表)
- **定位**:唯一需要人类(主要为 CRC介入协作的工作台。
- **功能模块**
- **eQuery 任务列表**AI 派发的质疑含优先级、AI 监查意见、关联规则溯源
- **eQuery 闭环状态机**`pending``responded``reviewing``closed` / `reopened`
- **CRC 响应区**CRC 点击响应后可修正数据或上传说明,触发 AI 二次复核
- **SDV 凭证验证(远期)**CRC 上传原始医疗凭证化验单、出院小结VisionService 进行自动比对核销,"阅后即焚"确保隐私合规
- **受试者级穿透**:点击任意受试者查看其全部问题 + eQuery 历史
### 2.4 第四级 — 长期资产(定期报告与归档库 Reports & Archives
- **定位**:临床研究的长期数字资产中心。
- **功能模块**
- **AI 定期质控报告**pg-boss cron 自动跑批,按日/周/月生成含图表分析和趋势总结的报告,存储为结构化 JSON + Markdown 双格式
- **重大事件归档库**:所有被 AI 确认为 SAE、PD 的事件永久锁定存档,记录处理和上报的全生命周期轨迹,备查(审计追踪)
- **报告导出**:一键导出 Word/PDF 质控报告
### 2.5 全局基础设施:统一 AI Copilot
- **定位**:悬浮于所有页面之上的超级大脑助理。
- **技术实现**`ChatOrchestrator` + LLM Tool Use + 4 个语义化工具(`read_report` / `look_up_data` / `check_quality` / `search_knowledge`
- **功能模块**:支持自然语言多轮对话。任何人均可随时询问:"总结本周最容易犯的错误趋势"、"解释为什么要求 P005 进行强制 SDV"AI 基于项目全局上下文实时解答。
- **工具设计原则**4 个粗粒度语义工具LLM 做粗分类选工具,代码做细路由执行(详见 [V3.0 开发计划 §3](./V3.0全新开发计划.md))。
---
## 三、智能引擎底座与规则工程The Brains
统一平台的底层由以下核心引擎驱动:
| 引擎模块 | 职责与能力 | 技术实现组件 |
| :---- | :---- | :---- |
| **方案与 EDC 认知基座** | 向量化临床方案;一键同步 REDCap 字典;语义检索项目知识库 | RAG 引擎pgvector/ RedcapAdapter |
| **规则硬逻辑执行器** | 毫秒级绝对逻辑校验(年龄计算、时间窗、必填联动),零幻觉 | HardRuleEngineJSON Logic |
| **推理软逻辑研判器** | 结合 RAG 知识库对文本主诉进行模糊推理AE 研判等) | SoftRuleEngineLLM |
| **事件级质控编排** | 按 record+event 编排质控,规则动态过滤,报告去重 | SkillRunner |
| **异步任务调度** | 防抖处理 REDCap 密集推送定时全量质控eQuery 状态流转 | WebhookController / pg-boss cron |
| **LLM 对话编排** | 4 语义工具 Tool Use替代关键词路由 | ChatOrchestrator / ToolsService |
| **报告生成引擎** | 结构化 JSON + Markdown 双格式,含 eQuery 清单和重大事件 | QcReportService |
---
## 四、延伸终端定义:全时态触达
除 PC 主工作台外,保留对外部生态的延伸能力:
1. **企业微信移动端**
- **通知中枢**重大事件SAE / 高风险 eQuery实时推送到相关人员企微
- **早报订阅**:定时自动将质控报告摘要以 Markdown 卡片形式推送
- **eQuery 通知**CRC 收到 eQuery 派发通知,含问题描述和快捷操作链接
2. **REDCap 嵌入伴随端(远期可选)**
- 通过浏览器插件,在 REDCap 录入界面直接植入"AI Inline 气泡报错",在最源头拦截低级错误
---
## 五、开发实施优先级与里程碑Milestones
> 详细任务拆解和工作量估算见 [V3.0 开发计划](./V3.0全新开发计划.md)。
- **P0 — 自驱动质控流水线(约 9.5 天)**
- P0-1REDCap 变量清单导入 + 可视化
- P0-2规则配置增强 + AI 辅助建议
- P0-3定时质控 + 报告生成 + eQuery 闭环
- P0-4统一驾驶舱四级穿透 + AI Stream
- **P1 — 对话层 Tool Use 改造(约 4 天)**
- P1-1ChatOrchestrator + 4 语义化工具重构
- P1-2对话体验优化 + 端到端测试
- **P2 — 远期扩展(不排期)**
- SDV 凭证上传 + AI 视觉核对VisionService
- AutoMapperServiceREDCap 变量中文映射)
- 数据响应质量评级
- REDCap 嵌入伴随端
- 全局 AI Copilot 侧边栏助手
---
> **一句话总结**:一个用 AI 替代 CRA 的统一数字平台——Agent 自主巡查、全员透明可见、eQuery 自动闭环、知识永久沉淀。