docs(iit): Add CRA Agent V3.0 development plan and update module status guide
V3.0 Plan: - Finalize CRA Agent V3.0 development plan (replace CRA positioning) - Add unified CRA QC platform PRD - Add HTML UI prototype (dashboard, AI stream, eQuery, reports) - Architecture: report-driven + LLM Tool Use + 4 semantic tools Module Status Update: - Update architecture from dual-brain V2.9.1 to V3.0 Tool Use - Update DB schema inventory (5 tables -> 18 tables) - Update code stats (577 lines -> 15,000+ lines / 61 files) - Update next steps to V3.0 P0 roadmap - Archive old phase plans (ReAct engine, IntentService) - Add V3.0 document references (plan, PRD, prototype) Co-authored-by: Cursor <cursoragent@cursor.com>
This commit is contained in:
@@ -0,0 +1,129 @@
|
||||
# 统一数字 CRA 质控平台 产品需求文档 (PRD)
|
||||
|
||||
**文档版本**:V3.0(统一视角与白盒化平台版)
|
||||
|
||||
**关联开发计划**:[CRA Agent V3.0 最终开发计划](./V3.0全新开发计划.md)
|
||||
|
||||
**目标受众**:研发团队、架构师、项目决策委员会
|
||||
|
||||
**核心系统角色**:AI 监查大脑(主导者)、全员协作方(PI、DM、CRC)
|
||||
|
||||
---
|
||||
|
||||
## 一、产品哲学与核心定位
|
||||
|
||||
### 1.1 产品背景与痛点重构
|
||||
|
||||
传统临床研究不仅受困于 CRA 人力成本高昂,更受困于**"信息孤岛与黑盒效应"**——PI 看不到具体过程,CRC 被动防御质疑,CRA 疲于人工核查。本产品致力于彻底变革临床质控模式:不仅要**用 AI 替代传统 CRA 的重体力审核工作**,更要打破系统的角色壁垒,建立一个**"全员可见、完全透明、单一真相(Single Source of Truth)"**的统一数字平台。
|
||||
|
||||
> **关键定位**:CRA Agent 不是给 CRA 用的助手——它就是 CRA。目标是替代 70-80% 的 CRA 岗位工作(详见 [V3.0 开发计划 §1.2](./V3.0全新开发计划.md))。
|
||||
|
||||
### 1.2 核心产品目标
|
||||
|
||||
1. **去中心化的统一视角**:废除传统系统中森严的"PI 视角"与"CRC 视角"。全员登录同一平台,按数据粒度(概览 → 过程 → 细节 → 资产)自由穿透。
|
||||
2. **AI 白盒化(Trust Building)**:将 AI 的工作从"黑盒后台"移至前台。通过"实时工作流水(AI Stream)"展示 AI 的每一次推理和调用,建立人类对 AI 的绝对信任。
|
||||
3. **长期临床资产沉淀**:不只做实时纠错,更要对整个临床试验的生命周期负责。自动生成阶段性质控报告,建立重大事件(SAE/PD)的永久档案库。
|
||||
4. **全自动 eQuery 闭环**:AI 独立发现异常、派发质疑、接收 CRC 修正信号、执行二次复核并自动关闭,实现"无人化"质控闭环。
|
||||
5. **AI 视觉 SDV(远期)**:AI 审核 CRC 上传的原始凭证(多模态视觉核对)并自动闭环。
|
||||
|
||||
---
|
||||
|
||||
## 二、统一平台架构与入口定义(核心功能层)
|
||||
|
||||
系统取消角色隔离,采用**"逻辑深度递进"**的统一四级架构。
|
||||
|
||||
### 2.1 第一级 — 全局概览(项目健康度大盘 Dashboard)
|
||||
|
||||
- **定位**:团队宏观把控的首选视图。
|
||||
- **功能模块**:
|
||||
- **健康度评分**:基于通过率、待处理 eQuery、重大事件的综合评分
|
||||
- **全局核心数据卡片**:整体数据合规率、待处理 eQuery 数、AI 已自动审查表单数、累计重大事件数
|
||||
- **高亮事件预警**:瀑布流展示近期 SAE 与重大 PD,支持直接下钻
|
||||
- **趋势图**:质控通过率随时间的变化折线图
|
||||
|
||||
### 2.2 第二级 — AI 监查过程(工作流水 AI Stream)
|
||||
|
||||
- **定位**:向全员展示的"AI 劳动透明账本",白盒化的核心实现。
|
||||
- **功能模块**:
|
||||
- **实时 Timeline**:动态滚动的瀑布流,精确记录 Agent 的完整动作链。示例:"*10:24 监听 EDC 保存事件 → 扫描 P005 实验室表 → 调用 12 条硬逻辑耗时 0.2 秒 → 提取 ALT 异常并关联不良事件表 → 发现记录缺失 → 派发 eQuery-1029*"
|
||||
- **自动闭环展示**:清晰记录 AI 接收到 CRC 修正信号后,执行二次复核并自动关闭质疑的动作
|
||||
- **数据来源**:`iit_agent_trace` 表 + `iit_qc_logs` 表
|
||||
|
||||
### 2.3 第三级 — 细节与协作(eQuery 管理 + 问题列表)
|
||||
|
||||
- **定位**:唯一需要人类(主要为 CRC)介入协作的工作台。
|
||||
- **功能模块**:
|
||||
- **eQuery 任务列表**:AI 派发的质疑,含优先级、AI 监查意见、关联规则溯源
|
||||
- **eQuery 闭环状态机**:`pending` → `responded` → `reviewing` → `closed` / `reopened`
|
||||
- **CRC 响应区**:CRC 点击响应后可修正数据或上传说明,触发 AI 二次复核
|
||||
- **SDV 凭证验证(远期)**:CRC 上传原始医疗凭证(化验单、出院小结),VisionService 进行自动比对核销,"阅后即焚"确保隐私合规
|
||||
- **受试者级穿透**:点击任意受试者查看其全部问题 + eQuery 历史
|
||||
|
||||
### 2.4 第四级 — 长期资产(定期报告与归档库 Reports & Archives)
|
||||
|
||||
- **定位**:临床研究的长期数字资产中心。
|
||||
- **功能模块**:
|
||||
- **AI 定期质控报告**:pg-boss cron 自动跑批,按日/周/月生成含图表分析和趋势总结的报告,存储为结构化 JSON + Markdown 双格式
|
||||
- **重大事件归档库**:所有被 AI 确认为 SAE、PD 的事件永久锁定存档,记录处理和上报的全生命周期轨迹,备查(审计追踪)
|
||||
- **报告导出**:一键导出 Word/PDF 质控报告
|
||||
|
||||
### 2.5 全局基础设施:统一 AI Copilot
|
||||
|
||||
- **定位**:悬浮于所有页面之上的超级大脑助理。
|
||||
- **技术实现**:`ChatOrchestrator` + LLM Tool Use + 4 个语义化工具(`read_report` / `look_up_data` / `check_quality` / `search_knowledge`)
|
||||
- **功能模块**:支持自然语言多轮对话。任何人均可随时询问:"总结本周最容易犯的错误趋势"、"解释为什么要求 P005 进行强制 SDV",AI 基于项目全局上下文实时解答。
|
||||
- **工具设计原则**:4 个粗粒度语义工具,LLM 做粗分类选工具,代码做细路由执行(详见 [V3.0 开发计划 §3](./V3.0全新开发计划.md))。
|
||||
|
||||
---
|
||||
|
||||
## 三、智能引擎底座与规则工程(The Brains)
|
||||
|
||||
统一平台的底层由以下核心引擎驱动:
|
||||
|
||||
| 引擎模块 | 职责与能力 | 技术实现组件 |
|
||||
| :---- | :---- | :---- |
|
||||
| **方案与 EDC 认知基座** | 向量化临床方案;一键同步 REDCap 字典;语义检索项目知识库 | RAG 引擎(pgvector)/ RedcapAdapter |
|
||||
| **规则硬逻辑执行器** | 毫秒级绝对逻辑校验(年龄计算、时间窗、必填联动),零幻觉 | HardRuleEngine(JSON Logic) |
|
||||
| **推理软逻辑研判器** | 结合 RAG 知识库,对文本主诉进行模糊推理(AE 研判等) | SoftRuleEngine(LLM) |
|
||||
| **事件级质控编排** | 按 record+event 编排质控,规则动态过滤,报告去重 | SkillRunner |
|
||||
| **异步任务调度** | 防抖处理 REDCap 密集推送;定时全量质控;eQuery 状态流转 | WebhookController / pg-boss cron |
|
||||
| **LLM 对话编排** | 4 语义工具 Tool Use,替代关键词路由 | ChatOrchestrator / ToolsService |
|
||||
| **报告生成引擎** | 结构化 JSON + Markdown 双格式,含 eQuery 清单和重大事件 | QcReportService |
|
||||
|
||||
---
|
||||
|
||||
## 四、延伸终端定义:全时态触达
|
||||
|
||||
除 PC 主工作台外,保留对外部生态的延伸能力:
|
||||
|
||||
1. **企业微信移动端**:
|
||||
- **通知中枢**:重大事件(SAE / 高风险 eQuery)实时推送到相关人员企微
|
||||
- **早报订阅**:定时自动将质控报告摘要以 Markdown 卡片形式推送
|
||||
- **eQuery 通知**:CRC 收到 eQuery 派发通知,含问题描述和快捷操作链接
|
||||
2. **REDCap 嵌入伴随端(远期可选)**:
|
||||
- 通过浏览器插件,在 REDCap 录入界面直接植入"AI Inline 气泡报错",在最源头拦截低级错误
|
||||
|
||||
---
|
||||
|
||||
## 五、开发实施优先级与里程碑(Milestones)
|
||||
|
||||
> 详细任务拆解和工作量估算见 [V3.0 开发计划](./V3.0全新开发计划.md)。
|
||||
|
||||
- **P0 — 自驱动质控流水线(约 9.5 天)**:
|
||||
- P0-1:REDCap 变量清单导入 + 可视化
|
||||
- P0-2:规则配置增强 + AI 辅助建议
|
||||
- P0-3:定时质控 + 报告生成 + eQuery 闭环
|
||||
- P0-4:统一驾驶舱(四级穿透 + AI Stream)
|
||||
- **P1 — 对话层 Tool Use 改造(约 4 天)**:
|
||||
- P1-1:ChatOrchestrator + 4 语义化工具重构
|
||||
- P1-2:对话体验优化 + 端到端测试
|
||||
- **P2 — 远期扩展(不排期)**:
|
||||
- SDV 凭证上传 + AI 视觉核对(VisionService)
|
||||
- AutoMapperService(REDCap 变量中文映射)
|
||||
- 数据响应质量评级
|
||||
- REDCap 嵌入伴随端
|
||||
- 全局 AI Copilot 侧边栏助手
|
||||
|
||||
---
|
||||
|
||||
> **一句话总结**:一个用 AI 替代 CRA 的统一数字平台——Agent 自主巡查、全员透明可见、eQuery 自动闭环、知识永久沉淀。
|
||||
Reference in New Issue
Block a user