V3.0 Plan: - Finalize CRA Agent V3.0 development plan (replace CRA positioning) - Add unified CRA QC platform PRD - Add HTML UI prototype (dashboard, AI stream, eQuery, reports) - Architecture: report-driven + LLM Tool Use + 4 semantic tools Module Status Update: - Update architecture from dual-brain V2.9.1 to V3.0 Tool Use - Update DB schema inventory (5 tables -> 18 tables) - Update code stats (577 lines -> 15,000+ lines / 61 files) - Update next steps to V3.0 P0 roadmap - Archive old phase plans (ReAct engine, IntentService) - Add V3.0 document references (plan, PRD, prototype) Co-authored-by: Cursor <cursoragent@cursor.com>
7.9 KiB
7.9 KiB
统一数字 CRA 质控平台 产品需求文档 (PRD)
文档版本:V3.0(统一视角与白盒化平台版)
关联开发计划:CRA Agent V3.0 最终开发计划
目标受众:研发团队、架构师、项目决策委员会
核心系统角色:AI 监查大脑(主导者)、全员协作方(PI、DM、CRC)
一、产品哲学与核心定位
1.1 产品背景与痛点重构
传统临床研究不仅受困于 CRA 人力成本高昂,更受困于**"信息孤岛与黑盒效应"——PI 看不到具体过程,CRC 被动防御质疑,CRA 疲于人工核查。本产品致力于彻底变革临床质控模式:不仅要用 AI 替代传统 CRA 的重体力审核工作**,更要打破系统的角色壁垒,建立一个**"全员可见、完全透明、单一真相(Single Source of Truth)"**的统一数字平台。
关键定位:CRA Agent 不是给 CRA 用的助手——它就是 CRA。目标是替代 70-80% 的 CRA 岗位工作(详见 V3.0 开发计划 §1.2)。
1.2 核心产品目标
- 去中心化的统一视角:废除传统系统中森严的"PI 视角"与"CRC 视角"。全员登录同一平台,按数据粒度(概览 → 过程 → 细节 → 资产)自由穿透。
- AI 白盒化(Trust Building):将 AI 的工作从"黑盒后台"移至前台。通过"实时工作流水(AI Stream)"展示 AI 的每一次推理和调用,建立人类对 AI 的绝对信任。
- 长期临床资产沉淀:不只做实时纠错,更要对整个临床试验的生命周期负责。自动生成阶段性质控报告,建立重大事件(SAE/PD)的永久档案库。
- 全自动 eQuery 闭环:AI 独立发现异常、派发质疑、接收 CRC 修正信号、执行二次复核并自动关闭,实现"无人化"质控闭环。
- AI 视觉 SDV(远期):AI 审核 CRC 上传的原始凭证(多模态视觉核对)并自动闭环。
二、统一平台架构与入口定义(核心功能层)
系统取消角色隔离,采用**"逻辑深度递进"**的统一四级架构。
2.1 第一级 — 全局概览(项目健康度大盘 Dashboard)
- 定位:团队宏观把控的首选视图。
- 功能模块:
- 健康度评分:基于通过率、待处理 eQuery、重大事件的综合评分
- 全局核心数据卡片:整体数据合规率、待处理 eQuery 数、AI 已自动审查表单数、累计重大事件数
- 高亮事件预警:瀑布流展示近期 SAE 与重大 PD,支持直接下钻
- 趋势图:质控通过率随时间的变化折线图
2.2 第二级 — AI 监查过程(工作流水 AI Stream)
- 定位:向全员展示的"AI 劳动透明账本",白盒化的核心实现。
- 功能模块:
- 实时 Timeline:动态滚动的瀑布流,精确记录 Agent 的完整动作链。示例:"10:24 监听 EDC 保存事件 → 扫描 P005 实验室表 → 调用 12 条硬逻辑耗时 0.2 秒 → 提取 ALT 异常并关联不良事件表 → 发现记录缺失 → 派发 eQuery-1029"
- 自动闭环展示:清晰记录 AI 接收到 CRC 修正信号后,执行二次复核并自动关闭质疑的动作
- 数据来源:
iit_agent_trace表 +iit_qc_logs表
2.3 第三级 — 细节与协作(eQuery 管理 + 问题列表)
- 定位:唯一需要人类(主要为 CRC)介入协作的工作台。
- 功能模块:
- eQuery 任务列表:AI 派发的质疑,含优先级、AI 监查意见、关联规则溯源
- eQuery 闭环状态机:
pending→responded→reviewing→closed/reopened - CRC 响应区:CRC 点击响应后可修正数据或上传说明,触发 AI 二次复核
- SDV 凭证验证(远期):CRC 上传原始医疗凭证(化验单、出院小结),VisionService 进行自动比对核销,"阅后即焚"确保隐私合规
- 受试者级穿透:点击任意受试者查看其全部问题 + eQuery 历史
2.4 第四级 — 长期资产(定期报告与归档库 Reports & Archives)
- 定位:临床研究的长期数字资产中心。
- 功能模块:
- AI 定期质控报告:pg-boss cron 自动跑批,按日/周/月生成含图表分析和趋势总结的报告,存储为结构化 JSON + Markdown 双格式
- 重大事件归档库:所有被 AI 确认为 SAE、PD 的事件永久锁定存档,记录处理和上报的全生命周期轨迹,备查(审计追踪)
- 报告导出:一键导出 Word/PDF 质控报告
2.5 全局基础设施:统一 AI Copilot
- 定位:悬浮于所有页面之上的超级大脑助理。
- 技术实现:
ChatOrchestrator+ LLM Tool Use + 4 个语义化工具(read_report/look_up_data/check_quality/search_knowledge) - 功能模块:支持自然语言多轮对话。任何人均可随时询问:"总结本周最容易犯的错误趋势"、"解释为什么要求 P005 进行强制 SDV",AI 基于项目全局上下文实时解答。
- 工具设计原则:4 个粗粒度语义工具,LLM 做粗分类选工具,代码做细路由执行(详见 V3.0 开发计划 §3)。
三、智能引擎底座与规则工程(The Brains)
统一平台的底层由以下核心引擎驱动:
| 引擎模块 | 职责与能力 | 技术实现组件 |
|---|---|---|
| 方案与 EDC 认知基座 | 向量化临床方案;一键同步 REDCap 字典;语义检索项目知识库 | RAG 引擎(pgvector)/ RedcapAdapter |
| 规则硬逻辑执行器 | 毫秒级绝对逻辑校验(年龄计算、时间窗、必填联动),零幻觉 | HardRuleEngine(JSON Logic) |
| 推理软逻辑研判器 | 结合 RAG 知识库,对文本主诉进行模糊推理(AE 研判等) | SoftRuleEngine(LLM) |
| 事件级质控编排 | 按 record+event 编排质控,规则动态过滤,报告去重 | SkillRunner |
| 异步任务调度 | 防抖处理 REDCap 密集推送;定时全量质控;eQuery 状态流转 | WebhookController / pg-boss cron |
| LLM 对话编排 | 4 语义工具 Tool Use,替代关键词路由 | ChatOrchestrator / ToolsService |
| 报告生成引擎 | 结构化 JSON + Markdown 双格式,含 eQuery 清单和重大事件 | QcReportService |
四、延伸终端定义:全时态触达
除 PC 主工作台外,保留对外部生态的延伸能力:
- 企业微信移动端:
- 通知中枢:重大事件(SAE / 高风险 eQuery)实时推送到相关人员企微
- 早报订阅:定时自动将质控报告摘要以 Markdown 卡片形式推送
- eQuery 通知:CRC 收到 eQuery 派发通知,含问题描述和快捷操作链接
- REDCap 嵌入伴随端(远期可选):
- 通过浏览器插件,在 REDCap 录入界面直接植入"AI Inline 气泡报错",在最源头拦截低级错误
五、开发实施优先级与里程碑(Milestones)
详细任务拆解和工作量估算见 V3.0 开发计划。
- P0 — 自驱动质控流水线(约 9.5 天):
- P0-1:REDCap 变量清单导入 + 可视化
- P0-2:规则配置增强 + AI 辅助建议
- P0-3:定时质控 + 报告生成 + eQuery 闭环
- P0-4:统一驾驶舱(四级穿透 + AI Stream)
- P1 — 对话层 Tool Use 改造(约 4 天):
- P1-1:ChatOrchestrator + 4 语义化工具重构
- P1-2:对话体验优化 + 端到端测试
- P2 — 远期扩展(不排期):
- SDV 凭证上传 + AI 视觉核对(VisionService)
- AutoMapperService(REDCap 变量中文映射)
- 数据响应质量评级
- REDCap 嵌入伴随端
- 全局 AI Copilot 侧边栏助手
一句话总结:一个用 AI 替代 CRA 的统一数字平台——Agent 自主巡查、全员透明可见、eQuery 自动闭环、知识永久沉淀。