IIT Manager Agent V2.6 综合开发计划
版本: V2.9.1(极简架构 + SOP状态机 + 双脑路由 + 三层记忆 + 主动性增强 + 隐私合规)
日期: 2026-02-05
团队规模: 2人
预估周期: 6周
核心目标: 实现数据质控 Agent 的完整闭环 + 智能化交互 + 长期记忆 + 主动提醒 + 个性化 + 隐私合规
📚 文档导航
本开发计划已拆分为多个专项文档,便于查阅和维护:
| 文档 |
内容 |
适用场景 |
| 本文档 |
架构总览、设计原则、验收标准 |
项目概览、立项汇报 |
| 01-数据库设计 |
Prisma 模型、索引设计、初始化 SQL |
数据库开发 |
| 02-核心引擎实现指南 |
HardRuleEngine、SoftRuleEngine、SopEngine、ReActEngine |
引擎开发 |
| 03-服务层实现指南 |
ToolsService、ChatService、IntentService 等 |
服务开发 |
| 04-记忆系统实现指南 |
V2.8 三层记忆架构、MemoryService |
记忆功能开发 |
| 05-开发阶段与任务清单 |
Phase 1-6 详细任务、里程碑、验收标准 |
项目管理、进度跟踪 |
0. 架构适配性评估
本架构设计充分考虑了临床研究的多种业务场景,通过 SOP状态机 + 双引擎 + 可扩展工具层 的设计,实现了良好的适配性和扩展性。
0.1 目标场景覆盖度
| 场景 |
覆盖度 |
核心支撑组件 |
备注 |
| 1. 拍照识别 + 自动录入 |
🟡 60% |
VisionService + ToolsService |
延后到 V3.0 |
| 2. 数据质控 |
🟢 95% |
HardRuleEngine + SoftRuleEngine |
核心场景 |
| 3. 入排标准判断 |
🟢 90% |
SopEngine + 硬规则配置 |
配置 Skill 即可 |
| 4. 方案偏离检测 |
🟢 80% |
SoftRuleEngine + search_protocol |
需配置访视窗口规则 |
| 5. AE事件检测 |
🟢 80% |
硬规则触发 + 软指令评估 |
需配置AE识别规则 |
| 6. 伦理合规检测 |
🟢 80% |
HardRuleEngine |
配置伦理规则即可 |
| 7. 定期报告生成 |
🟡 50% |
SchedulerService + ReportService |
Phase 4 实现 |
0.2 架构扩展性评价
| 扩展维度 |
实现方式 |
复杂度 |
| 新增质控规则 |
在 iit_skills 表插入 JSON 配置 |
⭐ 低 |
| 新增业务场景 |
新增 Skill 类型 + 配置 SOP 流程 |
⭐⭐ 中低 |
| 新增工具能力 |
在 ToolsService 增加工具定义 |
⭐⭐ 中低 |
| 新增数据源 |
新增 Adapter(如 OdmAdapter) |
⭐⭐⭐ 中 |
1. 架构决策总结
本计划基于以下架构设计文档的综合审查:
| 文档 |
核心观点 |
状态 |
| 架构决策白皮书 |
Postgres-Only + Service-First |
✅ 认可 |
| V2.2 实施指南 |
混合双引擎(硬规则 + 软指令) |
✅ 认可 |
| V2.2 工具泛化 |
3-5 个通用工具替代 100 个专用工具 |
✅ 认可 |
| V2.3 健壮性设计 |
三层防御(映射 + 重试 + 兜底) |
✅ 认可 |
| V2.4 SOP状态机 |
粗粒度 SOP 节点 + 节点内 ReAct |
✅ 认可 |
| V2.8 记忆系统 |
三层记忆(流水账 + 热记忆 + 历史书) |
✅ 认可 |
| V2.9 主动性增强 |
Cron Skill + 用户画像 + 反馈循环 |
✅ 认可 |
| V2.9.1 隐私合规 |
PII 脱敏中间件 + REDCap Schema 自动对齐 |
✅ 认可 |
1.0 V2.9.1 隐私合规增强(P0 必需)
⚠️ 重要:临床数据包含大量患者隐私信息,在调用第三方 LLM 之前必须脱敏!
| 能力 |
实现方式 |
价值 |
| PII 脱敏 |
AnonymizerService.mask/unmask() + 正则库 |
合规必需,防止隐私泄露 |
| 审计日志 |
iit_pii_audit_log 表 + 加密存储 |
事后合规审计 |
| Schema 自动对齐 |
AutoMapperService + LLM 语义匹配 |
字段配置效率提升 8-16x |
1.1 V2.9 核心增强
目标:让 Agent 从"被动应答"进化为"主动协作",同时根据用户反馈持续优化
| 能力 |
实现方式 |
价值 |
| Cron Skill |
iit_skills.triggerType = 'cron' + pg-boss 调度 |
访视提醒、周报自动发送 |
| 用户画像 |
project_memory 中存储用户偏好 Markdown |
回复风格个性化 |
| 反馈循环 |
conversation_history.feedback 字段 |
持续改进回复质量 |
| 多意图处理 |
ReAct Prompt 优化 + Chain of Thought |
一句话多任务 |
1.1 双脑路由模型
核心理念:左脑(SOP) 保证严谨合规,右脑(ReAct) 提供灵活智能
双脑对比:
| 维度 |
左脑 (SOP 状态机) |
右脑 (ReAct Agent) |
| 擅长 |
执行标准流程、合规检查 |
处理模糊提问、多步查询 |
| 典型指令 |
"对 P001 进行入排质控" |
"帮我查下最近那个发烧的病人" |
| 数据权限 |
读写皆可 |
只读 (Read-Only) |
1.2 核心设计原则
| 原则 |
描述 |
| Postgres-Only |
无 Redis,用 pg-boss 替代队列 |
| Service-First |
不用 MCP Server,用 Service Class |
| 混合双引擎 |
硬规则(CPU) + 软指令(LLM) |
| SOP 状态机 |
粗粒度节点 + 节点内灵活性 |
| 主动协作 (V2.9) |
Cron Skill 主动触发 + 用户画像个性化 |
| 反馈驱动 (V2.9) |
用户反馈自动调整偏好 |
| 三层防御 |
字段映射 + 自我修正 + 空结果兜底 |
| 三层记忆 |
流水账(L1) + 热记忆(L2) + 历史书(L3) |
1.3 三层记忆架构 (V2.8)
关键洞察:临床研究项目持续 1-3 年,Agent 必须具备长期记忆能力
| 层级 |
名称 |
存储位置 |
生命周期 |
检索方式 |
| L1 |
流水账 |
conversation_history |
30天 |
按需向量检索 |
| L2 |
热记忆 |
project_memory |
持久 |
每次注入 |
| L3 |
历史书 |
weekly_reports |
持久 |
按意图检索 |
📖 详细实现请参阅 04-记忆系统实现指南
2. 组件总览
2.1 已完成组件
| 组件 |
路径 |
状态 |
| ChatService |
services/ChatService.ts |
✅ 需扩展 |
| SessionMemory |
agents/SessionMemory.ts |
✅ 可复用 |
| RedcapAdapter |
adapters/RedcapAdapter.ts |
✅ 可复用 |
| WechatService |
services/WechatService.ts |
✅ 可复用 |
| DifyClient |
common/rag/DifyClient.ts |
✅ 可复用 |
| LLMFactory |
common/llm/adapters/LLMFactory.ts |
✅ 可复用 |
2.2 待开发组件
3. 开发阶段总览
📖 详细任务清单请参阅 05-开发阶段与任务清单
| Phase |
名称 |
周期 |
核心交付物 |
| Phase 1 |
基础工具层 |
Week 1 |
ToolsService, HardRuleEngine, 字段映射 |
| Phase 2 |
SOP 引擎 + 热记忆 |
Week 2 |
SopEngine, SoftRuleEngine, L2 热记忆 |
| Phase 3 |
ReAct 引擎 + 流水账 |
Week 3 |
ReActEngine, L1 流水账, 向量检索 |
| Phase 4 |
调度系统 + 历史书 |
Week 4 前半 |
SchedulerService, ReportService, L3 历史书 |
| Phase 5 |
智能路由 |
Week 4 后半 - Week 5 |
IntentService, 混合路由, 追问机制 |
| Phase 6 |
视觉能力 |
Week 6 (延后) |
VisionService (延后到 V3.0) |
4. 风险与应对
4.1 已采纳的风险对策
| 风险 |
已采纳对策 |
状态 |
| 意图路由延迟感 |
混合路由(正则+LLM)+ 流式反馈 |
✅ 已整合 |
| ReAct 多嘴 |
只返回 Final Answer,Trace 存日志 |
✅ 已整合 |
| SOP 状态机死锁 |
SUSPENDED 挂起机制 + 唤醒机制 |
✅ 已整合 |
| Phase 6 过早 |
延后到 V3.0 |
✅ 已标记 |
4.2 聚焦清单(P0 优先级)
| 优先级 |
功能 |
理由 |
| P0 |
ToolsService 健壮性 |
字段映射是地基 |
| P0 |
每日早报 (Morning Brief) |
用户感知最强 |
| P0 |
意图路由混合模式 |
保证响应速度 + 降低成本 |
4.3 主要风险矩阵
| 风险类别 |
风险 |
应对措施 |
| 基础架构 |
LLM 响应慢 |
硬规则先行 + 混合路由 |
| 双脑架构 |
ReAct 死循环 |
最大迭代 5 次 + Token 预算 |
| 双脑架构 |
ReAct 调用写工具 |
工具白名单(只读) |
| SOP 状态机 |
人工复核死锁 |
SUSPENDED + 唤醒机制 |
| 扩展能力 |
视觉模型识别错误 |
低置信度人工确认 |
5. 成功标准
5.1 核心验收标准
| 阶段 |
验收标准 |
| Phase 1-3 |
质控任务 3秒内响应;服务重启后任务可恢复;对话历史持久化 |
| Phase 4 |
周报每周一自动生成;定时任务连续 7 天无故障 |
| Phase 5 |
意图识别准确率 > 85%;用户只收到 Final Answer |
| Phase 6 |
图片识别准确率 > 85%(延后到 V3.0) |
5.2 性能指标
| 指标 |
目标值 |
| 硬规则执行时间 |
< 100ms |
| 软指令执行时间 |
< 3s |
| 端到端响应时间 |
< 5s |
| 正则快速通道延迟 |
< 50ms |
| 意图识别时间(LLM) |
< 1s |
| 向量检索延迟 |
< 100ms |
| ReAct 平均迭代次数 |
< 3 |
6. 文件路径清单
数据库新增表
📖 详细 Schema 请参阅 01-数据库设计
| 表名 |
用途 |
Phase |
iit_skills |
Skill 配置存储 |
1 |
iit_field_mapping |
字段名映射 |
1 |
iit_task_run |
SOP 任务执行记录 |
2 |
iit_pending_actions |
待确认操作 |
2 |
iit_project_memory |
热记忆(L2) |
2 |
iit_conversation_history |
流水账(L1) |
2 |
iit_weekly_reports |
历史书-周报(L3) |
4 |
iit_agent_trace |
ReAct 推理轨迹 |
3 |
7. 参考文档
架构设计文档
- 架构决策白皮书:极简主义的胜利
- V2.2 落地实施指南
- V2.3 健壮性设计与最佳实践
- V2.4 SOP 状态机推荐
- V2.6 双脑架构
审核文档
- 潜在的具体风险与问题
- V2.8 记忆系统设计
文档维护人:AI Agent
最后更新:2026-02-05
更新日志
| 版本 |
日期 |
更新内容 |
| V2.6 |
2026-02-02 |
整合双脑架构 + 三层记忆体系 |
| V2.6.1 |
2026-02-05 |
整合团队风险审查建议;拆分为多个专项文档 |
| V2.6.2 |
2026-02-05 |
简化表结构:删除 iit_user_preferences 和 iit_patient_notes(合并到 project_memory) |
| V2.9 |
2026-02-05 |
主动性增强:Cron Skill、用户画像、反馈循环、多意图处理 |
| V2.9.1 |
2026-02-05 |
隐私合规:PII 脱敏中间件、REDCap Schema 自动对齐工具 |