IIT Manager Agent 开发阶段与任务清单
版本: V2.9
更新日期: 2026-02-05
关联文档: IIT Manager Agent V2.6 综合开发计划
V2.9.1 更新:
- 新增 Phase 1.5:隐私安全与自动化工具(P0 合规必需)
- Phase 1 新增 AutoMapperService 任务
- Phase 3 新增反馈循环任务
- Phase 4 新增 ProfilerService 和 Cron Skill 任务
- Phase 5 新增多意图处理任务
1. 开发阶段总览
2. Phase 1: 基础工具层
2.1 目标
- 搭建可复用的工具框架
- 实现字段映射机制
- 建立硬规则引擎
2.2 任务清单
| 任务ID |
任务名称 |
优先级 |
状态 |
前置依赖 |
| P1-01 |
创建 iit_skills 表 |
高 |
待开始 |
- |
| P1-02 |
创建 iit_field_mapping 表 |
高 |
待开始 |
- |
| P1-03 |
实现 ToolsService |
高 |
待开始 |
P1-01 |
| P1-04 |
实现 read_clinical_data 工具 |
高 |
待开始 |
P1-03 |
| P1-05 |
实现 search_protocol 工具 |
高 |
待开始 |
P1-03 |
| P1-06 |
实现 HardRuleEngine |
高 |
待开始 |
- |
| P1-07 |
集成字段映射到 ToolsService |
中 |
待开始 |
P1-02, P1-03 |
| P1-08 |
[V2.9.1] 实现 AutoMapperService |
中 |
待开始 |
P1-02 |
| P1-09 |
[V2.9.1] 实现 REDCap Data Dictionary 解析器 |
中 |
待开始 |
P1-08 |
| P1-10 |
[V2.9.1] 实现 LLM 语义映射 Job |
中 |
待开始 |
P1-08 |
| P1-11 |
[V2.9.1] 实现管理后台映射确认 UI |
低 |
待开始 |
P1-10 |
| P1-12 |
单元测试覆盖 |
中 |
待开始 |
P1-01~P1-11 |
2.3 验收标准
2.5 Phase 1.5: 隐私安全与自动化工具(P0 合规必需)
⚠️ 重要:此阶段必须在 Phase 2 调用 LLM 之前完成!
临床数据包含患者隐私信息,未脱敏直接发送给 LLM 将违反数据保护法规。
2.5.1 目标
- 实现 PII 脱敏中间件
- 建立脱敏审计日志
- 确保合规性
2.5.2 任务清单
| 任务ID |
任务名称 |
优先级 |
状态 |
前置依赖 |
| P1.5-01 |
创建 iit_pii_audit_log 表 |
P0 |
待开始 |
- |
| P1.5-02 |
实现 PII 识别正则库 |
P0 |
待开始 |
- |
| P1.5-03 |
实现 AnonymizerService.mask() |
P0 |
待开始 |
P1.5-01, P1.5-02 |
| P1.5-04 |
实现 AnonymizerService.unmask() |
P0 |
待开始 |
P1.5-03 |
| P1.5-05 |
实现脱敏映射加密存储 |
高 |
待开始 |
P1.5-03 |
| P1.5-06 |
集成到 ChatService 调用链 |
P0 |
待开始 |
P1.5-04 |
| P1.5-07 |
单元测试:各类 PII 识别 |
高 |
待开始 |
P1.5-02 |
| P1.5-08 |
端到端测试:脱敏还原完整流程 |
高 |
待开始 |
P1.5-01~P1.5-06 |
2.5.3 验收标准
2.5.4 PII 脱敏流程
3. Phase 2: SOP 引擎 + 热记忆
3.1 目标
- 实现状态机驱动的 SOP 执行
- 搭建热记忆层(L2)
- 支持人工确认机制
3.2 任务清单
| 任务ID |
任务名称 |
优先级 |
状态 |
前置依赖 |
| P2-01 |
创建 iit_task_run 表 |
高 |
待开始 |
- |
| P2-02 |
创建 iit_pending_actions 表 |
高 |
待开始 |
- |
| P2-03 |
创建 iit_project_memory 表 |
高 |
待开始 |
- |
| P2-04 |
实现 SopEngine 核心状态机 |
高 |
待开始 |
P2-01 |
| P2-05 |
实现 SoftRuleEngine |
高 |
待开始 |
- |
| P2-06 |
集成 SoftRuleEngine 到 SOP |
高 |
待开始 |
P2-04, P2-05 |
| P2-07 |
实现 SUSPENDED 状态机制 |
高 |
待开始 |
P2-04 |
| P2-08 |
实现人工确认流程 |
高 |
待开始 |
P2-02, P2-07 |
| P2-09 |
实现 MemoryService 热记忆 |
中 |
待开始 |
P2-03 |
| P2-10 |
集成热记忆到 SOP 上下文 |
中 |
待开始 |
P2-04, P2-09 |
| P2-11 |
端到端测试:质控 SOP |
中 |
待开始 |
P2-01~P2-10 |
3.3 验收标准
4. Phase 3: ReAct 引擎 + 流水账
4.1 目标
- 实现 ReAct 模式的灵活查询
- 搭建流水账层(L1)
- 实现只读安全约束
4.2 任务清单
| 任务ID |
任务名称 |
优先级 |
状态 |
前置依赖 |
| P3-01 |
创建 iit_conversation_history 表 |
高 |
待开始 |
- |
| P3-02 |
创建 iit_agent_trace 表 |
中 |
待开始 |
- |
| P3-03 |
实现 ReActEngine 核心循环 |
高 |
待开始 |
P1-03 |
| P3-04 |
实现只读工具白名单 |
高 |
待开始 |
P3-03 |
| P3-05 |
实现 MemoryService 流水账 |
高 |
待开始 |
P3-01 |
| P3-06 |
实现向量化存储(pgvector) |
中 |
待开始 |
P3-05 |
| P3-07 |
实现相似度检索 |
中 |
待开始 |
P3-06 |
| P3-08 |
实现 Trace 记录机制 |
中 |
待开始 |
P3-02, P3-03 |
| P3-09 |
实现流式反馈机制 |
高 |
待开始 |
P3-03 |
| P3-10 |
实现 "正在思考" 状态提示 |
中 |
待开始 |
P3-09 |
| P3-11 |
集成流水账到 ReAct 上下文 |
中 |
待开始 |
P3-03, P3-05 |
| P3-12 |
[V2.9] 扩展对话表支持反馈字段 |
中 |
待开始 |
P3-01 |
| P3-13 |
[V2.9] 实现反馈收集接口 |
中 |
待开始 |
P3-12 |
| P3-14 |
端到端测试:模糊查询 |
中 |
待开始 |
P3-01~P3-13 |
4.3 验收标准
5. Phase 4: 调度系统 + 历史书
5.1 目标
- 实现定时任务调度
- 实现周报生成
- 搭建历史书层(L3)
5.2 任务清单
| 任务ID |
任务名称 |
优先级 |
状态 |
前置依赖 |
| P4-01 |
创建 iit_weekly_reports 表 |
高 |
待开始 |
- |
| P4-02 |
实现 SchedulerService(pg-boss) |
高 |
待开始 |
- |
| P4-03 |
实现 ReportService |
高 |
待开始 |
P4-01 |
| P4-04 |
实现周报自动生成 |
高 |
待开始 |
P4-02, P4-03 |
| P4-05 |
实现记忆卷叠机制 |
中 |
待开始 |
P4-01, P3-05 |
| P4-06 |
实现历史书检索 |
中 |
待开始 |
P4-01 |
| P4-07 |
集成历史书到上下文组装 |
中 |
待开始 |
P4-06 |
| P4-08 |
[V2.9] 实现 ProfilerService |
中 |
待开始 |
P2-03 |
| P4-09 |
[V2.9] 扩展 Skill 表支持 Cron 触发 |
中 |
待开始 |
P1-01 |
| P4-10 |
[V2.9] 实现 Cron Skill 调度 |
中 |
待开始 |
P4-02, P4-09 |
| P4-11 |
[V2.9] 实现访视提醒 Skill |
中 |
待开始 |
P4-10 |
| P4-12 |
[V2.9] 集成用户画像到通知个性化 |
低 |
待开始 |
P4-08, P4-11 |
| P4-13 |
端到端测试:周报生成 |
中 |
待开始 |
P4-01~P4-12 |
5.3 验收标准
6. Phase 5: 智能路由
6.1 目标
- 实现意图识别服务
- 实现混合路由(正则 + LLM)
- 实现追问机制
6.2 任务清单
| 任务ID |
任务名称 |
优先级 |
状态 |
前置依赖 |
| P5-01 |
实现 IntentService |
高 |
待开始 |
- |
| P5-02 |
实现正则快速通道 |
高 |
待开始 |
P5-01 |
| P5-03 |
实现 LLM 意图识别 |
高 |
待开始 |
P5-01 |
| P5-04 |
实现降级策略 |
中 |
待开始 |
P5-01~P5-03 |
| P5-05 |
实现追问机制 |
中 |
待开始 |
P5-01 |
| P5-06 |
扩展 ChatService 集成路由 |
高 |
待开始 |
P5-01~P5-05 |
| P5-07 |
[V2.9] 优化 ReAct Prompt 支持多意图 |
中 |
待开始 |
P3-03 |
| P5-08 |
端到端测试:路由分发 |
中 |
待开始 |
P5-01~P5-07 |
6.3 验收标准
7. Phase 6: 视觉能力(延后)
⚠️ 注意:根据风险评估,视觉能力延后到核心功能稳定后再开发。
7.1 目标
- 实现图片识别能力
- 支持知情同意书识别
- 支持 CRF 扫描件识别
7.2 任务清单
| 任务ID |
任务名称 |
优先级 |
状态 |
前置依赖 |
| P6-01 |
评估 GPT-4V / 通义千问-VL |
低 |
延后 |
P1~P5 完成 |
| P6-02 |
实现 VisionService |
低 |
延后 |
P6-01 |
| P6-03 |
集成到 ChatService |
低 |
延后 |
P6-02 |
| P6-04 |
端到端测试 |
低 |
延后 |
P6-03 |
7.3 延后原因
- 核心功能优先级更高
- 视觉能力成本较高
- 需要更多真实场景验证
8. 里程碑与依赖关系
9. 风险与对策
| 风险 |
影响 |
对策 |
已整合 |
| ReAct 决策链过长 |
延迟 > 10秒 |
流式反馈 + "正在思考" 状态 |
✅ |
| 混合意图难分类 |
用户困惑 |
UNCLEAR + 追问机制 |
✅ |
| ReAct 误调写入工具 |
数据风险 |
只读工具白名单 |
✅ |
| UI 无响应感 |
体验差 |
流式反馈 + 状态提示 |
✅ |
| SOP 中途被打断 |
任务丢失 |
SUSPENDED 状态 + 恢复机制 |
✅ |
| 视觉能力分散精力 |
核心功能延迟 |
延后到 Phase 6 |
✅ |
| [V2.9] 用户多意图混乱 |
任务遗漏 |
ReAct Prompt 多意图拆分 |
✅ |
| [V2.9] 回复不符用户偏好 |
体验差 |
反馈循环 + 用户画像 |
✅ |
| [V2.9] 主动提醒打扰用户 |
用户投诉 |
最佳通知时间 + 个性化 |
✅ |
| [V2.9.1] 患者隐私泄露给 LLM |
法律风险 |
PII 脱敏中间件 + 审计日志 |
✅ |
| [V2.9.1] 字段映射配置繁琐 |
效率低 |
AutoMapper LLM 语义匹配 |
✅ |
10. 性能指标
| 指标 |
目标值 |
测量方法 |
| 快速通道响应 |
< 50ms |
正则匹配耗时 |
| LLM 意图识别 |
< 1s |
API 调用耗时 |
| SOP 单步执行 |
< 2s |
包含工具调用 |
| ReAct 完整推理 |
< 10s |
最多 5 轮循环 |
| 流式首字节 |
< 2s |
第一个 token |
| 周报生成 |
< 30s |
后台任务 |
| 向量检索 |
< 500ms |
Top-5 结果 |
文档维护人:AI Agent
最后更新:2026-02-05