AIclinicalresearch/docs/03-业务模块/IIT Manager Agent/04-开发计划/05-开发阶段与任务清单.md

# IIT Manager Agent 开发阶段与任务清单

> **版本：** V2.9
> **更新日期：** 2026-02-05
> **关联文档：** [IIT Manager Agent V2.6 综合开发计划](./IIT%20Manager%20Agent%20V2.6%20综合开发计划.md)
>
> **V2.9.1 更新**：
> - **新增 Phase 1.5**：隐私安全与自动化工具（P0 合规必需）
> - Phase 1 新增 AutoMapperService 任务
> - Phase 3 新增反馈循环任务
> - Phase 4 新增 ProfilerService 和 Cron Skill 任务
> - Phase 5 新增多意图处理任务

---

## 1. 开发阶段总览

```
Phase 1          Phase 1.5        Phase 2          Phase 3          Phase 4          Phase 5          Phase 6
┌──────────┐    ┌──────────┐    ┌──────────┐    ┌──────────┐    ┌──────────┐    ┌──────────┐    ┌──────────┐
│基础工具层│ ──▶│ 隐私安全 │ ──▶│ SOP 引擎 │ ──▶│ReAct 引擎│ ──▶│ 调度系统 │ ──▶│ 智能路由 │ ──▶│ 视觉能力 │
│          │    │  P0必需  │    │ + 记忆L2 │    │ + 记忆L1 │    │ + 记忆L3 │    │          │    │ (延后)   │
└──────────┘    └──────────┘    └──────────┘    └──────────┘    └──────────┘    └──────────┘    └──────────┘
     ▼               ▼               ▼               ▼               ▼               ▼               ▼
 ToolsService   Anonymizer      SopEngine       ReActEngine    Scheduler       IntentService   VisionService
 FieldMapping   AutoMapper      HotMemory       FlowMemory     WeeklyReports   MixedRouting    (Postponed)
 HardRule       PII Audit       SoftRule        AgentTrace     ReportService   StreamingFB
```

---

## 2. Phase 1: 基础工具层

### 2.1 目标

- 搭建可复用的工具框架
- 实现字段映射机制
- 建立硬规则引擎

### 2.2 任务清单

| 任务ID | 任务名称 | 优先级 | 状态 | 前置依赖 |
|--------|----------|--------|------|----------|
| P1-01 | 创建 `iit_skills` 表 | 高 | 待开始 | - |
| P1-02 | 创建 `iit_field_mapping` 表 | 高 | 待开始 | - |
| P1-03 | 实现 `ToolsService` | 高 | 待开始 | P1-01 |
| P1-04 | 实现 `read_clinical_data` 工具 | 高 | 待开始 | P1-03 |
| P1-05 | 实现 `search_protocol` 工具 | 高 | 待开始 | P1-03 |
| P1-06 | 实现 `HardRuleEngine` | 高 | 待开始 | - |
| P1-07 | 集成字段映射到 ToolsService | 中 | 待开始 | P1-02, P1-03 |
| P1-08 | **[V2.9.1]** 实现 `AutoMapperService` | 中 | 待开始 | P1-02 |
| P1-09 | **[V2.9.1]** 实现 REDCap Data Dictionary 解析器 | 中 | 待开始 | P1-08 |
| P1-10 | **[V2.9.1]** 实现 LLM 语义映射 Job | 中 | 待开始 | P1-08 |
| P1-11 | **[V2.9.1]** 实现管理后台映射确认 UI | 低 | 待开始 | P1-10 |
| P1-12 | 单元测试覆盖 | 中 | 待开始 | P1-01~P1-11 |

### 2.3 验收标准

- [ ] 工具可通过名称调用
- [ ] 字段映射正确生效（LLM 用 "年龄" → 实际调用 "dem_age"）
- [ ] 硬规则拦截生效
- [ ] **[V2.9.1]** AutoMapper 可解析 REDCap Data Dictionary
- [ ] **[V2.9.1]** LLM 可生成字段映射建议
- [ ] 测试覆盖率 > 80%

---

## 2.5 Phase 1.5: 隐私安全与自动化工具（P0 合规必需）

> **⚠️ 重要**：此阶段必须在 Phase 2 调用 LLM 之前完成！
> 临床数据包含患者隐私信息，未脱敏直接发送给 LLM 将违反数据保护法规。

### 2.5.1 目标

- 实现 PII 脱敏中间件
- 建立脱敏审计日志
- 确保合规性

### 2.5.2 任务清单

| 任务ID | 任务名称 | 优先级 | 状态 | 前置依赖 |
|--------|----------|--------|------|----------|
| P1.5-01 | 创建 `iit_pii_audit_log` 表 | **P0** | 待开始 | - |
| P1.5-02 | 实现 PII 识别正则库 | **P0** | 待开始 | - |
| P1.5-03 | 实现 `AnonymizerService.mask()` | **P0** | 待开始 | P1.5-01, P1.5-02 |
| P1.5-04 | 实现 `AnonymizerService.unmask()` | **P0** | 待开始 | P1.5-03 |
| P1.5-05 | 实现脱敏映射加密存储 | 高 | 待开始 | P1.5-03 |
| P1.5-06 | 集成到 ChatService 调用链 | **P0** | 待开始 | P1.5-04 |
| P1.5-07 | 单元测试：各类 PII 识别 | 高 | 待开始 | P1.5-02 |
| P1.5-08 | 端到端测试：脱敏还原完整流程 | 高 | 待开始 | P1.5-01~P1.5-06 |

### 2.5.3 验收标准

- [ ] 身份证号正确识别并脱敏（18位）
- [ ] 手机号正确识别并脱敏（11位）
- [ ] 中文姓名正确识别并脱敏（2-4字）
- [ ] 病历号正确识别并脱敏
- [ ] LLM 收到的 Payload 不包含任何 PII
- [ ] LLM 回复正确还原占位符
- [ ] 审计日志正确记录（加密存储）

### 2.5.4 PII 脱敏流程

```
用户输入: "张三（身份证420101199001011234）今天血压偏高"
    ↓ AnonymizerService.mask()
LLM 收到: "[PATIENT_1]（身份证[ID_CARD_1]）今天血压偏高"
    ↓ 同时写入 iit_pii_audit_log（加密存储映射表）
    ↓ LLM 处理
LLM 返回: "[PATIENT_1] 的血压需要关注..."
    ↓ AnonymizerService.unmask()
用户看到: "张三 的血压需要关注..."
```

---

## 3. Phase 2: SOP 引擎 + 热记忆

### 3.1 目标

- 实现状态机驱动的 SOP 执行
- 搭建热记忆层（L2）
- 支持人工确认机制

### 3.2 任务清单

| 任务ID | 任务名称 | 优先级 | 状态 | 前置依赖 |
|--------|----------|--------|------|----------|
| P2-01 | 创建 `iit_task_run` 表 | 高 | 待开始 | - |
| P2-02 | 创建 `iit_pending_actions` 表 | 高 | 待开始 | - |
| P2-03 | 创建 `iit_project_memory` 表 | 高 | 待开始 | - |
| P2-04 | 实现 `SopEngine` 核心状态机 | 高 | 待开始 | P2-01 |
| P2-05 | 实现 `SoftRuleEngine` | 高 | 待开始 | - |
| P2-06 | 集成 SoftRuleEngine 到 SOP | 高 | 待开始 | P2-04, P2-05 |
| P2-07 | 实现 SUSPENDED 状态机制 | 高 | 待开始 | P2-04 |
| P2-08 | 实现人工确认流程 | 高 | 待开始 | P2-02, P2-07 |
| P2-09 | 实现 `MemoryService` 热记忆 | 中 | 待开始 | P2-03 |
| P2-10 | 集成热记忆到 SOP 上下文 | 中 | 待开始 | P2-04, P2-09 |
| P2-11 | 端到端测试：质控 SOP | 中 | 待开始 | P2-01~P2-10 |

### 3.3 验收标准

- [ ] 质控任务可自动执行完整 SOP
- [ ] 写操作正确等待人工确认
- [ ] SUSPENDED 状态正确持久化
- [ ] 热记忆正确注入 SOP 上下文
- [ ] 手动恢复执行成功

---

## 4. Phase 3: ReAct 引擎 + 流水账

### 4.1 目标

- 实现 ReAct 模式的灵活查询
- 搭建流水账层（L1）
- 实现只读安全约束

### 4.2 任务清单

| 任务ID | 任务名称 | 优先级 | 状态 | 前置依赖 |
|--------|----------|--------|------|----------|
| P3-01 | 创建 `iit_conversation_history` 表 | 高 | 待开始 | - |
| P3-02 | 创建 `iit_agent_trace` 表 | 中 | 待开始 | - |
| P3-03 | 实现 `ReActEngine` 核心循环 | 高 | 待开始 | P1-03 |
| P3-04 | 实现只读工具白名单 | 高 | 待开始 | P3-03 |
| P3-05 | 实现 `MemoryService` 流水账 | 高 | 待开始 | P3-01 |
| P3-06 | 实现向量化存储（pgvector） | 中 | 待开始 | P3-05 |
| P3-07 | 实现相似度检索 | 中 | 待开始 | P3-06 |
| P3-08 | 实现 Trace 记录机制 | 中 | 待开始 | P3-02, P3-03 |
| P3-09 | 实现流式反馈机制 | 高 | 待开始 | P3-03 |
| P3-10 | 实现 "正在思考" 状态提示 | 中 | 待开始 | P3-09 |
| P3-11 | 集成流水账到 ReAct 上下文 | 中 | 待开始 | P3-03, P3-05 |
| P3-12 | **[V2.9]** 扩展对话表支持反馈字段 | 中 | 待开始 | P3-01 |
| P3-13 | **[V2.9]** 实现反馈收集接口 | 中 | 待开始 | P3-12 |
| P3-14 | 端到端测试：模糊查询 | 中 | 待开始 | P3-01~P3-13 |

### 4.3 验收标准

- [ ] ReAct 可正确推理并调用工具
- [ ] 只读约束生效（无法调用写入工具）
- [ ] 流水账正确存储和检索
- [ ] Trace 记录可供调试
- [ ] 流式反馈 < 2秒首字节
- [ ] "正在思考" 状态正确显示
- [ ] **[V2.9]** 反馈按钮可正确收集用户反馈

---

## 5. Phase 4: 调度系统 + 历史书

### 5.1 目标

- 实现定时任务调度
- 实现周报生成
- 搭建历史书层（L3）

### 5.2 任务清单

| 任务ID | 任务名称 | 优先级 | 状态 | 前置依赖 |
|--------|----------|--------|------|----------|
| P4-01 | 创建 `iit_weekly_reports` 表 | 高 | 待开始 | - |
| P4-02 | 实现 `SchedulerService`（pg-boss） | 高 | 待开始 | - |
| P4-03 | 实现 `ReportService` | 高 | 待开始 | P4-01 |
| P4-04 | 实现周报自动生成 | 高 | 待开始 | P4-02, P4-03 |
| P4-05 | 实现记忆卷叠机制 | 中 | 待开始 | P4-01, P3-05 |
| P4-06 | 实现历史书检索 | 中 | 待开始 | P4-01 |
| P4-07 | 集成历史书到上下文组装 | 中 | 待开始 | P4-06 |
| P4-08 | **[V2.9]** 实现 `ProfilerService` | 中 | 待开始 | P2-03 |
| P4-09 | **[V2.9]** 扩展 Skill 表支持 Cron 触发 | 中 | 待开始 | P1-01 |
| P4-10 | **[V2.9]** 实现 Cron Skill 调度 | 中 | 待开始 | P4-02, P4-09 |
| P4-11 | **[V2.9]** 实现访视提醒 Skill | 中 | 待开始 | P4-10 |
| P4-12 | **[V2.9]** 集成用户画像到通知个性化 | 低 | 待开始 | P4-08, P4-11 |
| P4-13 | 端到端测试：周报生成 | 中 | 待开始 | P4-01~P4-12 |

### 5.3 验收标准

- [ ] 周报每周一自动生成
- [ ] 记忆卷叠每日自动执行
- [ ] 历史书检索正确召回
- [ ] **[V2.9]** 用户画像正确存储在 project_memory
- [ ] **[V2.9]** Cron Skill 按时触发
- [ ] **[V2.9]** 访视提醒正确发送给目标用户

---

## 6. Phase 5: 智能路由

### 6.1 目标

- 实现意图识别服务
- 实现混合路由（正则 + LLM）
- 实现追问机制

### 6.2 任务清单

| 任务ID | 任务名称 | 优先级 | 状态 | 前置依赖 |
|--------|----------|--------|------|----------|
| P5-01 | 实现 `IntentService` | 高 | 待开始 | - |
| P5-02 | 实现正则快速通道 | 高 | 待开始 | P5-01 |
| P5-03 | 实现 LLM 意图识别 | 高 | 待开始 | P5-01 |
| P5-04 | 实现降级策略 | 中 | 待开始 | P5-01~P5-03 |
| P5-05 | 实现追问机制 | 中 | 待开始 | P5-01 |
| P5-06 | 扩展 `ChatService` 集成路由 | 高 | 待开始 | P5-01~P5-05 |
| P5-07 | **[V2.9]** 优化 ReAct Prompt 支持多意图 | 中 | 待开始 | P3-03 |
| P5-08 | 端到端测试：路由分发 | 中 | 待开始 | P5-01~P5-07 |

### 6.3 验收标准

- [ ] 简单指令 < 50ms 命中快速通道
- [ ] 复杂句子正确识别意图
- [ ] UNCLEAR 情况正确追问
- [ ] LLM 不可用时正确降级
- [ ] **[V2.9]** 多意图消息正确拆分并顺序执行

---

## 7. Phase 6: 视觉能力（延后）

> ⚠️ **注意**：根据风险评估，视觉能力延后到核心功能稳定后再开发。

### 7.1 目标

- 实现图片识别能力
- 支持知情同意书识别
- 支持 CRF 扫描件识别

### 7.2 任务清单

| 任务ID | 任务名称 | 优先级 | 状态 | 前置依赖 |
|--------|----------|--------|------|----------|
| P6-01 | 评估 GPT-4V / 通义千问-VL | 低 | 延后 | P1~P5 完成 |
| P6-02 | 实现 `VisionService` | 低 | 延后 | P6-01 |
| P6-03 | 集成到 ChatService | 低 | 延后 | P6-02 |
| P6-04 | 端到端测试 | 低 | 延后 | P6-03 |

### 7.3 延后原因

1. 核心功能优先级更高
2. 视觉能力成本较高
3. 需要更多真实场景验证

---

## 8. 里程碑与依赖关系

```mermaid
gantt
    title IIT Manager Agent 开发里程碑
    dateFormat  YYYY-MM-DD
    section Phase 1
    基础工具层           :p1, 2026-02-10, 14d
    section Phase 2
    SOP 引擎 + 热记忆    :p2, after p1, 21d
    section Phase 3
    ReAct 引擎 + 流水账  :p3, after p2, 14d
    section Phase 4
    调度系统 + 历史书    :p4, after p3, 14d
    section Phase 5
    智能路由             :p5, after p4, 7d
    section Phase 6
    视觉能力             :p6, after p5, 14d
```

---

## 9. 风险与对策

| 风险 | 影响 | 对策 | 已整合 |
|------|------|------|--------|
| ReAct 决策链过长 | 延迟 > 10秒 | 流式反馈 + "正在思考" 状态 | ✅ |
| 混合意图难分类 | 用户困惑 | UNCLEAR + 追问机制 | ✅ |
| ReAct 误调写入工具 | 数据风险 | 只读工具白名单 | ✅ |
| UI 无响应感 | 体验差 | 流式反馈 + 状态提示 | ✅ |
| SOP 中途被打断 | 任务丢失 | SUSPENDED 状态 + 恢复机制 | ✅ |
| 视觉能力分散精力 | 核心功能延迟 | 延后到 Phase 6 | ✅ |
| **[V2.9]** 用户多意图混乱 | 任务遗漏 | ReAct Prompt 多意图拆分 | ✅ |
| **[V2.9]** 回复不符用户偏好 | 体验差 | 反馈循环 + 用户画像 | ✅ |
| **[V2.9]** 主动提醒打扰用户 | 用户投诉 | 最佳通知时间 + 个性化 | ✅ |
| **[V2.9.1]** 患者隐私泄露给 LLM | **法律风险** | PII 脱敏中间件 + 审计日志 | ✅ |
| **[V2.9.1]** 字段映射配置繁琐 | 效率低 | AutoMapper LLM 语义匹配 | ✅ |

---

## 10. 性能指标

| 指标 | 目标值 | 测量方法 |
|------|--------|----------|
| 快速通道响应 | < 50ms | 正则匹配耗时 |
| LLM 意图识别 | < 1s | API 调用耗时 |
| SOP 单步执行 | < 2s | 包含工具调用 |
| ReAct 完整推理 | < 10s | 最多 5 轮循环 |
| 流式首字节 | < 2s | 第一个 token |
| 周报生成 | < 30s | 后台任务 |
| 向量检索 | < 500ms | Top-5 结果 |

---

**文档维护人**：AI Agent
**最后更新**：2026-02-05