Files
AIclinicalresearch/docs/03-业务模块/IIT Manager Agent/04-开发计划/05-开发阶段与任务清单.md
HaHafeng 0c590854b5 docs(iit): Add IIT Manager Agent V2.9 development plan with multi-agent architecture
Features:
- Add V2.9 enhancements: Cron Skill, User Profiling, Feedback Loop, Multi-Intent Handling
- Create modular development plan documents (database, engines, services, memory, tasks)
- Add V2.5/V2.6/V2.8/V2.9 design documents for architecture evolution
- Add system design white papers and implementation guides

Architecture:
- Dual-Brain Architecture (SOP + ReAct engines)
- Three-layer memory system (Flow Log, Hot Memory, History Book)
- ProfilerService for personalized responses
- SchedulerService with Cron Skill support

Also includes:
- Frontend nginx config updates
- Backend test scripts for WeChat signature
- Database backup files

Co-authored-by: Cursor <cursoragent@cursor.com>
2026-02-05 22:33:26 +08:00

282 lines
11 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# IIT Manager Agent 开发阶段与任务清单
> **版本:** V2.9
> **更新日期:** 2026-02-05
> **关联文档:** [IIT Manager Agent V2.6 综合开发计划](./IIT%20Manager%20Agent%20V2.6%20综合开发计划.md)
>
> **V2.9 更新**
> - Phase 3 新增反馈循环任务
> - Phase 4 新增 ProfilerService 和 Cron Skill 任务
> - Phase 5 新增多意图处理任务
---
## 1. 开发阶段总览
```
Phase 1 Phase 2 Phase 3 Phase 4 Phase 5 Phase 6
┌─────────────┐ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐
│ 基础工具层 │ ──▶ │ SOP 引擎 │ ──▶ │ ReAct 引擎 │ ──▶ │ 调度系统 │ ──▶ │ 智能路由 │ ──▶ │ 视觉能力 │
│ │ │ + 记忆L2 │ │ + 记忆L1 │ │ + 记忆L3 │ │ │ │ (延后) │
└─────────────┘ └─────────────┘ └─────────────┘ └─────────────┘ └─────────────┘ └─────────────┘
▼ ▼ ▼ ▼ ▼ ▼
ToolsService SopEngine ReActEngine SchedulerService IntentService VisionService
FieldMapping HotMemory FlowMemory WeeklyReports MixedRouting (Postponed)
HardRuleEngine SoftRuleEngine AgentTrace ReportService StreamingFB
```
---
## 2. Phase 1: 基础工具层
### 2.1 目标
- 搭建可复用的工具框架
- 实现字段映射机制
- 建立硬规则引擎
### 2.2 任务清单
| 任务ID | 任务名称 | 优先级 | 状态 | 前置依赖 |
|--------|----------|--------|------|----------|
| P1-01 | 创建 `iit_skills` 表 | 高 | 待开始 | - |
| P1-02 | 创建 `iit_field_mapping` 表 | 高 | 待开始 | - |
| P1-03 | 实现 `ToolsService` | 高 | 待开始 | P1-01 |
| P1-04 | 实现 `read_clinical_data` 工具 | 高 | 待开始 | P1-03 |
| P1-05 | 实现 `search_protocol` 工具 | 高 | 待开始 | P1-03 |
| P1-06 | 实现 `HardRuleEngine` | 高 | 待开始 | - |
| P1-07 | 集成字段映射到 ToolsService | 中 | 待开始 | P1-02, P1-03 |
| P1-08 | 单元测试覆盖 | 中 | 待开始 | P1-01~P1-07 |
### 2.3 验收标准
- [ ] 工具可通过名称调用
- [ ] 字段映射正确生效LLM 用 "年龄" → 实际调用 "dem_age"
- [ ] 硬规则拦截生效
- [ ] 测试覆盖率 > 80%
---
## 3. Phase 2: SOP 引擎 + 热记忆
### 3.1 目标
- 实现状态机驱动的 SOP 执行
- 搭建热记忆层L2
- 支持人工确认机制
### 3.2 任务清单
| 任务ID | 任务名称 | 优先级 | 状态 | 前置依赖 |
|--------|----------|--------|------|----------|
| P2-01 | 创建 `iit_task_run` 表 | 高 | 待开始 | - |
| P2-02 | 创建 `iit_pending_actions` 表 | 高 | 待开始 | - |
| P2-03 | 创建 `iit_project_memory` 表 | 高 | 待开始 | - |
| P2-04 | 实现 `SopEngine` 核心状态机 | 高 | 待开始 | P2-01 |
| P2-05 | 实现 `SoftRuleEngine` | 高 | 待开始 | - |
| P2-06 | 集成 SoftRuleEngine 到 SOP | 高 | 待开始 | P2-04, P2-05 |
| P2-07 | 实现 SUSPENDED 状态机制 | 高 | 待开始 | P2-04 |
| P2-08 | 实现人工确认流程 | 高 | 待开始 | P2-02, P2-07 |
| P2-09 | 实现 `MemoryService` 热记忆 | 中 | 待开始 | P2-03 |
| P2-10 | 集成热记忆到 SOP 上下文 | 中 | 待开始 | P2-04, P2-09 |
| P2-11 | 端到端测试:质控 SOP | 中 | 待开始 | P2-01~P2-10 |
### 3.3 验收标准
- [ ] 质控任务可自动执行完整 SOP
- [ ] 写操作正确等待人工确认
- [ ] SUSPENDED 状态正确持久化
- [ ] 热记忆正确注入 SOP 上下文
- [ ] 手动恢复执行成功
---
## 4. Phase 3: ReAct 引擎 + 流水账
### 4.1 目标
- 实现 ReAct 模式的灵活查询
- 搭建流水账层L1
- 实现只读安全约束
### 4.2 任务清单
| 任务ID | 任务名称 | 优先级 | 状态 | 前置依赖 |
|--------|----------|--------|------|----------|
| P3-01 | 创建 `iit_conversation_history` 表 | 高 | 待开始 | - |
| P3-02 | 创建 `iit_agent_trace` 表 | 中 | 待开始 | - |
| P3-03 | 实现 `ReActEngine` 核心循环 | 高 | 待开始 | P1-03 |
| P3-04 | 实现只读工具白名单 | 高 | 待开始 | P3-03 |
| P3-05 | 实现 `MemoryService` 流水账 | 高 | 待开始 | P3-01 |
| P3-06 | 实现向量化存储pgvector | 中 | 待开始 | P3-05 |
| P3-07 | 实现相似度检索 | 中 | 待开始 | P3-06 |
| P3-08 | 实现 Trace 记录机制 | 中 | 待开始 | P3-02, P3-03 |
| P3-09 | 实现流式反馈机制 | 高 | 待开始 | P3-03 |
| P3-10 | 实现 "正在思考" 状态提示 | 中 | 待开始 | P3-09 |
| P3-11 | 集成流水账到 ReAct 上下文 | 中 | 待开始 | P3-03, P3-05 |
| P3-12 | **[V2.9]** 扩展对话表支持反馈字段 | 中 | 待开始 | P3-01 |
| P3-13 | **[V2.9]** 实现反馈收集接口 | 中 | 待开始 | P3-12 |
| P3-14 | 端到端测试:模糊查询 | 中 | 待开始 | P3-01~P3-13 |
### 4.3 验收标准
- [ ] ReAct 可正确推理并调用工具
- [ ] 只读约束生效(无法调用写入工具)
- [ ] 流水账正确存储和检索
- [ ] Trace 记录可供调试
- [ ] 流式反馈 < 2秒首字节
- [ ] "正在思考" 状态正确显示
- [ ] **[V2.9]** 反馈按钮可正确收集用户反馈
---
## 5. Phase 4: 调度系统 + 历史书
### 5.1 目标
- 实现定时任务调度
- 实现周报生成
- 搭建历史书层L3
### 5.2 任务清单
| 任务ID | 任务名称 | 优先级 | 状态 | 前置依赖 |
|--------|----------|--------|------|----------|
| P4-01 | 创建 `iit_weekly_reports` 表 | 高 | 待开始 | - |
| P4-02 | 实现 `SchedulerService`pg-boss | 高 | 待开始 | - |
| P4-03 | 实现 `ReportService` | 高 | 待开始 | P4-01 |
| P4-04 | 实现周报自动生成 | 高 | 待开始 | P4-02, P4-03 |
| P4-05 | 实现记忆卷叠机制 | 中 | 待开始 | P4-01, P3-05 |
| P4-06 | 实现历史书检索 | 中 | 待开始 | P4-01 |
| P4-07 | 集成历史书到上下文组装 | 中 | 待开始 | P4-06 |
| P4-08 | **[V2.9]** 实现 `ProfilerService` | 中 | 待开始 | P2-03 |
| P4-09 | **[V2.9]** 扩展 Skill 表支持 Cron 触发 | 中 | 待开始 | P1-01 |
| P4-10 | **[V2.9]** 实现 Cron Skill 调度 | 中 | 待开始 | P4-02, P4-09 |
| P4-11 | **[V2.9]** 实现访视提醒 Skill | 中 | 待开始 | P4-10 |
| P4-12 | **[V2.9]** 集成用户画像到通知个性化 | 低 | 待开始 | P4-08, P4-11 |
| P4-13 | 端到端测试:周报生成 | 中 | 待开始 | P4-01~P4-12 |
### 5.3 验收标准
- [ ] 周报每周一自动生成
- [ ] 记忆卷叠每日自动执行
- [ ] 历史书检索正确召回
- [ ] **[V2.9]** 用户画像正确存储在 project_memory
- [ ] **[V2.9]** Cron Skill 按时触发
- [ ] **[V2.9]** 访视提醒正确发送给目标用户
---
## 6. Phase 5: 智能路由
### 6.1 目标
- 实现意图识别服务
- 实现混合路由(正则 + LLM
- 实现追问机制
### 6.2 任务清单
| 任务ID | 任务名称 | 优先级 | 状态 | 前置依赖 |
|--------|----------|--------|------|----------|
| P5-01 | 实现 `IntentService` | 高 | 待开始 | - |
| P5-02 | 实现正则快速通道 | 高 | 待开始 | P5-01 |
| P5-03 | 实现 LLM 意图识别 | 高 | 待开始 | P5-01 |
| P5-04 | 实现降级策略 | 中 | 待开始 | P5-01~P5-03 |
| P5-05 | 实现追问机制 | 中 | 待开始 | P5-01 |
| P5-06 | 扩展 `ChatService` 集成路由 | 高 | 待开始 | P5-01~P5-05 |
| P5-07 | **[V2.9]** 优化 ReAct Prompt 支持多意图 | 中 | 待开始 | P3-03 |
| P5-08 | 端到端测试:路由分发 | 中 | 待开始 | P5-01~P5-07 |
### 6.3 验收标准
- [ ] 简单指令 < 50ms 命中快速通道
- [ ] 复杂句子正确识别意图
- [ ] UNCLEAR 情况正确追问
- [ ] LLM 不可用时正确降级
- [ ] **[V2.9]** 多意图消息正确拆分并顺序执行
---
## 7. Phase 6: 视觉能力(延后)
> ⚠️ **注意**:根据风险评估,视觉能力延后到核心功能稳定后再开发。
### 7.1 目标
- 实现图片识别能力
- 支持知情同意书识别
- 支持 CRF 扫描件识别
### 7.2 任务清单
| 任务ID | 任务名称 | 优先级 | 状态 | 前置依赖 |
|--------|----------|--------|------|----------|
| P6-01 | 评估 GPT-4V / 通义千问-VL | 低 | 延后 | P1~P5 完成 |
| P6-02 | 实现 `VisionService` | 低 | 延后 | P6-01 |
| P6-03 | 集成到 ChatService | 低 | 延后 | P6-02 |
| P6-04 | 端到端测试 | 低 | 延后 | P6-03 |
### 7.3 延后原因
1. 核心功能优先级更高
2. 视觉能力成本较高
3. 需要更多真实场景验证
---
## 8. 里程碑与依赖关系
```mermaid
gantt
title IIT Manager Agent 开发里程碑
dateFormat YYYY-MM-DD
section Phase 1
基础工具层 :p1, 2026-02-10, 14d
section Phase 2
SOP 引擎 + 热记忆 :p2, after p1, 21d
section Phase 3
ReAct 引擎 + 流水账 :p3, after p2, 14d
section Phase 4
调度系统 + 历史书 :p4, after p3, 14d
section Phase 5
智能路由 :p5, after p4, 7d
section Phase 6
视觉能力 :p6, after p5, 14d
```
---
## 9. 风险与对策
| 风险 | 影响 | 对策 | 已整合 |
|------|------|------|--------|
| ReAct 决策链过长 | 延迟 > 10秒 | 流式反馈 + "正在思考" 状态 | ✅ |
| 混合意图难分类 | 用户困惑 | UNCLEAR + 追问机制 | ✅ |
| ReAct 误调写入工具 | 数据风险 | 只读工具白名单 | ✅ |
| UI 无响应感 | 体验差 | 流式反馈 + 状态提示 | ✅ |
| SOP 中途被打断 | 任务丢失 | SUSPENDED 状态 + 恢复机制 | ✅ |
| 视觉能力分散精力 | 核心功能延迟 | 延后到 Phase 6 | ✅ |
| **[V2.9]** 用户多意图混乱 | 任务遗漏 | ReAct Prompt 多意图拆分 | ✅ |
| **[V2.9]** 回复不符用户偏好 | 体验差 | 反馈循环 + 用户画像 | ✅ |
| **[V2.9]** 主动提醒打扰用户 | 用户投诉 | 最佳通知时间 + 个性化 | ✅ |
---
## 10. 性能指标
| 指标 | 目标值 | 测量方法 |
|------|--------|----------|
| 快速通道响应 | < 50ms | 正则匹配耗时 |
| LLM 意图识别 | < 1s | API 调用耗时 |
| SOP 单步执行 | < 2s | 包含工具调用 |
| ReAct 完整推理 | < 10s | 最多 5 轮循环 |
| 流式首字节 | < 2s | 第一个 token |
| 周报生成 | < 30s | 后台任务 |
| 向量检索 | < 500ms | Top-5 结果 |
---
**文档维护人**AI Agent
**最后更新**2026-02-05