# **产品需求文档 (PRD): 研究方案制定智能体 (Protocol Agent) & AIA 基础平台** 文档版本: v1.0 状态: Final Draft 日期: 2026-01-20 项目代号: AIA-Protocol-V3 核心理念: Plan-Execute-Reflexion (规划-执行-反思) | Backend-Driven SOP (后端驱动) | Deep Link Action (深度链接) ## **1\. 项目背景与目标 (Background & Goals)** ### **1.1 背景** 当前 AIA 模块包含 7 个独立运行的 AI 问答工具(科学问题、PICO、选题评价等)。这种“散点式”的交互导致用户体验割裂,上下文(Context)无法流转,且缺乏对复杂逻辑(如样本量计算)的深度支持。 ### **1.2 核心目标** 1. **统一入口 (Unified Entry)**:将 7 个模块整合为一个 **Protocol Agent**,通过自然语言对话引导用户完成全流程。 2. **长程记忆 (Long-term Memory)**:利用结构化数据 (JSONB) 维护一份“活的”研究方案,突破 LLM Context 限制。 3. **专业深度 (Professional Depth)**:引入 **自建知识库 (EKB)** 和 **后端配置化思维链 (CoT)**,确保输出符合医学逻辑。 4. **平台化基石 (Platform Foundation)**:沉淀一套通用的 Agent 开发框架 (AIA-OS),为未来的统计、清洗 Agent 打下地基。 ## **2\. 产品核心理念:仿生架构 (The Bionic Architecture)** 产品设计严格遵循 **"Brain-Memory-Knowledge-Hands"** 四位一体架构: | 组件 | 对应系统模块 | 核心职责 | | :---- | :---- | :---- | | **🧠 大脑 (Brain)** | **Orchestrator Engine** | 负责意图识别 (Router)、流程规划 (Plan)、思维链执行 (SOP) 和结果反思 (Reflexion)。 | | **💾 记忆 (Memory)** | **ProtocolContext (DB)** | 存储结构化的方案数据(PICO、N值、指标),实现跨会话、跨工具的状态同步。 | | **📚 知识 (Knowledge)** | **EKB (Self-built RAG)** | 基于 Postgres 的混合检索系统,提供 RCT 案例、指南、评分标准等外部知识。 | | **🛠️ 手脚 (Hands)** | **Deep Link Action** | 通过 **Action Card** 协议唤起现有的 Web 工具(样本量计算器、清洗工具),并回写结果。 | ## **3\. 用户流程 (User Journey)** ### **3.1 典型交互路径** 1. **意图识别**:用户输入“我想做一个阿司匹林的研究”。 * *Brain*: 识别为 SCIENTIFIC\_QUESTION 阶段,加载对应 SOP。 2. **多轮对话 (Plan)**:AI 引导用户完善 PICO 信息。 * *Memory*: 实时提取 P, I, C, O 并存入数据库。 * *UI*: 右侧 **状态面板 (State Panel)** 实时点亮已确认的字段。 3. **工具执行 (Execute)**:用户确认 PICO 后,AI 判断需要计算样本量。 * *Brain*: 生成 Action Card。 * *UI*: 聊天窗显示“🚀 前往计算样本量”卡片。 * *Hands*: 用户点击跳转 \-\> 在工具页完成计算 \-\> 点击“同步”。 4. **反思校验 (Reflexion)**:数据回写后。 * *Brain*: 触发后端校验规则(如 N \< 20)。 * *UI*: AI 发送消息:“⚠️ 样本量过小,建议重新调整 Alpha 值。” 5. **阶段流转**:校验通过后,自动进入下一阶段(观察指标设计)。 ## **4\. 功能需求详情 (Functional Requirements)** ### **4.1 核心交互界面 (Unified Interface)** #### **F1. 流式对话窗口 (Chat Interface)** * **支持格式**:Markdown, Latex, **XML Thinking Block** (深度思考折叠区)。 * **Action Card 渲染**:识别后端返回的 type: action\_card JSON,渲染为操作卡片。 * **Reflexion 反馈**:识别系统级通知(System Message),以特殊样式(如紫色边框)展示 AI 的反思结果。 #### **F2. 实时状态面板 (Protocol State Panel)** * **位置**:屏幕右侧(桌面端)/ 抽屉式(移动端)。 * **数据源**:实时订阅 ProtocolContext.data。 * **展示内容**: * 科学问题 (Text) * PICO (Table) * 样本量 (Highlight Number) * 核心指标 (Tags) * **交互**:支持用户**手动编辑**面板内容,编辑结果优先级高于 AI 提取。 ### **4.2 编排引擎 (Orchestrator Backend)** #### **F3. 动态 SOP 编排 (Backend CoT)** * **机制**:从数据库 prompt\_templates.chain\_config 加载 SOP 步骤。 * **执行**:将 SOP 编译为 System Prompt,强制 AI 输出 XML 思考标签。 * **配置项**:支持在 Admin 后台配置 Step 顺序、指令内容、输出 Key。 #### **F4. 反思卫士 (Reflexion Guard)** * **触发时机**:工具回写数据后、阶段切换前。 * **校验逻辑**: * **硬规则**:N \< 10 (Fail), Power \< 0.8 (Warning)。 * **软规则**:Prompt-based check ("检查对照组设置是否符合伦理?")。 ### **4.3 知识库集成 (EKB Integration)** #### **F5. 混合检索 (Hybrid Search)** * **场景**:选题评价、指标设计。 * **逻辑**: * SQL 过滤:WHERE study\_design-\>\>'sample\_size' \> 500。 * Vector 检索:ORDER BY embedding \<=\> query。 * Rerank:调用重排序模型取 Top 3。 ### **4.4 工具集成 (Deep Link)** #### **F6. 通用回写协议 (Universal Sync API)** * **API**: POST /api/v1/aia/context/:id/sync * **Payload**: { "agent\_type": "PROTOCOL", "key": "sample\_size", "value": {...} } * **工具端改造**:现有样本量计算器需支持解析 URL 参数 (?ctx\_id=...) 并在计算完成后调用回写 API。 ## **5\. 后端配置与运营 (LLM Ops)** 为了支持“后端配置化”,需要构建一个简易的运营后台。 ### **5.1 配置管理** * **全局配置**:Base Persona, Memory Schema。 * **阶段配置**:7 个阶段的 Prompt, SOP (JSON Array), Reflexion Rules。 ### **5.2 可观测性 (Trace)** * **会话回放**:查看每一次 Router 决策、CoT 思考过程、Tool 调用结果。 * **Bad Case 修正**:基于 Trace ID 快速定位问题,调整 Prompt 后一键重测。 ## **6\. 平台化扩展策略 (Platform Strategy)** 本项目的交付物不仅仅是一个 Agent,而是一套 **AIA-OS 规范**。 ### **6.1 通用能力抽象** * **Context Interface**:定义 IContext 接口,未来支持 StatsContext (统计)、CleaningContext (清洗)。 * **Action Card Protocol**:action\_card JSON 结构在所有 Agent 中通用。 * **Orchestrator Core**:状态机引擎与业务逻辑解耦,未来只需编写不同的 Config 即可生成新 Agent。 ## **7\. 技术架构 (Technical Architecture)** * **前端**:React 19 \+ Ant Design X \+ Tailwind CSS * **后端**:Node.js (Fastify) * **语言**:TypeScript (全栈) * **数据库**:PostgreSQL 15+ (pgvector 插件) * **ORM**:Prisma (Schema-first) * **异步队列**:pg-boss (处理耗时任务如 PDF 解析、结构化提取) * **模型层**:OpenAI Compatible API (DeepSeek/Qwen) ## **8\. 实施路线图 (Roadmap)** ### **Phase 1: 核心骨架 (Week 1\)** * \[后端\] 建立 protocol\_contexts 和 prompt\_templates (含 CoT 字段) 表。 * \[后端\] 实现 ProtocolOrchestrator 基础状态机。 * \[前端\] 搭建 Chat \+ State Panel 布局。 ### **Phase 2: 智能增强 (Week 2\)** * \[后端\] 实现动态 CoT 组装与 XML 解析。 * \[后端\] 集成 EKB V2 混合检索服务。 * \[后端\] 实现异步 PICO 提取 Worker。 ### **Phase 3: 闭环打通 (Week 3\)** * \[前端\] 开发 Action Card 组件。 * \[工具\] 改造样本量计算器,支持 Deep Link 回写。 * \[后端\] 实现 Reflexion Guard 校验逻辑。 * \[Ops\] 上线简易配置后台 (Admin UI)。