# SSA-Pro 愿景与开发计划对比分析 > **文档版本:** v1.0 > **创建日期:** 2026-02-20 > **文档目的:** 对比理想愿景与现有开发计划,识别差距,明确下一步方向 --- ## 1. 对比概览 ### 1.1 两份文档的定位 | 文档 | 定位 | 视角 | |------|------|------| | **理想状态与智能化愿景设计** | 目标终态 | 以终为始,用户视角 | | **MVP开发计划总览** | 实施路径 | 工程视角,分阶段交付 | ### 1.2 核心差异一句话总结 | 维度 | 愿景设计 | 开发计划 | |------|----------|----------| | **核心理念** | **规划流程** | **执行方法** | | **执行粒度** | 多方法编排的完整流程 | 单个统计工具的执行 | | **智能表现** | AI 理解意图、诊断数据、规划路径 | 决策表匹配选工具 | --- ## 2. 详细对比分析 ### 2.1 用户交互模式对比 #### 愿景设计的交互 ``` 用户输入: "我有 200 个高血压患者的数据,分成治疗组和对照组, 想比较治疗前后的血压变化,看看新药是否有效。" 系统响应: Step 1: 意图解析 → 识别为"差异比较" Step 2: 数据诊断 → 发现正态性不满足 Step 3: 规划流程 → 生成 6 步 SAP Step 4: 分步执行 → 依次运行 Step 5: 综合结论 → 论文级报告 ``` #### 开发计划的交互 ``` 用户操作: 1. 上传数据 2. 输入分析需求 3. 系统生成计划(选一个工具) 4. 用户确认执行 5. 返回结果 系统响应: - Planner 选择 ST_T_TEST_IND - Executor 执行 T 检验 - 返回 P 值 + 图表 + R 代码 ``` #### 差异分析 | 维度 | 愿景设计 | 开发计划 | 差距 | |------|----------|----------|------| | 用户输入 | 自然语言描述研究问题 | 需要较明确的分析需求 | 中 | | 方法选择 | AI 理解意图 + 数据诊断 | 决策表匹配 | 中 | | 执行粒度 | 6 步完整流程 | 1 个方法 | 🔴 大 | | 输出形式 | 论文级综合报告 | P 值 + 图表 | 🔴 大 | --- ### 2.2 系统架构对比 #### 愿景设计的架构(5 大核心组件) ``` ┌─────────────────┐ │ 1. 意图理解器 │ ← LLM 意图识别 └────────┬────────┘ ↓ ┌─────────────────┐ │ 2. 数据诊断器 │ ← 分布/缺失/异常检测 └────────┬────────┘ ↓ ┌─────────────────┐ │ 3. 路径规划器 │ ← 决策表 + 流程模板 ⭐ └────────┬────────┘ ↓ ┌─────────────────┐ │ 4. 流程执行器 │ ← 多方法编排 ⭐ └────────┬────────┘ ↓ ┌─────────────────┐ │ 5. 结论生成器 │ ← 论文级综合结论 └─────────────────┘ ``` #### 开发计划的架构(Planner + Executor + 配置中台) ``` ┌─────────────────────────────────────────┐ │ Planner (大脑) │ │ Rewriter → 决策表匹配 → Planner → Critic │ └────────────────┬────────────────────────┘ ↓ ┌─────────────────────────────────────────┐ │ Executor (四肢) │ │ 护栏检查 → 核心计算 → 代码生成 │ └────────────────┬────────────────────────┘ ↑ ┌────────────────┴────────────────────────┐ │ 配置中台 (专家知识库) │ │ 决策表 + R代码库 + 参数映射 + 护栏规则 │ └─────────────────────────────────────────┘ ``` #### 架构对比表 | 愿景组件 | 开发计划对应 | 覆盖程度 | 备注 | |----------|-------------|----------|------| | 意图理解器 | Rewriter + 决策表匹配 | 🟡 50% | 开发计划侧重四维匹配,缺少意图追问 | | 数据诊断器 | R 服务内护栏检查 | 🟡 60% | 已有基础,但未独立成模块 | | 路径规划器 | Planner + 决策表 | 🔴 30% | **关键差距:只选单个工具,不规划流程** | | 流程执行器 | Executor | 🔴 20% | **关键差距:只执行单个方法,无编排能力** | | 结论生成器 | Critic | 🟡 50% | 已有解读模板,但缺少综合整合 | --- ### 2.3 核心能力对比 #### 2.3.1 方法选择能力 | 能力 | 愿景设计 | 开发计划 | 是否覆盖 | |------|----------|----------|----------| | 四维匹配 (Goal/Y/X/Design) | ✅ | ✅ | ✅ 已覆盖 | | 意图追问澄清 | ✅ | ❌ | ❌ 未覆盖 | | 基于数据特征调整 | ✅ | ✅ (护栏) | ✅ 已覆盖 | #### 2.3.2 执行能力 | 能力 | 愿景设计 | 开发计划 | 是否覆盖 | |------|----------|----------|----------| | 单方法执行 | ✅ | ✅ | ✅ 已覆盖 | | 护栏检查 | ✅ | ✅ | ✅ 已覆盖 | | 自动降级 (Switch) | ✅ | ✅ | ✅ 已覆盖 | | **多方法编排** | ✅ | ❌ | 🔴 **未覆盖** | | **结果串联** | ✅ | ❌ | 🔴 **未覆盖** | | **分步展示** | ✅ | ❌ | 🔴 **未覆盖** | #### 2.3.3 输出能力 | 能力 | 愿景设计 | 开发计划 | 是否覆盖 | |------|----------|----------|----------| | 统计结果表格 | ✅ | ✅ | ✅ 已覆盖 | | 可视化图表 | ✅ | ✅ | ✅ 已覆盖 | | R 代码下载 | ✅ | ✅ | ✅ 已覆盖 | | 简单解读 | ✅ | ✅ | ✅ 已覆盖 | | **论文级综合结论** | ✅ | ❌ | 🔴 **未覆盖** | | **方法学说明** | ✅ | ❌ | 🔴 **未覆盖** | | **敏感性分析结果** | ✅ | ❌ | 🔴 **未覆盖** | --- ### 2.4 流程模板 vs 单方法执行(关键差距) 这是两份文档最核心的差异。 #### 愿景设计的流程模板 ``` 用户需求: "比较两组疗效差异" 系统规划的完整流程: ┌─────────┬─────────┬─────────┬─────────┬─────────┬─────────┐ │ 1.数据 │ 2.描述 │ 3.假设 │ 4.敏感性│ 5.效应量│ 6.可视化│ │ 预处理 │ 统计 │ 检验 │ 分析 │ │ │ └─────────┴─────────┴─────────┴─────────┴─────────┴─────────┘ ↓ ↓ ↓ ↓ ↓ ↓ 剔除异常 均值±SD T检验 Bootstrap Cohen's d 箱线图 处理缺失 中位数 /Wilcoxon T检验 95%CI ``` #### 开发计划的单方法执行 ``` 用户需求: "比较两组疗效差异" 系统执行: ┌─────────────────────────────────────────┐ │ ST_T_TEST_IND │ │ 护栏检查 → T 检验 → 结果返回 │ └─────────────────────────────────────────┘ ``` #### 差距影响分析 | 缺失的步骤 | 对用户的影响 | 对论文的影响 | |------------|-------------|-------------| | 数据预处理说明 | 不知道剔除了多少数据 | 无法写方法部分 | | 描述性统计 | 缺少基线特征表 | 缺少 Table 1 | | 敏感性分析 | 不知道结果是否稳健 | 审稿人会质疑 | | 效应量计算 | 不知道临床意义 | 缺少临床解读 | --- ## 3. 相同之处 ### 3.1 核心理念一致 | 理念 | 愿景设计 | 开发计划 | |------|----------|----------| | **白盒化** | 用户理解 AI 做了什么 | 执行路径可视化 | | **严谨性** | 统计护栏防止滥用 | 护栏规则链 | | **可交付** | 生成可复现的 R 代码 | 代码下载功能 | ### 3.2 技术选型一致 | 技术 | 愿景设计 | 开发计划 | |------|----------|----------| | Brain-Hand 分离 | ✅ | ✅ | | LLM + R 服务 | ✅ | ✅ | | 四维匹配 (Goal/Y/X/Design) | ✅ | ✅ | | 护栏检查 | ✅ | ✅ | | 代码生成 | ✅ | ✅ | ### 3.3 配置中台的价值 配置中台在两份文档中都被认可: | 配置项 | 愿景设计中的作用 | 开发计划中的作用 | |--------|-----------------|-----------------| | 决策表 | 方法选择的依据 | 工具匹配的规则 | | 流程模板 | **规划完整分析流程** | ❌ 未涉及 | | 护栏规则 | 数据自适应 | Block/Warn/Switch | | 解读模板 | 论文级结论生成 | 结果解读 | --- ## 4. 能否达到理想状态? ### 4.1 结论:按现有计划执行,**无法达到理想状态** | 理想目标 | 现有计划能否达成 | 原因 | |----------|-----------------|------| | AI 理解用户意图 | 🟡 部分 | 有决策表匹配,但缺少意图追问 | | 数据自动诊断 | 🟡 部分 | R 服务内有护栏,但未独立呈现 | | 规划完整分析流程 | 🔴 无法 | **计划只做单方法选择,无流程模板** | | 多方法编排执行 | 🔴 无法 | **计划只做单方法执行,无编排能力** | | 论文级综合报告 | 🔴 无法 | **计划只做简单解读,无综合整合** | ### 4.2 根本原因分析 现有开发计划的核心思路是: ``` 配置中台 → 支撑 10 个工具的可配置化 → 扩展更多方法 ``` 但理想状态需要的是: ``` 流程引擎 → 将多个方法编排成完整分析流程 → 真正的智能化 ``` **配置中台是基础设施,但不是智能化的核心。** --- ## 5. 还缺什么? ### 5.1 缺失的核心组件 | 组件 | 功能 | 开发计划中是否有 | |------|------|-----------------| | **流程模板定义** | 定义"差异比较流程"包含哪些步骤 | ❌ 完全没有 | | **流程执行引擎** | 按顺序编排多个方法执行 | ❌ 完全没有 | | **结果串联器** | 上一步输出作为下一步输入 | ❌ 完全没有 | | **综合结论生成器** | 整合多步结果生成完整报告 | ❌ 完全没有 | | **意图追问模块** | 不确定时向用户澄清 | ❌ 完全没有 | ### 5.2 需要增强的组件 | 组件 | 当前状态 | 需要增强 | |------|----------|----------| | 数据诊断器 | R 服务内部 | 提取为独立模块,前端可视化展示 | | Planner 输出 | 输出 tool_code | 输出 workflow_steps[] | | 结论生成 | 简单解读 | 论文级模板 + 方法学说明 | ### 5.3 差距可视化 ``` ┌─────────────────────────────────────────────────────────────┐ │ 理想状态 (100%) │ ├─────────────────────────────────────────────────────────────┤ │ ████████████████████████████████████████████████████████████│ │ 意图理解 │ 数据诊断 │ 流程规划 │ 流程执行 │ 综合结论 │ │ 10% │ 10% │ 25% │ 25% │ 30% │ └─────────────────────────────────────────────────────────────┘ ┌─────────────────────────────────────────────────────────────┐ │ 开发计划覆盖 (~40%) │ ├─────────────────────────────────────────────────────────────┤ │ ██████████████████████████ │ │ 意图理解 │ 数据诊断 │ 流程规划 │ 流程执行 │ 综合结论 │ │ ✅ 5% │ ✅ 6% │ ❌ 8% │ ❌ 5% │ ✅ 15% │ │ 决策表 │ 护栏 │ 只选工具│ 单方法 │ 简单解读 │ └─────────────────────────────────────────────────────────────┘ 未覆盖部分 (~60%): - 流程规划:17% (流程模板定义) - 流程执行:20% (多方法编排、结果串联) - 综合结论:15% (论文级报告、方法学说明) - 意图理解:5% (追问澄清) - 数据诊断:4% (独立展示) ``` --- ## 6. 建议的调整方向 ### 6.1 重新定义开发重点 | 原计划重点 | 建议调整为 | |------------|-----------| | 配置中台完善 | 流程引擎建设 | | 10 个工具量产 | 先做好 2-3 个完整流程 | | 专家配置体系 | 流程模板 + 方法编排 | ### 6.2 建议的新 Phase 规划 ``` Phase 1.5: 流程引擎 MVP(建议新增) ├── 1. 定义流程模板数据结构 ├── 2. 实现流程执行引擎(多方法编排) ├── 3. 实现结果串联(上一步 → 下一步) ├── 4. 前端展示分步进度 └── 5. 验证:一个完整的"两组差异比较"流程 Phase 2: 智能规划(调整) ├── 原:决策表驱动规划 ├── 新:决策表 → 选择流程模板 → 生成完整 SAP └── 新:意图追问模块 Phase 3: 完善与扩展(调整) ├── 原:10 个工具 └── 新:3-5 个完整分析流程 ``` ### 6.3 流程模板示例 ```typescript // 流程模板数据结构 interface WorkflowTemplate { id: string; name: string; // "两组差异比较" applicableTo: { // 适用条件 goal: 'Difference'; yType: 'Continuous'; xType: 'Categorical_2'; }; steps: WorkflowStep[]; } interface WorkflowStep { stepId: string; name: string; // "正态性检验" toolCode: string; // "ST_SHAPIRO" 或 "ST_T_TEST_IND" isConditional: boolean; // 是否有条件分支 conditions?: { // 条件分支 if: string; // "shapiro.pValue < 0.05" then: string; // "ST_MANN_WHITNEY" else: string; // "ST_T_TEST_IND" }; inputFrom?: string; // 上一步的输出作为输入 } ``` ### 6.4 投入产出分析 | 投入 | 预估工时 | 产出价值 | |------|----------|----------| | 流程模板定义 | 2-3 天 | 从单方法到完整流程的跨越 | | 流程执行引擎 | 5-7 天 | 多方法编排能力 | | 结果串联 | 2-3 天 | 数据在步骤间流转 | | 综合结论生成 | 3-5 天 | 论文级报告输出 | | **总计** | **12-18 天** | **达到理想状态的 80%** | --- ## 7. 总结 ### 7.1 核心结论 1. **理想状态 ≠ 配置中台**:配置中台是基础设施,不是智能化的核心。 2. **核心差距是"流程编排"**:现有计划是"单方法执行",理想状态是"多方法编排"。 3. **按现有计划无法达到理想状态**:缺少流程模板、流程引擎、结果串联、综合结论。 4. **需要新增 Phase 1.5**:在 Phase 2 之前,先建设"流程引擎"。 ### 7.2 行动建议 | 优先级 | 行动 | 说明 | |--------|------|------| | P0 | 暂停配置中台开发 | 配置中台是锦上添花,不是雪中送炭 | | P0 | 设计流程模板数据结构 | 这是一切的基础 | | P0 | 实现流程执行引擎 | 让多个方法能够串联执行 | | P1 | 实现一个完整流程 | "两组差异比较"从头到尾 | | P2 | 扩展更多流程模板 | 基于成功经验复制 | ### 7.3 一句话总结 > **现有开发计划做的是"让 10 个工具都能用", > 但理想状态需要的是"让 1 个分析流程足够智能"。** > > **方向不同,结果自然不同。** --- ## 8. 附录 ### 8.1 相关文档 | 文档 | 路径 | |------|------| | 理想状态与智能化愿景设计 | `00-系统设计/SSA-Pro 理想状态与智能化愿景设计.md` | | MVP 开发计划总览 | `04-开发计划/00-MVP开发计划总览.md` | | 任务清单与进度追踪 | `04-开发计划/01-任务清单与进度追踪.md` | | 架构设计方案 V4 | `00-系统设计/SSA-Pro 严谨型智能统计分析架构设计方案V4.md` | ### 8.2 术语对照 | 愿景设计术语 | 开发计划术语 | 含义 | |-------------|-------------|------| | 流程模板 | - | 预定义的多步骤分析流程 | | 流程执行器 | Executor | 执行引擎(计划只执行单方法) | | 路径规划器 | Planner | 选择工具/流程(计划只选工具) | | 综合结论 | Critic | 结果解读(计划是简单解读) | --- **文档维护者:** SSA 架构团队 **创建日期:** 2026-02-20 **版本:** v1.0