AIclinicalresearch/docs/03-业务模块/SSA-智能统计分析/00-系统设计/SSA-Pro 愿景与开发计划对比分析.md

# SSA-Pro 愿景与开发计划对比分析

> **文档版本：** v1.0
> **创建日期：** 2026-02-20
> **文档目的：** 对比理想愿景与现有开发计划，识别差距，明确下一步方向

---

## 1. 对比概览

### 1.1 两份文档的定位

| 文档 | 定位 | 视角 |
|------|------|------|
| **理想状态与智能化愿景设计** | 目标终态 | 以终为始，用户视角 |
| **MVP开发计划总览** | 实施路径 | 工程视角，分阶段交付 |

### 1.2 核心差异一句话总结

| 维度 | 愿景设计 | 开发计划 |
|------|----------|----------|
| **核心理念** | **规划流程** | **执行方法** |
| **执行粒度** | 多方法编排的完整流程 | 单个统计工具的执行 |
| **智能表现** | AI 理解意图、诊断数据、规划路径 | 决策表匹配选工具 |

---

## 2. 详细对比分析

### 2.1 用户交互模式对比

#### 愿景设计的交互

```
用户输入：
"我有 200 个高血压患者的数据，分成治疗组和对照组，
 想比较治疗前后的血压变化，看看新药是否有效。"

系统响应：
Step 1: 意图解析 → 识别为"差异比较"
Step 2: 数据诊断 → 发现正态性不满足
Step 3: 规划流程 → 生成 6 步 SAP
Step 4: 分步执行 → 依次运行
Step 5: 综合结论 → 论文级报告
```

#### 开发计划的交互

```
用户操作：
1. 上传数据
2. 输入分析需求
3. 系统生成计划（选一个工具）
4. 用户确认执行
5. 返回结果

系统响应：
- Planner 选择 ST_T_TEST_IND
- Executor 执行 T 检验
- 返回 P 值 + 图表 + R 代码
```

#### 差异分析

| 维度 | 愿景设计 | 开发计划 | 差距 |
|------|----------|----------|------|
| 用户输入 | 自然语言描述研究问题 | 需要较明确的分析需求 | 中 |
| 方法选择 | AI 理解意图 + 数据诊断 | 决策表匹配 | 中 |
| 执行粒度 | 6 步完整流程 | 1 个方法 | 🔴 大 |
| 输出形式 | 论文级综合报告 | P 值 + 图表 | 🔴 大 |

---

### 2.2 系统架构对比

#### 愿景设计的架构（5 大核心组件）

```
┌─────────────────┐
│ 1. 意图理解器   │ ← LLM 意图识别
└────────┬────────┘
         ↓
┌─────────────────┐
│ 2. 数据诊断器   │ ← 分布/缺失/异常检测
└────────┬────────┘
         ↓
┌─────────────────┐
│ 3. 路径规划器   │ ← 决策表 + 流程模板 ⭐
└────────┬────────┘
         ↓
┌─────────────────┐
│ 4. 流程执行器   │ ← 多方法编排 ⭐
└────────┬────────┘
         ↓
┌─────────────────┐
│ 5. 结论生成器   │ ← 论文级综合结论
└─────────────────┘
```

#### 开发计划的架构（Planner + Executor + 配置中台）

```
┌─────────────────────────────────────────┐
│              Planner (大脑)              │
│  Rewriter → 决策表匹配 → Planner → Critic │
└────────────────┬────────────────────────┘
                 ↓
┌─────────────────────────────────────────┐
│              Executor (四肢)             │
│  护栏检查 → 核心计算 → 代码生成          │
└────────────────┬────────────────────────┘
                 ↑
┌────────────────┴────────────────────────┐
│         配置中台 (专家知识库)            │
│  决策表 + R代码库 + 参数映射 + 护栏规则  │
└─────────────────────────────────────────┘
```

#### 架构对比表

| 愿景组件 | 开发计划对应 | 覆盖程度 | 备注 |
|----------|-------------|----------|------|
| 意图理解器 | Rewriter + 决策表匹配 | 🟡 50% | 开发计划侧重四维匹配，缺少意图追问 |
| 数据诊断器 | R 服务内护栏检查 | 🟡 60% | 已有基础，但未独立成模块 |
| 路径规划器 | Planner + 决策表 | 🔴 30% | **关键差距：只选单个工具，不规划流程** |
| 流程执行器 | Executor | 🔴 20% | **关键差距：只执行单个方法，无编排能力** |
| 结论生成器 | Critic | 🟡 50% | 已有解读模板，但缺少综合整合 |

---

### 2.3 核心能力对比

#### 2.3.1 方法选择能力

| 能力 | 愿景设计 | 开发计划 | 是否覆盖 |
|------|----------|----------|----------|
| 四维匹配 (Goal/Y/X/Design) | ✅ | ✅ | ✅ 已覆盖 |
| 意图追问澄清 | ✅ | ❌ | ❌ 未覆盖 |
| 基于数据特征调整 | ✅ | ✅ (护栏) | ✅ 已覆盖 |

#### 2.3.2 执行能力

| 能力 | 愿景设计 | 开发计划 | 是否覆盖 |
|------|----------|----------|----------|
| 单方法执行 | ✅ | ✅ | ✅ 已覆盖 |
| 护栏检查 | ✅ | ✅ | ✅ 已覆盖 |
| 自动降级 (Switch) | ✅ | ✅ | ✅ 已覆盖 |
| **多方法编排** | ✅ | ❌ | 🔴 **未覆盖** |
| **结果串联** | ✅ | ❌ | 🔴 **未覆盖** |
| **分步展示** | ✅ | ❌ | 🔴 **未覆盖** |

#### 2.3.3 输出能力

| 能力 | 愿景设计 | 开发计划 | 是否覆盖 |
|------|----------|----------|----------|
| 统计结果表格 | ✅ | ✅ | ✅ 已覆盖 |
| 可视化图表 | ✅ | ✅ | ✅ 已覆盖 |
| R 代码下载 | ✅ | ✅ | ✅ 已覆盖 |
| 简单解读 | ✅ | ✅ | ✅ 已覆盖 |
| **论文级综合结论** | ✅ | ❌ | 🔴 **未覆盖** |
| **方法学说明** | ✅ | ❌ | 🔴 **未覆盖** |
| **敏感性分析结果** | ✅ | ❌ | 🔴 **未覆盖** |

---

### 2.4 流程模板 vs 单方法执行（关键差距）

这是两份文档最核心的差异。

#### 愿景设计的流程模板

```
用户需求: "比较两组疗效差异"

系统规划的完整流程:
┌─────────┬─────────┬─────────┬─────────┬─────────┬─────────┐
│ 1.数据  │ 2.描述  │ 3.假设  │ 4.敏感性│ 5.效应量│ 6.可视化│
│ 预处理  │ 统计    │ 检验    │ 分析    │         │         │
└─────────┴─────────┴─────────┴─────────┴─────────┴─────────┘
    ↓         ↓         ↓         ↓         ↓         ↓
  剔除异常  均值±SD   T检验    Bootstrap  Cohen's d  箱线图
  处理缺失  中位数    /Wilcoxon  T检验     95%CI
```

#### 开发计划的单方法执行

```
用户需求: "比较两组疗效差异"

系统执行:
┌─────────────────────────────────────────┐
│           ST_T_TEST_IND                 │
│  护栏检查 → T 检验 → 结果返回           │
└─────────────────────────────────────────┘
```

#### 差距影响分析

| 缺失的步骤 | 对用户的影响 | 对论文的影响 |
|------------|-------------|-------------|
| 数据预处理说明 | 不知道剔除了多少数据 | 无法写方法部分 |
| 描述性统计 | 缺少基线特征表 | 缺少 Table 1 |
| 敏感性分析 | 不知道结果是否稳健 | 审稿人会质疑 |
| 效应量计算 | 不知道临床意义 | 缺少临床解读 |

---

## 3. 相同之处

### 3.1 核心理念一致

| 理念 | 愿景设计 | 开发计划 |
|------|----------|----------|
| **白盒化** | 用户理解 AI 做了什么 | 执行路径可视化 |
| **严谨性** | 统计护栏防止滥用 | 护栏规则链 |
| **可交付** | 生成可复现的 R 代码 | 代码下载功能 |

### 3.2 技术选型一致

| 技术 | 愿景设计 | 开发计划 |
|------|----------|----------|
| Brain-Hand 分离 | ✅ | ✅ |
| LLM + R 服务 | ✅ | ✅ |
| 四维匹配 (Goal/Y/X/Design) | ✅ | ✅ |
| 护栏检查 | ✅ | ✅ |
| 代码生成 | ✅ | ✅ |

### 3.3 配置中台的价值

配置中台在两份文档中都被认可：

| 配置项 | 愿景设计中的作用 | 开发计划中的作用 |
|--------|-----------------|-----------------|
| 决策表 | 方法选择的依据 | 工具匹配的规则 |
| 流程模板 | **规划完整分析流程** | ❌ 未涉及 |
| 护栏规则 | 数据自适应 | Block/Warn/Switch |
| 解读模板 | 论文级结论生成 | 结果解读 |

---

## 4. 能否达到理想状态？

### 4.1 结论：按现有计划执行，**无法达到理想状态**

| 理想目标 | 现有计划能否达成 | 原因 |
|----------|-----------------|------|
| AI 理解用户意图 | 🟡 部分 | 有决策表匹配，但缺少意图追问 |
| 数据自动诊断 | 🟡 部分 | R 服务内有护栏，但未独立呈现 |
| 规划完整分析流程 | 🔴 无法 | **计划只做单方法选择，无流程模板** |
| 多方法编排执行 | 🔴 无法 | **计划只做单方法执行，无编排能力** |
| 论文级综合报告 | 🔴 无法 | **计划只做简单解读，无综合整合** |

### 4.2 根本原因分析

现有开发计划的核心思路是：

```
配置中台 → 支撑 10 个工具的可配置化 → 扩展更多方法
```

但理想状态需要的是：

```
流程引擎 → 将多个方法编排成完整分析流程 → 真正的智能化
```

**配置中台是基础设施，但不是智能化的核心。**

---

## 5. 还缺什么？

### 5.1 缺失的核心组件

| 组件 | 功能 | 开发计划中是否有 |
|------|------|-----------------|
| **流程模板定义** | 定义"差异比较流程"包含哪些步骤 | ❌ 完全没有 |
| **流程执行引擎** | 按顺序编排多个方法执行 | ❌ 完全没有 |
| **结果串联器** | 上一步输出作为下一步输入 | ❌ 完全没有 |
| **综合结论生成器** | 整合多步结果生成完整报告 | ❌ 完全没有 |
| **意图追问模块** | 不确定时向用户澄清 | ❌ 完全没有 |

### 5.2 需要增强的组件

| 组件 | 当前状态 | 需要增强 |
|------|----------|----------|
| 数据诊断器 | R 服务内部 | 提取为独立模块，前端可视化展示 |
| Planner 输出 | 输出 tool_code | 输出 workflow_steps[] |
| 结论生成 | 简单解读 | 论文级模板 + 方法学说明 |

### 5.3 差距可视化

```
┌─────────────────────────────────────────────────────────────┐
│                     理想状态 (100%)                         │
├─────────────────────────────────────────────────────────────┤
│ ████████████████████████████████████████████████████████████│
│ 意图理解 │ 数据诊断 │ 流程规划 │ 流程执行 │ 综合结论       │
│   10%    │   10%   │   25%   │   25%   │   30%           │
└─────────────────────────────────────────────────────────────┘

┌─────────────────────────────────────────────────────────────┐
│                   开发计划覆盖 (~40%)                        │
├─────────────────────────────────────────────────────────────┤
│ ██████████████████████████                                  │
│ 意图理解 │ 数据诊断 │ 流程规划 │ 流程执行 │ 综合结论       │
│   ✅ 5%  │  ✅ 6%  │  ❌ 8%  │  ❌ 5%  │  ✅ 15%         │
│  决策表   │  护栏    │  只选工具│  单方法  │  简单解读       │
└─────────────────────────────────────────────────────────────┘

未覆盖部分 (~60%)：
- 流程规划：17% (流程模板定义)
- 流程执行：20% (多方法编排、结果串联)
- 综合结论：15% (论文级报告、方法学说明)
- 意图理解：5% (追问澄清)
- 数据诊断：4% (独立展示)
```

---

## 6. 建议的调整方向

### 6.1 重新定义开发重点

| 原计划重点 | 建议调整为 |
|------------|-----------|
| 配置中台完善 | 流程引擎建设 |
| 10 个工具量产 | 先做好 2-3 个完整流程 |
| 专家配置体系 | 流程模板 + 方法编排 |

### 6.2 建议的新 Phase 规划

```
Phase 1.5: 流程引擎 MVP（建议新增）
├── 1. 定义流程模板数据结构
├── 2. 实现流程执行引擎（多方法编排）
├── 3. 实现结果串联（上一步 → 下一步）
├── 4. 前端展示分步进度
└── 5. 验证：一个完整的"两组差异比较"流程

Phase 2: 智能规划（调整）
├── 原：决策表驱动规划
├── 新：决策表 → 选择流程模板 → 生成完整 SAP
└── 新：意图追问模块

Phase 3: 完善与扩展（调整）
├── 原：10 个工具
└── 新：3-5 个完整分析流程
```

### 6.3 流程模板示例

```typescript
// 流程模板数据结构
interface WorkflowTemplate {
  id: string;
  name: string;                    // "两组差异比较"
  applicableTo: {                  // 适用条件
    goal: 'Difference';
    yType: 'Continuous';
    xType: 'Categorical_2';
  };
  steps: WorkflowStep[];
}

interface WorkflowStep {
  stepId: string;
  name: string;                    // "正态性检验"
  toolCode: string;                // "ST_SHAPIRO" 或 "ST_T_TEST_IND"
  isConditional: boolean;          // 是否有条件分支
  conditions?: {                   // 条件分支
    if: string;                    // "shapiro.pValue < 0.05"
    then: string;                  // "ST_MANN_WHITNEY"
    else: string;                  // "ST_T_TEST_IND"
  };
  inputFrom?: string;              // 上一步的输出作为输入
}
```

### 6.4 投入产出分析

| 投入 | 预估工时 | 产出价值 |
|------|----------|----------|
| 流程模板定义 | 2-3 天 | 从单方法到完整流程的跨越 |
| 流程执行引擎 | 5-7 天 | 多方法编排能力 |
| 结果串联 | 2-3 天 | 数据在步骤间流转 |
| 综合结论生成 | 3-5 天 | 论文级报告输出 |
| **总计** | **12-18 天** | **达到理想状态的 80%** |

---

## 7. 总结

### 7.1 核心结论

1. **理想状态 ≠ 配置中台**：配置中台是基础设施，不是智能化的核心。

2. **核心差距是"流程编排"**：现有计划是"单方法执行"，理想状态是"多方法编排"。

3. **按现有计划无法达到理想状态**：缺少流程模板、流程引擎、结果串联、综合结论。

4. **需要新增 Phase 1.5**：在 Phase 2 之前，先建设"流程引擎"。

### 7.2 行动建议

| 优先级 | 行动 | 说明 |
|--------|------|------|
| P0 | 暂停配置中台开发 | 配置中台是锦上添花，不是雪中送炭 |
| P0 | 设计流程模板数据结构 | 这是一切的基础 |
| P0 | 实现流程执行引擎 | 让多个方法能够串联执行 |
| P1 | 实现一个完整流程 | "两组差异比较"从头到尾 |
| P2 | 扩展更多流程模板 | 基于成功经验复制 |

### 7.3 一句话总结

> **现有开发计划做的是"让 10 个工具都能用"，
> 但理想状态需要的是"让 1 个分析流程足够智能"。**
>
> **方向不同，结果自然不同。**

---

## 8. 附录

### 8.1 相关文档

| 文档 | 路径 |
|------|------|
| 理想状态与智能化愿景设计 | `00-系统设计/SSA-Pro 理想状态与智能化愿景设计.md` |
| MVP 开发计划总览 | `04-开发计划/00-MVP开发计划总览.md` |
| 任务清单与进度追踪 | `04-开发计划/01-任务清单与进度追踪.md` |
| 架构设计方案 V4 | `00-系统设计/SSA-Pro 严谨型智能统计分析架构设计方案V4.md` |

### 8.2 术语对照

| 愿景设计术语 | 开发计划术语 | 含义 |
|-------------|-------------|------|
| 流程模板 | - | 预定义的多步骤分析流程 |
| 流程执行器 | Executor | 执行引擎（计划只执行单方法） |
| 路径规划器 | Planner | 选择工具/流程（计划只选工具） |
| 综合结论 | Critic | 结果解读（计划是简单解读） |

---

**文档维护者：** SSA 架构团队
**创建日期：** 2026-02-20
**版本：** v1.0