feat(ssa): Complete Phase 2A frontend integration - multi-step workflow end-to-end

Phase 2A: WorkflowPlannerService, WorkflowExecutorService, Python data quality, 6 bug fixes, DescriptiveResultView, multi-step R code/Word export, MVP UI reuse. V11 UI: Gemini-style, multi-task, single-page scroll, Word export. Architecture: Block-based rendering consensus (4 block types). New R tools: chi_square, correlation, descriptive, logistic_binary, mann_whitney, t_test_paired. Docs: dev summary, block-based plan, status updates, task list v2.0. Co-authored-by: Cursor <cursoragent@cursor.com>
2026-02-20 23:09:27 +08:00
parent 23b422f758
commit 428a22adf2
62 changed files with 15416 additions and 299 deletions
--- a/docs/03-业务模块/SSA-智能统计分析/00-系统设计/SSA-Pro
+++ b/docs/03-业务模块/SSA-智能统计分析/00-系统设计/SSA-Pro
@@ -0,0 +1,447 @@
+# SSA-Pro 愿景与开发计划对比分析
+
+> **文档版本：** v1.0  
+> **创建日期：** 2026-02-20  
+> **文档目的：** 对比理想愿景与现有开发计划，识别差距，明确下一步方向
+
+---
+
+## 1. 对比概览
+
+### 1.1 两份文档的定位
+
+| 文档 | 定位 | 视角 |
+|------|------|------|
+| **理想状态与智能化愿景设计** | 目标终态 | 以终为始，用户视角 |
+| **MVP开发计划总览** | 实施路径 | 工程视角，分阶段交付 |
+
+### 1.2 核心差异一句话总结
+
+| 维度 | 愿景设计 | 开发计划 |
+|------|----------|----------|
+| **核心理念** | **规划流程** | **执行方法** |
+| **执行粒度** | 多方法编排的完整流程 | 单个统计工具的执行 |
+| **智能表现** | AI 理解意图、诊断数据、规划路径 | 决策表匹配选工具 |
+
+---
+
+## 2. 详细对比分析
+
+### 2.1 用户交互模式对比
+
+#### 愿景设计的交互
+
+```
+用户输入：
+"我有 200 个高血压患者的数据，分成治疗组和对照组，
+ 想比较治疗前后的血压变化，看看新药是否有效。"
+
+系统响应：
+Step 1: 意图解析 → 识别为"差异比较"
+Step 2: 数据诊断 → 发现正态性不满足
+Step 3: 规划流程 → 生成 6 步 SAP
+Step 4: 分步执行 → 依次运行
+Step 5: 综合结论 → 论文级报告
+```
+
+#### 开发计划的交互
+
+```
+用户操作：
+1. 上传数据
+2. 输入分析需求
+3. 系统生成计划（选一个工具）
+4. 用户确认执行
+5. 返回结果
+
+系统响应：
+- Planner 选择 ST_T_TEST_IND
+- Executor 执行 T 检验
+- 返回 P 值 + 图表 + R 代码
+```
+
+#### 差异分析
+
+| 维度 | 愿景设计 | 开发计划 | 差距 |
+|------|----------|----------|------|
+| 用户输入 | 自然语言描述研究问题 | 需要较明确的分析需求 | 中 |
+| 方法选择 | AI 理解意图 + 数据诊断 | 决策表匹配 | 中 |
+| 执行粒度 | 6 步完整流程 | 1 个方法 | 🔴 大 |
+| 输出形式 | 论文级综合报告 | P 值 + 图表 | 🔴 大 |
+
+---
+
+### 2.2 系统架构对比
+
+#### 愿景设计的架构（5 大核心组件）
+
+```
+┌─────────────────┐
+│ 1. 意图理解器   │ ← LLM 意图识别
+└────────┬────────┘
+         ↓
+┌─────────────────┐
+│ 2. 数据诊断器   │ ← 分布/缺失/异常检测
+└────────┬────────┘
+         ↓
+┌─────────────────┐
+│ 3. 路径规划器   │ ← 决策表 + 流程模板 ⭐
+└────────┬────────┘
+         ↓
+┌─────────────────┐
+│ 4. 流程执行器   │ ← 多方法编排 ⭐
+└────────┬────────┘
+         ↓
+┌─────────────────┐
+│ 5. 结论生成器   │ ← 论文级综合结论
+└─────────────────┘
+```
+
+#### 开发计划的架构（Planner + Executor + 配置中台）
+
+```
+┌─────────────────────────────────────────┐
+│              Planner (大脑)              │
+│  Rewriter → 决策表匹配 → Planner → Critic │
+└────────────────┬────────────────────────┘
+                 ↓
+┌─────────────────────────────────────────┐
+│              Executor (四肢)             │
+│  护栏检查 → 核心计算 → 代码生成          │
+└────────────────┬────────────────────────┘
+                 ↑
+┌────────────────┴────────────────────────┐
+│         配置中台 (专家知识库)            │
+│  决策表 + R代码库 + 参数映射 + 护栏规则  │
+└─────────────────────────────────────────┘
+```
+
+#### 架构对比表
+
+| 愿景组件 | 开发计划对应 | 覆盖程度 | 备注 |
+|----------|-------------|----------|------|
+| 意图理解器 | Rewriter + 决策表匹配 | 🟡 50% | 开发计划侧重四维匹配，缺少意图追问 |
+| 数据诊断器 | R 服务内护栏检查 | 🟡 60% | 已有基础，但未独立成模块 |
+| 路径规划器 | Planner + 决策表 | 🔴 30% | **关键差距：只选单个工具，不规划流程** |
+| 流程执行器 | Executor | 🔴 20% | **关键差距：只执行单个方法，无编排能力** |
+| 结论生成器 | Critic | 🟡 50% | 已有解读模板，但缺少综合整合 |
+
+---
+
+### 2.3 核心能力对比
+
+#### 2.3.1 方法选择能力
+
+| 能力 | 愿景设计 | 开发计划 | 是否覆盖 |
+|------|----------|----------|----------|
+| 四维匹配 (Goal/Y/X/Design) | ✅ | ✅ | ✅ 已覆盖 |
+| 意图追问澄清 | ✅ | ❌ | ❌ 未覆盖 |
+| 基于数据特征调整 | ✅ | ✅ (护栏) | ✅ 已覆盖 |
+
+#### 2.3.2 执行能力
+
+| 能力 | 愿景设计 | 开发计划 | 是否覆盖 |
+|------|----------|----------|----------|
+| 单方法执行 | ✅ | ✅ | ✅ 已覆盖 |
+| 护栏检查 | ✅ | ✅ | ✅ 已覆盖 |
+| 自动降级 (Switch) | ✅ | ✅ | ✅ 已覆盖 |
+| **多方法编排** | ✅ | ❌ | 🔴 **未覆盖** |
+| **结果串联** | ✅ | ❌ | 🔴 **未覆盖** |
+| **分步展示** | ✅ | ❌ | 🔴 **未覆盖** |
+
+#### 2.3.3 输出能力
+
+| 能力 | 愿景设计 | 开发计划 | 是否覆盖 |
+|------|----------|----------|----------|
+| 统计结果表格 | ✅ | ✅ | ✅ 已覆盖 |
+| 可视化图表 | ✅ | ✅ | ✅ 已覆盖 |
+| R 代码下载 | ✅ | ✅ | ✅ 已覆盖 |
+| 简单解读 | ✅ | ✅ | ✅ 已覆盖 |
+| **论文级综合结论** | ✅ | ❌ | 🔴 **未覆盖** |
+| **方法学说明** | ✅ | ❌ | 🔴 **未覆盖** |
+| **敏感性分析结果** | ✅ | ❌ | 🔴 **未覆盖** |
+
+---
+
+### 2.4 流程模板 vs 单方法执行（关键差距）
+
+这是两份文档最核心的差异。
+
+#### 愿景设计的流程模板
+
+```
+用户需求: "比较两组疗效差异"
+
+系统规划的完整流程:
+┌─────────┬─────────┬─────────┬─────────┬─────────┬─────────┐
+│ 1.数据  │ 2.描述  │ 3.假设  │ 4.敏感性│ 5.效应量│ 6.可视化│
+│ 预处理  │ 统计    │ 检验    │ 分析    │         │         │
+└─────────┴─────────┴─────────┴─────────┴─────────┴─────────┘
+    ↓         ↓         ↓         ↓         ↓         ↓
+  剔除异常  均值±SD   T检验    Bootstrap  Cohen's d  箱线图
+  处理缺失  中位数    /Wilcoxon  T检验     95%CI
+```
+
+#### 开发计划的单方法执行
+
+```
+用户需求: "比较两组疗效差异"
+
+系统执行:
+┌─────────────────────────────────────────┐
+│           ST_T_TEST_IND                 │
+│  护栏检查 → T 检验 → 结果返回           │
+└─────────────────────────────────────────┘
+```
+
+#### 差距影响分析
+
+| 缺失的步骤 | 对用户的影响 | 对论文的影响 |
+|------------|-------------|-------------|
+| 数据预处理说明 | 不知道剔除了多少数据 | 无法写方法部分 |
+| 描述性统计 | 缺少基线特征表 | 缺少 Table 1 |
+| 敏感性分析 | 不知道结果是否稳健 | 审稿人会质疑 |
+| 效应量计算 | 不知道临床意义 | 缺少临床解读 |
+
+---
+
+## 3. 相同之处
+
+### 3.1 核心理念一致
+
+| 理念 | 愿景设计 | 开发计划 |
+|------|----------|----------|
+| **白盒化** | 用户理解 AI 做了什么 | 执行路径可视化 |
+| **严谨性** | 统计护栏防止滥用 | 护栏规则链 |
+| **可交付** | 生成可复现的 R 代码 | 代码下载功能 |
+
+### 3.2 技术选型一致
+
+| 技术 | 愿景设计 | 开发计划 |
+|------|----------|----------|
+| Brain-Hand 分离 | ✅ | ✅ |
+| LLM + R 服务 | ✅ | ✅ |
+| 四维匹配 (Goal/Y/X/Design) | ✅ | ✅ |
+| 护栏检查 | ✅ | ✅ |
+| 代码生成 | ✅ | ✅ |
+
+### 3.3 配置中台的价值
+
+配置中台在两份文档中都被认可：
+
+| 配置项 | 愿景设计中的作用 | 开发计划中的作用 |
+|--------|-----------------|-----------------|
+| 决策表 | 方法选择的依据 | 工具匹配的规则 |
+| 流程模板 | **规划完整分析流程** | ❌ 未涉及 |
+| 护栏规则 | 数据自适应 | Block/Warn/Switch |
+| 解读模板 | 论文级结论生成 | 结果解读 |
+
+---
+
+## 4. 能否达到理想状态？
+
+### 4.1 结论：按现有计划执行，**无法达到理想状态**
+
+| 理想目标 | 现有计划能否达成 | 原因 |
+|----------|-----------------|------|
+| AI 理解用户意图 | 🟡 部分 | 有决策表匹配，但缺少意图追问 |
+| 数据自动诊断 | 🟡 部分 | R 服务内有护栏，但未独立呈现 |
+| 规划完整分析流程 | 🔴 无法 | **计划只做单方法选择，无流程模板** |
+| 多方法编排执行 | 🔴 无法 | **计划只做单方法执行，无编排能力** |
+| 论文级综合报告 | 🔴 无法 | **计划只做简单解读，无综合整合** |
+
+### 4.2 根本原因分析
+
+现有开发计划的核心思路是：
+
+```
+配置中台 → 支撑 10 个工具的可配置化 → 扩展更多方法
+```
+
+但理想状态需要的是：
+
+```
+流程引擎 → 将多个方法编排成完整分析流程 → 真正的智能化
+```
+
+**配置中台是基础设施，但不是智能化的核心。**
+
+---
+
+## 5. 还缺什么？
+
+### 5.1 缺失的核心组件
+
+| 组件 | 功能 | 开发计划中是否有 |
+|------|------|-----------------|
+| **流程模板定义** | 定义"差异比较流程"包含哪些步骤 | ❌ 完全没有 |
+| **流程执行引擎** | 按顺序编排多个方法执行 | ❌ 完全没有 |
+| **结果串联器** | 上一步输出作为下一步输入 | ❌ 完全没有 |
+| **综合结论生成器** | 整合多步结果生成完整报告 | ❌ 完全没有 |
+| **意图追问模块** | 不确定时向用户澄清 | ❌ 完全没有 |
+
+### 5.2 需要增强的组件
+
+| 组件 | 当前状态 | 需要增强 |
+|------|----------|----------|
+| 数据诊断器 | R 服务内部 | 提取为独立模块，前端可视化展示 |
+| Planner 输出 | 输出 tool_code | 输出 workflow_steps[] |
+| 结论生成 | 简单解读 | 论文级模板 + 方法学说明 |
+
+### 5.3 差距可视化
+
+```
+┌─────────────────────────────────────────────────────────────┐
+│                     理想状态 (100%)                         │
+├─────────────────────────────────────────────────────────────┤
+│ ████████████████████████████████████████████████████████████│
+│ 意图理解 │ 数据诊断 │ 流程规划 │ 流程执行 │ 综合结论       │
+│   10%    │   10%   │   25%   │   25%   │   30%           │
+└─────────────────────────────────────────────────────────────┘
+
+┌─────────────────────────────────────────────────────────────┐
+│                   开发计划覆盖 (~40%)                        │
+├─────────────────────────────────────────────────────────────┤
+│ ██████████████████████████                                  │
+│ 意图理解 │ 数据诊断 │ 流程规划 │ 流程执行 │ 综合结论       │
+│   ✅ 5%  │  ✅ 6%  │  ❌ 8%  │  ❌ 5%  │  ✅ 15%         │
+│  决策表   │  护栏    │  只选工具│  单方法  │  简单解读       │
+└─────────────────────────────────────────────────────────────┘
+
+未覆盖部分 (~60%)：
+- 流程规划：17% (流程模板定义)
+- 流程执行：20% (多方法编排、结果串联)
+- 综合结论：15% (论文级报告、方法学说明)
+- 意图理解：5% (追问澄清)
+- 数据诊断：4% (独立展示)
+```
+
+---
+
+## 6. 建议的调整方向
+
+### 6.1 重新定义开发重点
+
+| 原计划重点 | 建议调整为 |
+|------------|-----------|
+| 配置中台完善 | 流程引擎建设 |
+| 10 个工具量产 | 先做好 2-3 个完整流程 |
+| 专家配置体系 | 流程模板 + 方法编排 |
+
+### 6.2 建议的新 Phase 规划
+
+```
+Phase 1.5: 流程引擎 MVP（建议新增）
+├── 1. 定义流程模板数据结构
+├── 2. 实现流程执行引擎（多方法编排）
+├── 3. 实现结果串联（上一步 → 下一步）
+├── 4. 前端展示分步进度
+└── 5. 验证：一个完整的"两组差异比较"流程
+
+Phase 2: 智能规划（调整）
+├── 原：决策表驱动规划
+├── 新：决策表 → 选择流程模板 → 生成完整 SAP
+└── 新：意图追问模块
+
+Phase 3: 完善与扩展（调整）
+├── 原：10 个工具
+└── 新：3-5 个完整分析流程
+```
+
+### 6.3 流程模板示例
+
+```typescript
+// 流程模板数据结构
+interface WorkflowTemplate {
+  id: string;
+  name: string;                    // "两组差异比较"
+  applicableTo: {                  // 适用条件
+    goal: 'Difference';
+    yType: 'Continuous';
+    xType: 'Categorical_2';
+  };
+  steps: WorkflowStep[];
+}
+
+interface WorkflowStep {
+  stepId: string;
+  name: string;                    // "正态性检验"
+  toolCode: string;                // "ST_SHAPIRO" 或 "ST_T_TEST_IND"
+  isConditional: boolean;          // 是否有条件分支
+  conditions?: {                   // 条件分支
+    if: string;                    // "shapiro.pValue < 0.05"
+    then: string;                  // "ST_MANN_WHITNEY"
+    else: string;                  // "ST_T_TEST_IND"
+  };
+  inputFrom?: string;              // 上一步的输出作为输入
+}
+```
+
+### 6.4 投入产出分析
+
+| 投入 | 预估工时 | 产出价值 |
+|------|----------|----------|
+| 流程模板定义 | 2-3 天 | 从单方法到完整流程的跨越 |
+| 流程执行引擎 | 5-7 天 | 多方法编排能力 |
+| 结果串联 | 2-3 天 | 数据在步骤间流转 |
+| 综合结论生成 | 3-5 天 | 论文级报告输出 |
+| **总计** | **12-18 天** | **达到理想状态的 80%** |
+
+---
+
+## 7. 总结
+
+### 7.1 核心结论
+
+1. **理想状态 ≠ 配置中台**：配置中台是基础设施，不是智能化的核心。
+
+2. **核心差距是"流程编排"**：现有计划是"单方法执行"，理想状态是"多方法编排"。
+
+3. **按现有计划无法达到理想状态**：缺少流程模板、流程引擎、结果串联、综合结论。
+
+4. **需要新增 Phase 1.5**：在 Phase 2 之前，先建设"流程引擎"。
+
+### 7.2 行动建议
+
+| 优先级 | 行动 | 说明 |
+|--------|------|------|
+| P0 | 暂停配置中台开发 | 配置中台是锦上添花，不是雪中送炭 |
+| P0 | 设计流程模板数据结构 | 这是一切的基础 |
+| P0 | 实现流程执行引擎 | 让多个方法能够串联执行 |
+| P1 | 实现一个完整流程 | "两组差异比较"从头到尾 |
+| P2 | 扩展更多流程模板 | 基于成功经验复制 |
+
+### 7.3 一句话总结
+
+> **现有开发计划做的是"让 10 个工具都能用"，
+> 但理想状态需要的是"让 1 个分析流程足够智能"。**
+> 
+> **方向不同，结果自然不同。**
+
+---
+
+## 8. 附录
+
+### 8.1 相关文档
+
+| 文档 | 路径 |
+|------|------|
+| 理想状态与智能化愿景设计 | `00-系统设计/SSA-Pro 理想状态与智能化愿景设计.md` |
+| MVP 开发计划总览 | `04-开发计划/00-MVP开发计划总览.md` |
+| 任务清单与进度追踪 | `04-开发计划/01-任务清单与进度追踪.md` |
+| 架构设计方案 V4 | `00-系统设计/SSA-Pro 严谨型智能统计分析架构设计方案V4.md` |
+
+### 8.2 术语对照
+
+| 愿景设计术语 | 开发计划术语 | 含义 |
+|-------------|-------------|------|
+| 流程模板 | - | 预定义的多步骤分析流程 |
+| 流程执行器 | Executor | 执行引擎（计划只执行单方法） |
+| 路径规划器 | Planner | 选择工具/流程（计划只选工具） |
+| 综合结论 | Critic | 结果解读（计划是简单解读） |
+
+---
+
+**文档维护者：** SSA 架构团队  
+**创建日期：** 2026-02-20  
+**版本：** v1.0