feat(ssa): Complete Phase 2A frontend integration - multi-step workflow end-to-end
Phase 2A: WorkflowPlannerService, WorkflowExecutorService, Python data quality, 6 bug fixes, DescriptiveResultView, multi-step R code/Word export, MVP UI reuse. V11 UI: Gemini-style, multi-task, single-page scroll, Word export. Architecture: Block-based rendering consensus (4 block types). New R tools: chi_square, correlation, descriptive, logistic_binary, mann_whitney, t_test_paired. Docs: dev summary, block-based plan, status updates, task list v2.0. Co-authored-by: Cursor <cursoragent@cursor.com>
This commit is contained in:
447
docs/03-业务模块/SSA-智能统计分析/00-系统设计/SSA-Pro 愿景与开发计划对比分析.md
Normal file
447
docs/03-业务模块/SSA-智能统计分析/00-系统设计/SSA-Pro 愿景与开发计划对比分析.md
Normal file
@@ -0,0 +1,447 @@
|
||||
# SSA-Pro 愿景与开发计划对比分析
|
||||
|
||||
> **文档版本:** v1.0
|
||||
> **创建日期:** 2026-02-20
|
||||
> **文档目的:** 对比理想愿景与现有开发计划,识别差距,明确下一步方向
|
||||
|
||||
---
|
||||
|
||||
## 1. 对比概览
|
||||
|
||||
### 1.1 两份文档的定位
|
||||
|
||||
| 文档 | 定位 | 视角 |
|
||||
|------|------|------|
|
||||
| **理想状态与智能化愿景设计** | 目标终态 | 以终为始,用户视角 |
|
||||
| **MVP开发计划总览** | 实施路径 | 工程视角,分阶段交付 |
|
||||
|
||||
### 1.2 核心差异一句话总结
|
||||
|
||||
| 维度 | 愿景设计 | 开发计划 |
|
||||
|------|----------|----------|
|
||||
| **核心理念** | **规划流程** | **执行方法** |
|
||||
| **执行粒度** | 多方法编排的完整流程 | 单个统计工具的执行 |
|
||||
| **智能表现** | AI 理解意图、诊断数据、规划路径 | 决策表匹配选工具 |
|
||||
|
||||
---
|
||||
|
||||
## 2. 详细对比分析
|
||||
|
||||
### 2.1 用户交互模式对比
|
||||
|
||||
#### 愿景设计的交互
|
||||
|
||||
```
|
||||
用户输入:
|
||||
"我有 200 个高血压患者的数据,分成治疗组和对照组,
|
||||
想比较治疗前后的血压变化,看看新药是否有效。"
|
||||
|
||||
系统响应:
|
||||
Step 1: 意图解析 → 识别为"差异比较"
|
||||
Step 2: 数据诊断 → 发现正态性不满足
|
||||
Step 3: 规划流程 → 生成 6 步 SAP
|
||||
Step 4: 分步执行 → 依次运行
|
||||
Step 5: 综合结论 → 论文级报告
|
||||
```
|
||||
|
||||
#### 开发计划的交互
|
||||
|
||||
```
|
||||
用户操作:
|
||||
1. 上传数据
|
||||
2. 输入分析需求
|
||||
3. 系统生成计划(选一个工具)
|
||||
4. 用户确认执行
|
||||
5. 返回结果
|
||||
|
||||
系统响应:
|
||||
- Planner 选择 ST_T_TEST_IND
|
||||
- Executor 执行 T 检验
|
||||
- 返回 P 值 + 图表 + R 代码
|
||||
```
|
||||
|
||||
#### 差异分析
|
||||
|
||||
| 维度 | 愿景设计 | 开发计划 | 差距 |
|
||||
|------|----------|----------|------|
|
||||
| 用户输入 | 自然语言描述研究问题 | 需要较明确的分析需求 | 中 |
|
||||
| 方法选择 | AI 理解意图 + 数据诊断 | 决策表匹配 | 中 |
|
||||
| 执行粒度 | 6 步完整流程 | 1 个方法 | 🔴 大 |
|
||||
| 输出形式 | 论文级综合报告 | P 值 + 图表 | 🔴 大 |
|
||||
|
||||
---
|
||||
|
||||
### 2.2 系统架构对比
|
||||
|
||||
#### 愿景设计的架构(5 大核心组件)
|
||||
|
||||
```
|
||||
┌─────────────────┐
|
||||
│ 1. 意图理解器 │ ← LLM 意图识别
|
||||
└────────┬────────┘
|
||||
↓
|
||||
┌─────────────────┐
|
||||
│ 2. 数据诊断器 │ ← 分布/缺失/异常检测
|
||||
└────────┬────────┘
|
||||
↓
|
||||
┌─────────────────┐
|
||||
│ 3. 路径规划器 │ ← 决策表 + 流程模板 ⭐
|
||||
└────────┬────────┘
|
||||
↓
|
||||
┌─────────────────┐
|
||||
│ 4. 流程执行器 │ ← 多方法编排 ⭐
|
||||
└────────┬────────┘
|
||||
↓
|
||||
┌─────────────────┐
|
||||
│ 5. 结论生成器 │ ← 论文级综合结论
|
||||
└─────────────────┘
|
||||
```
|
||||
|
||||
#### 开发计划的架构(Planner + Executor + 配置中台)
|
||||
|
||||
```
|
||||
┌─────────────────────────────────────────┐
|
||||
│ Planner (大脑) │
|
||||
│ Rewriter → 决策表匹配 → Planner → Critic │
|
||||
└────────────────┬────────────────────────┘
|
||||
↓
|
||||
┌─────────────────────────────────────────┐
|
||||
│ Executor (四肢) │
|
||||
│ 护栏检查 → 核心计算 → 代码生成 │
|
||||
└────────────────┬────────────────────────┘
|
||||
↑
|
||||
┌────────────────┴────────────────────────┐
|
||||
│ 配置中台 (专家知识库) │
|
||||
│ 决策表 + R代码库 + 参数映射 + 护栏规则 │
|
||||
└─────────────────────────────────────────┘
|
||||
```
|
||||
|
||||
#### 架构对比表
|
||||
|
||||
| 愿景组件 | 开发计划对应 | 覆盖程度 | 备注 |
|
||||
|----------|-------------|----------|------|
|
||||
| 意图理解器 | Rewriter + 决策表匹配 | 🟡 50% | 开发计划侧重四维匹配,缺少意图追问 |
|
||||
| 数据诊断器 | R 服务内护栏检查 | 🟡 60% | 已有基础,但未独立成模块 |
|
||||
| 路径规划器 | Planner + 决策表 | 🔴 30% | **关键差距:只选单个工具,不规划流程** |
|
||||
| 流程执行器 | Executor | 🔴 20% | **关键差距:只执行单个方法,无编排能力** |
|
||||
| 结论生成器 | Critic | 🟡 50% | 已有解读模板,但缺少综合整合 |
|
||||
|
||||
---
|
||||
|
||||
### 2.3 核心能力对比
|
||||
|
||||
#### 2.3.1 方法选择能力
|
||||
|
||||
| 能力 | 愿景设计 | 开发计划 | 是否覆盖 |
|
||||
|------|----------|----------|----------|
|
||||
| 四维匹配 (Goal/Y/X/Design) | ✅ | ✅ | ✅ 已覆盖 |
|
||||
| 意图追问澄清 | ✅ | ❌ | ❌ 未覆盖 |
|
||||
| 基于数据特征调整 | ✅ | ✅ (护栏) | ✅ 已覆盖 |
|
||||
|
||||
#### 2.3.2 执行能力
|
||||
|
||||
| 能力 | 愿景设计 | 开发计划 | 是否覆盖 |
|
||||
|------|----------|----------|----------|
|
||||
| 单方法执行 | ✅ | ✅ | ✅ 已覆盖 |
|
||||
| 护栏检查 | ✅ | ✅ | ✅ 已覆盖 |
|
||||
| 自动降级 (Switch) | ✅ | ✅ | ✅ 已覆盖 |
|
||||
| **多方法编排** | ✅ | ❌ | 🔴 **未覆盖** |
|
||||
| **结果串联** | ✅ | ❌ | 🔴 **未覆盖** |
|
||||
| **分步展示** | ✅ | ❌ | 🔴 **未覆盖** |
|
||||
|
||||
#### 2.3.3 输出能力
|
||||
|
||||
| 能力 | 愿景设计 | 开发计划 | 是否覆盖 |
|
||||
|------|----------|----------|----------|
|
||||
| 统计结果表格 | ✅ | ✅ | ✅ 已覆盖 |
|
||||
| 可视化图表 | ✅ | ✅ | ✅ 已覆盖 |
|
||||
| R 代码下载 | ✅ | ✅ | ✅ 已覆盖 |
|
||||
| 简单解读 | ✅ | ✅ | ✅ 已覆盖 |
|
||||
| **论文级综合结论** | ✅ | ❌ | 🔴 **未覆盖** |
|
||||
| **方法学说明** | ✅ | ❌ | 🔴 **未覆盖** |
|
||||
| **敏感性分析结果** | ✅ | ❌ | 🔴 **未覆盖** |
|
||||
|
||||
---
|
||||
|
||||
### 2.4 流程模板 vs 单方法执行(关键差距)
|
||||
|
||||
这是两份文档最核心的差异。
|
||||
|
||||
#### 愿景设计的流程模板
|
||||
|
||||
```
|
||||
用户需求: "比较两组疗效差异"
|
||||
|
||||
系统规划的完整流程:
|
||||
┌─────────┬─────────┬─────────┬─────────┬─────────┬─────────┐
|
||||
│ 1.数据 │ 2.描述 │ 3.假设 │ 4.敏感性│ 5.效应量│ 6.可视化│
|
||||
│ 预处理 │ 统计 │ 检验 │ 分析 │ │ │
|
||||
└─────────┴─────────┴─────────┴─────────┴─────────┴─────────┘
|
||||
↓ ↓ ↓ ↓ ↓ ↓
|
||||
剔除异常 均值±SD T检验 Bootstrap Cohen's d 箱线图
|
||||
处理缺失 中位数 /Wilcoxon T检验 95%CI
|
||||
```
|
||||
|
||||
#### 开发计划的单方法执行
|
||||
|
||||
```
|
||||
用户需求: "比较两组疗效差异"
|
||||
|
||||
系统执行:
|
||||
┌─────────────────────────────────────────┐
|
||||
│ ST_T_TEST_IND │
|
||||
│ 护栏检查 → T 检验 → 结果返回 │
|
||||
└─────────────────────────────────────────┘
|
||||
```
|
||||
|
||||
#### 差距影响分析
|
||||
|
||||
| 缺失的步骤 | 对用户的影响 | 对论文的影响 |
|
||||
|------------|-------------|-------------|
|
||||
| 数据预处理说明 | 不知道剔除了多少数据 | 无法写方法部分 |
|
||||
| 描述性统计 | 缺少基线特征表 | 缺少 Table 1 |
|
||||
| 敏感性分析 | 不知道结果是否稳健 | 审稿人会质疑 |
|
||||
| 效应量计算 | 不知道临床意义 | 缺少临床解读 |
|
||||
|
||||
---
|
||||
|
||||
## 3. 相同之处
|
||||
|
||||
### 3.1 核心理念一致
|
||||
|
||||
| 理念 | 愿景设计 | 开发计划 |
|
||||
|------|----------|----------|
|
||||
| **白盒化** | 用户理解 AI 做了什么 | 执行路径可视化 |
|
||||
| **严谨性** | 统计护栏防止滥用 | 护栏规则链 |
|
||||
| **可交付** | 生成可复现的 R 代码 | 代码下载功能 |
|
||||
|
||||
### 3.2 技术选型一致
|
||||
|
||||
| 技术 | 愿景设计 | 开发计划 |
|
||||
|------|----------|----------|
|
||||
| Brain-Hand 分离 | ✅ | ✅ |
|
||||
| LLM + R 服务 | ✅ | ✅ |
|
||||
| 四维匹配 (Goal/Y/X/Design) | ✅ | ✅ |
|
||||
| 护栏检查 | ✅ | ✅ |
|
||||
| 代码生成 | ✅ | ✅ |
|
||||
|
||||
### 3.3 配置中台的价值
|
||||
|
||||
配置中台在两份文档中都被认可:
|
||||
|
||||
| 配置项 | 愿景设计中的作用 | 开发计划中的作用 |
|
||||
|--------|-----------------|-----------------|
|
||||
| 决策表 | 方法选择的依据 | 工具匹配的规则 |
|
||||
| 流程模板 | **规划完整分析流程** | ❌ 未涉及 |
|
||||
| 护栏规则 | 数据自适应 | Block/Warn/Switch |
|
||||
| 解读模板 | 论文级结论生成 | 结果解读 |
|
||||
|
||||
---
|
||||
|
||||
## 4. 能否达到理想状态?
|
||||
|
||||
### 4.1 结论:按现有计划执行,**无法达到理想状态**
|
||||
|
||||
| 理想目标 | 现有计划能否达成 | 原因 |
|
||||
|----------|-----------------|------|
|
||||
| AI 理解用户意图 | 🟡 部分 | 有决策表匹配,但缺少意图追问 |
|
||||
| 数据自动诊断 | 🟡 部分 | R 服务内有护栏,但未独立呈现 |
|
||||
| 规划完整分析流程 | 🔴 无法 | **计划只做单方法选择,无流程模板** |
|
||||
| 多方法编排执行 | 🔴 无法 | **计划只做单方法执行,无编排能力** |
|
||||
| 论文级综合报告 | 🔴 无法 | **计划只做简单解读,无综合整合** |
|
||||
|
||||
### 4.2 根本原因分析
|
||||
|
||||
现有开发计划的核心思路是:
|
||||
|
||||
```
|
||||
配置中台 → 支撑 10 个工具的可配置化 → 扩展更多方法
|
||||
```
|
||||
|
||||
但理想状态需要的是:
|
||||
|
||||
```
|
||||
流程引擎 → 将多个方法编排成完整分析流程 → 真正的智能化
|
||||
```
|
||||
|
||||
**配置中台是基础设施,但不是智能化的核心。**
|
||||
|
||||
---
|
||||
|
||||
## 5. 还缺什么?
|
||||
|
||||
### 5.1 缺失的核心组件
|
||||
|
||||
| 组件 | 功能 | 开发计划中是否有 |
|
||||
|------|------|-----------------|
|
||||
| **流程模板定义** | 定义"差异比较流程"包含哪些步骤 | ❌ 完全没有 |
|
||||
| **流程执行引擎** | 按顺序编排多个方法执行 | ❌ 完全没有 |
|
||||
| **结果串联器** | 上一步输出作为下一步输入 | ❌ 完全没有 |
|
||||
| **综合结论生成器** | 整合多步结果生成完整报告 | ❌ 完全没有 |
|
||||
| **意图追问模块** | 不确定时向用户澄清 | ❌ 完全没有 |
|
||||
|
||||
### 5.2 需要增强的组件
|
||||
|
||||
| 组件 | 当前状态 | 需要增强 |
|
||||
|------|----------|----------|
|
||||
| 数据诊断器 | R 服务内部 | 提取为独立模块,前端可视化展示 |
|
||||
| Planner 输出 | 输出 tool_code | 输出 workflow_steps[] |
|
||||
| 结论生成 | 简单解读 | 论文级模板 + 方法学说明 |
|
||||
|
||||
### 5.3 差距可视化
|
||||
|
||||
```
|
||||
┌─────────────────────────────────────────────────────────────┐
|
||||
│ 理想状态 (100%) │
|
||||
├─────────────────────────────────────────────────────────────┤
|
||||
│ ████████████████████████████████████████████████████████████│
|
||||
│ 意图理解 │ 数据诊断 │ 流程规划 │ 流程执行 │ 综合结论 │
|
||||
│ 10% │ 10% │ 25% │ 25% │ 30% │
|
||||
└─────────────────────────────────────────────────────────────┘
|
||||
|
||||
┌─────────────────────────────────────────────────────────────┐
|
||||
│ 开发计划覆盖 (~40%) │
|
||||
├─────────────────────────────────────────────────────────────┤
|
||||
│ ██████████████████████████ │
|
||||
│ 意图理解 │ 数据诊断 │ 流程规划 │ 流程执行 │ 综合结论 │
|
||||
│ ✅ 5% │ ✅ 6% │ ❌ 8% │ ❌ 5% │ ✅ 15% │
|
||||
│ 决策表 │ 护栏 │ 只选工具│ 单方法 │ 简单解读 │
|
||||
└─────────────────────────────────────────────────────────────┘
|
||||
|
||||
未覆盖部分 (~60%):
|
||||
- 流程规划:17% (流程模板定义)
|
||||
- 流程执行:20% (多方法编排、结果串联)
|
||||
- 综合结论:15% (论文级报告、方法学说明)
|
||||
- 意图理解:5% (追问澄清)
|
||||
- 数据诊断:4% (独立展示)
|
||||
```
|
||||
|
||||
---
|
||||
|
||||
## 6. 建议的调整方向
|
||||
|
||||
### 6.1 重新定义开发重点
|
||||
|
||||
| 原计划重点 | 建议调整为 |
|
||||
|------------|-----------|
|
||||
| 配置中台完善 | 流程引擎建设 |
|
||||
| 10 个工具量产 | 先做好 2-3 个完整流程 |
|
||||
| 专家配置体系 | 流程模板 + 方法编排 |
|
||||
|
||||
### 6.2 建议的新 Phase 规划
|
||||
|
||||
```
|
||||
Phase 1.5: 流程引擎 MVP(建议新增)
|
||||
├── 1. 定义流程模板数据结构
|
||||
├── 2. 实现流程执行引擎(多方法编排)
|
||||
├── 3. 实现结果串联(上一步 → 下一步)
|
||||
├── 4. 前端展示分步进度
|
||||
└── 5. 验证:一个完整的"两组差异比较"流程
|
||||
|
||||
Phase 2: 智能规划(调整)
|
||||
├── 原:决策表驱动规划
|
||||
├── 新:决策表 → 选择流程模板 → 生成完整 SAP
|
||||
└── 新:意图追问模块
|
||||
|
||||
Phase 3: 完善与扩展(调整)
|
||||
├── 原:10 个工具
|
||||
└── 新:3-5 个完整分析流程
|
||||
```
|
||||
|
||||
### 6.3 流程模板示例
|
||||
|
||||
```typescript
|
||||
// 流程模板数据结构
|
||||
interface WorkflowTemplate {
|
||||
id: string;
|
||||
name: string; // "两组差异比较"
|
||||
applicableTo: { // 适用条件
|
||||
goal: 'Difference';
|
||||
yType: 'Continuous';
|
||||
xType: 'Categorical_2';
|
||||
};
|
||||
steps: WorkflowStep[];
|
||||
}
|
||||
|
||||
interface WorkflowStep {
|
||||
stepId: string;
|
||||
name: string; // "正态性检验"
|
||||
toolCode: string; // "ST_SHAPIRO" 或 "ST_T_TEST_IND"
|
||||
isConditional: boolean; // 是否有条件分支
|
||||
conditions?: { // 条件分支
|
||||
if: string; // "shapiro.pValue < 0.05"
|
||||
then: string; // "ST_MANN_WHITNEY"
|
||||
else: string; // "ST_T_TEST_IND"
|
||||
};
|
||||
inputFrom?: string; // 上一步的输出作为输入
|
||||
}
|
||||
```
|
||||
|
||||
### 6.4 投入产出分析
|
||||
|
||||
| 投入 | 预估工时 | 产出价值 |
|
||||
|------|----------|----------|
|
||||
| 流程模板定义 | 2-3 天 | 从单方法到完整流程的跨越 |
|
||||
| 流程执行引擎 | 5-7 天 | 多方法编排能力 |
|
||||
| 结果串联 | 2-3 天 | 数据在步骤间流转 |
|
||||
| 综合结论生成 | 3-5 天 | 论文级报告输出 |
|
||||
| **总计** | **12-18 天** | **达到理想状态的 80%** |
|
||||
|
||||
---
|
||||
|
||||
## 7. 总结
|
||||
|
||||
### 7.1 核心结论
|
||||
|
||||
1. **理想状态 ≠ 配置中台**:配置中台是基础设施,不是智能化的核心。
|
||||
|
||||
2. **核心差距是"流程编排"**:现有计划是"单方法执行",理想状态是"多方法编排"。
|
||||
|
||||
3. **按现有计划无法达到理想状态**:缺少流程模板、流程引擎、结果串联、综合结论。
|
||||
|
||||
4. **需要新增 Phase 1.5**:在 Phase 2 之前,先建设"流程引擎"。
|
||||
|
||||
### 7.2 行动建议
|
||||
|
||||
| 优先级 | 行动 | 说明 |
|
||||
|--------|------|------|
|
||||
| P0 | 暂停配置中台开发 | 配置中台是锦上添花,不是雪中送炭 |
|
||||
| P0 | 设计流程模板数据结构 | 这是一切的基础 |
|
||||
| P0 | 实现流程执行引擎 | 让多个方法能够串联执行 |
|
||||
| P1 | 实现一个完整流程 | "两组差异比较"从头到尾 |
|
||||
| P2 | 扩展更多流程模板 | 基于成功经验复制 |
|
||||
|
||||
### 7.3 一句话总结
|
||||
|
||||
> **现有开发计划做的是"让 10 个工具都能用",
|
||||
> 但理想状态需要的是"让 1 个分析流程足够智能"。**
|
||||
>
|
||||
> **方向不同,结果自然不同。**
|
||||
|
||||
---
|
||||
|
||||
## 8. 附录
|
||||
|
||||
### 8.1 相关文档
|
||||
|
||||
| 文档 | 路径 |
|
||||
|------|------|
|
||||
| 理想状态与智能化愿景设计 | `00-系统设计/SSA-Pro 理想状态与智能化愿景设计.md` |
|
||||
| MVP 开发计划总览 | `04-开发计划/00-MVP开发计划总览.md` |
|
||||
| 任务清单与进度追踪 | `04-开发计划/01-任务清单与进度追踪.md` |
|
||||
| 架构设计方案 V4 | `00-系统设计/SSA-Pro 严谨型智能统计分析架构设计方案V4.md` |
|
||||
|
||||
### 8.2 术语对照
|
||||
|
||||
| 愿景设计术语 | 开发计划术语 | 含义 |
|
||||
|-------------|-------------|------|
|
||||
| 流程模板 | - | 预定义的多步骤分析流程 |
|
||||
| 流程执行器 | Executor | 执行引擎(计划只执行单方法) |
|
||||
| 路径规划器 | Planner | 选择工具/流程(计划只选工具) |
|
||||
| 综合结论 | Critic | 结果解读(计划是简单解读) |
|
||||
|
||||
---
|
||||
|
||||
**文档维护者:** SSA 架构团队
|
||||
**创建日期:** 2026-02-20
|
||||
**版本:** v1.0
|
||||
Reference in New Issue
Block a user