Phase 2A: WorkflowPlannerService, WorkflowExecutorService, Python data quality, 6 bug fixes, DescriptiveResultView, multi-step R code/Word export, MVP UI reuse. V11 UI: Gemini-style, multi-task, single-page scroll, Word export. Architecture: Block-based rendering consensus (4 block types). New R tools: chi_square, correlation, descriptive, logistic_binary, mann_whitney, t_test_paired. Docs: dev summary, block-based plan, status updates, task list v2.0. Co-authored-by: Cursor <cursoragent@cursor.com>
448 lines
17 KiB
Markdown
448 lines
17 KiB
Markdown
# SSA-Pro 愿景与开发计划对比分析
|
||
|
||
> **文档版本:** v1.0
|
||
> **创建日期:** 2026-02-20
|
||
> **文档目的:** 对比理想愿景与现有开发计划,识别差距,明确下一步方向
|
||
|
||
---
|
||
|
||
## 1. 对比概览
|
||
|
||
### 1.1 两份文档的定位
|
||
|
||
| 文档 | 定位 | 视角 |
|
||
|------|------|------|
|
||
| **理想状态与智能化愿景设计** | 目标终态 | 以终为始,用户视角 |
|
||
| **MVP开发计划总览** | 实施路径 | 工程视角,分阶段交付 |
|
||
|
||
### 1.2 核心差异一句话总结
|
||
|
||
| 维度 | 愿景设计 | 开发计划 |
|
||
|------|----------|----------|
|
||
| **核心理念** | **规划流程** | **执行方法** |
|
||
| **执行粒度** | 多方法编排的完整流程 | 单个统计工具的执行 |
|
||
| **智能表现** | AI 理解意图、诊断数据、规划路径 | 决策表匹配选工具 |
|
||
|
||
---
|
||
|
||
## 2. 详细对比分析
|
||
|
||
### 2.1 用户交互模式对比
|
||
|
||
#### 愿景设计的交互
|
||
|
||
```
|
||
用户输入:
|
||
"我有 200 个高血压患者的数据,分成治疗组和对照组,
|
||
想比较治疗前后的血压变化,看看新药是否有效。"
|
||
|
||
系统响应:
|
||
Step 1: 意图解析 → 识别为"差异比较"
|
||
Step 2: 数据诊断 → 发现正态性不满足
|
||
Step 3: 规划流程 → 生成 6 步 SAP
|
||
Step 4: 分步执行 → 依次运行
|
||
Step 5: 综合结论 → 论文级报告
|
||
```
|
||
|
||
#### 开发计划的交互
|
||
|
||
```
|
||
用户操作:
|
||
1. 上传数据
|
||
2. 输入分析需求
|
||
3. 系统生成计划(选一个工具)
|
||
4. 用户确认执行
|
||
5. 返回结果
|
||
|
||
系统响应:
|
||
- Planner 选择 ST_T_TEST_IND
|
||
- Executor 执行 T 检验
|
||
- 返回 P 值 + 图表 + R 代码
|
||
```
|
||
|
||
#### 差异分析
|
||
|
||
| 维度 | 愿景设计 | 开发计划 | 差距 |
|
||
|------|----------|----------|------|
|
||
| 用户输入 | 自然语言描述研究问题 | 需要较明确的分析需求 | 中 |
|
||
| 方法选择 | AI 理解意图 + 数据诊断 | 决策表匹配 | 中 |
|
||
| 执行粒度 | 6 步完整流程 | 1 个方法 | 🔴 大 |
|
||
| 输出形式 | 论文级综合报告 | P 值 + 图表 | 🔴 大 |
|
||
|
||
---
|
||
|
||
### 2.2 系统架构对比
|
||
|
||
#### 愿景设计的架构(5 大核心组件)
|
||
|
||
```
|
||
┌─────────────────┐
|
||
│ 1. 意图理解器 │ ← LLM 意图识别
|
||
└────────┬────────┘
|
||
↓
|
||
┌─────────────────┐
|
||
│ 2. 数据诊断器 │ ← 分布/缺失/异常检测
|
||
└────────┬────────┘
|
||
↓
|
||
┌─────────────────┐
|
||
│ 3. 路径规划器 │ ← 决策表 + 流程模板 ⭐
|
||
└────────┬────────┘
|
||
↓
|
||
┌─────────────────┐
|
||
│ 4. 流程执行器 │ ← 多方法编排 ⭐
|
||
└────────┬────────┘
|
||
↓
|
||
┌─────────────────┐
|
||
│ 5. 结论生成器 │ ← 论文级综合结论
|
||
└─────────────────┘
|
||
```
|
||
|
||
#### 开发计划的架构(Planner + Executor + 配置中台)
|
||
|
||
```
|
||
┌─────────────────────────────────────────┐
|
||
│ Planner (大脑) │
|
||
│ Rewriter → 决策表匹配 → Planner → Critic │
|
||
└────────────────┬────────────────────────┘
|
||
↓
|
||
┌─────────────────────────────────────────┐
|
||
│ Executor (四肢) │
|
||
│ 护栏检查 → 核心计算 → 代码生成 │
|
||
└────────────────┬────────────────────────┘
|
||
↑
|
||
┌────────────────┴────────────────────────┐
|
||
│ 配置中台 (专家知识库) │
|
||
│ 决策表 + R代码库 + 参数映射 + 护栏规则 │
|
||
└─────────────────────────────────────────┘
|
||
```
|
||
|
||
#### 架构对比表
|
||
|
||
| 愿景组件 | 开发计划对应 | 覆盖程度 | 备注 |
|
||
|----------|-------------|----------|------|
|
||
| 意图理解器 | Rewriter + 决策表匹配 | 🟡 50% | 开发计划侧重四维匹配,缺少意图追问 |
|
||
| 数据诊断器 | R 服务内护栏检查 | 🟡 60% | 已有基础,但未独立成模块 |
|
||
| 路径规划器 | Planner + 决策表 | 🔴 30% | **关键差距:只选单个工具,不规划流程** |
|
||
| 流程执行器 | Executor | 🔴 20% | **关键差距:只执行单个方法,无编排能力** |
|
||
| 结论生成器 | Critic | 🟡 50% | 已有解读模板,但缺少综合整合 |
|
||
|
||
---
|
||
|
||
### 2.3 核心能力对比
|
||
|
||
#### 2.3.1 方法选择能力
|
||
|
||
| 能力 | 愿景设计 | 开发计划 | 是否覆盖 |
|
||
|------|----------|----------|----------|
|
||
| 四维匹配 (Goal/Y/X/Design) | ✅ | ✅ | ✅ 已覆盖 |
|
||
| 意图追问澄清 | ✅ | ❌ | ❌ 未覆盖 |
|
||
| 基于数据特征调整 | ✅ | ✅ (护栏) | ✅ 已覆盖 |
|
||
|
||
#### 2.3.2 执行能力
|
||
|
||
| 能力 | 愿景设计 | 开发计划 | 是否覆盖 |
|
||
|------|----------|----------|----------|
|
||
| 单方法执行 | ✅ | ✅ | ✅ 已覆盖 |
|
||
| 护栏检查 | ✅ | ✅ | ✅ 已覆盖 |
|
||
| 自动降级 (Switch) | ✅ | ✅ | ✅ 已覆盖 |
|
||
| **多方法编排** | ✅ | ❌ | 🔴 **未覆盖** |
|
||
| **结果串联** | ✅ | ❌ | 🔴 **未覆盖** |
|
||
| **分步展示** | ✅ | ❌ | 🔴 **未覆盖** |
|
||
|
||
#### 2.3.3 输出能力
|
||
|
||
| 能力 | 愿景设计 | 开发计划 | 是否覆盖 |
|
||
|------|----------|----------|----------|
|
||
| 统计结果表格 | ✅ | ✅ | ✅ 已覆盖 |
|
||
| 可视化图表 | ✅ | ✅ | ✅ 已覆盖 |
|
||
| R 代码下载 | ✅ | ✅ | ✅ 已覆盖 |
|
||
| 简单解读 | ✅ | ✅ | ✅ 已覆盖 |
|
||
| **论文级综合结论** | ✅ | ❌ | 🔴 **未覆盖** |
|
||
| **方法学说明** | ✅ | ❌ | 🔴 **未覆盖** |
|
||
| **敏感性分析结果** | ✅ | ❌ | 🔴 **未覆盖** |
|
||
|
||
---
|
||
|
||
### 2.4 流程模板 vs 单方法执行(关键差距)
|
||
|
||
这是两份文档最核心的差异。
|
||
|
||
#### 愿景设计的流程模板
|
||
|
||
```
|
||
用户需求: "比较两组疗效差异"
|
||
|
||
系统规划的完整流程:
|
||
┌─────────┬─────────┬─────────┬─────────┬─────────┬─────────┐
|
||
│ 1.数据 │ 2.描述 │ 3.假设 │ 4.敏感性│ 5.效应量│ 6.可视化│
|
||
│ 预处理 │ 统计 │ 检验 │ 分析 │ │ │
|
||
└─────────┴─────────┴─────────┴─────────┴─────────┴─────────┘
|
||
↓ ↓ ↓ ↓ ↓ ↓
|
||
剔除异常 均值±SD T检验 Bootstrap Cohen's d 箱线图
|
||
处理缺失 中位数 /Wilcoxon T检验 95%CI
|
||
```
|
||
|
||
#### 开发计划的单方法执行
|
||
|
||
```
|
||
用户需求: "比较两组疗效差异"
|
||
|
||
系统执行:
|
||
┌─────────────────────────────────────────┐
|
||
│ ST_T_TEST_IND │
|
||
│ 护栏检查 → T 检验 → 结果返回 │
|
||
└─────────────────────────────────────────┘
|
||
```
|
||
|
||
#### 差距影响分析
|
||
|
||
| 缺失的步骤 | 对用户的影响 | 对论文的影响 |
|
||
|------------|-------------|-------------|
|
||
| 数据预处理说明 | 不知道剔除了多少数据 | 无法写方法部分 |
|
||
| 描述性统计 | 缺少基线特征表 | 缺少 Table 1 |
|
||
| 敏感性分析 | 不知道结果是否稳健 | 审稿人会质疑 |
|
||
| 效应量计算 | 不知道临床意义 | 缺少临床解读 |
|
||
|
||
---
|
||
|
||
## 3. 相同之处
|
||
|
||
### 3.1 核心理念一致
|
||
|
||
| 理念 | 愿景设计 | 开发计划 |
|
||
|------|----------|----------|
|
||
| **白盒化** | 用户理解 AI 做了什么 | 执行路径可视化 |
|
||
| **严谨性** | 统计护栏防止滥用 | 护栏规则链 |
|
||
| **可交付** | 生成可复现的 R 代码 | 代码下载功能 |
|
||
|
||
### 3.2 技术选型一致
|
||
|
||
| 技术 | 愿景设计 | 开发计划 |
|
||
|------|----------|----------|
|
||
| Brain-Hand 分离 | ✅ | ✅ |
|
||
| LLM + R 服务 | ✅ | ✅ |
|
||
| 四维匹配 (Goal/Y/X/Design) | ✅ | ✅ |
|
||
| 护栏检查 | ✅ | ✅ |
|
||
| 代码生成 | ✅ | ✅ |
|
||
|
||
### 3.3 配置中台的价值
|
||
|
||
配置中台在两份文档中都被认可:
|
||
|
||
| 配置项 | 愿景设计中的作用 | 开发计划中的作用 |
|
||
|--------|-----------------|-----------------|
|
||
| 决策表 | 方法选择的依据 | 工具匹配的规则 |
|
||
| 流程模板 | **规划完整分析流程** | ❌ 未涉及 |
|
||
| 护栏规则 | 数据自适应 | Block/Warn/Switch |
|
||
| 解读模板 | 论文级结论生成 | 结果解读 |
|
||
|
||
---
|
||
|
||
## 4. 能否达到理想状态?
|
||
|
||
### 4.1 结论:按现有计划执行,**无法达到理想状态**
|
||
|
||
| 理想目标 | 现有计划能否达成 | 原因 |
|
||
|----------|-----------------|------|
|
||
| AI 理解用户意图 | 🟡 部分 | 有决策表匹配,但缺少意图追问 |
|
||
| 数据自动诊断 | 🟡 部分 | R 服务内有护栏,但未独立呈现 |
|
||
| 规划完整分析流程 | 🔴 无法 | **计划只做单方法选择,无流程模板** |
|
||
| 多方法编排执行 | 🔴 无法 | **计划只做单方法执行,无编排能力** |
|
||
| 论文级综合报告 | 🔴 无法 | **计划只做简单解读,无综合整合** |
|
||
|
||
### 4.2 根本原因分析
|
||
|
||
现有开发计划的核心思路是:
|
||
|
||
```
|
||
配置中台 → 支撑 10 个工具的可配置化 → 扩展更多方法
|
||
```
|
||
|
||
但理想状态需要的是:
|
||
|
||
```
|
||
流程引擎 → 将多个方法编排成完整分析流程 → 真正的智能化
|
||
```
|
||
|
||
**配置中台是基础设施,但不是智能化的核心。**
|
||
|
||
---
|
||
|
||
## 5. 还缺什么?
|
||
|
||
### 5.1 缺失的核心组件
|
||
|
||
| 组件 | 功能 | 开发计划中是否有 |
|
||
|------|------|-----------------|
|
||
| **流程模板定义** | 定义"差异比较流程"包含哪些步骤 | ❌ 完全没有 |
|
||
| **流程执行引擎** | 按顺序编排多个方法执行 | ❌ 完全没有 |
|
||
| **结果串联器** | 上一步输出作为下一步输入 | ❌ 完全没有 |
|
||
| **综合结论生成器** | 整合多步结果生成完整报告 | ❌ 完全没有 |
|
||
| **意图追问模块** | 不确定时向用户澄清 | ❌ 完全没有 |
|
||
|
||
### 5.2 需要增强的组件
|
||
|
||
| 组件 | 当前状态 | 需要增强 |
|
||
|------|----------|----------|
|
||
| 数据诊断器 | R 服务内部 | 提取为独立模块,前端可视化展示 |
|
||
| Planner 输出 | 输出 tool_code | 输出 workflow_steps[] |
|
||
| 结论生成 | 简单解读 | 论文级模板 + 方法学说明 |
|
||
|
||
### 5.3 差距可视化
|
||
|
||
```
|
||
┌─────────────────────────────────────────────────────────────┐
|
||
│ 理想状态 (100%) │
|
||
├─────────────────────────────────────────────────────────────┤
|
||
│ ████████████████████████████████████████████████████████████│
|
||
│ 意图理解 │ 数据诊断 │ 流程规划 │ 流程执行 │ 综合结论 │
|
||
│ 10% │ 10% │ 25% │ 25% │ 30% │
|
||
└─────────────────────────────────────────────────────────────┘
|
||
|
||
┌─────────────────────────────────────────────────────────────┐
|
||
│ 开发计划覆盖 (~40%) │
|
||
├─────────────────────────────────────────────────────────────┤
|
||
│ ██████████████████████████ │
|
||
│ 意图理解 │ 数据诊断 │ 流程规划 │ 流程执行 │ 综合结论 │
|
||
│ ✅ 5% │ ✅ 6% │ ❌ 8% │ ❌ 5% │ ✅ 15% │
|
||
│ 决策表 │ 护栏 │ 只选工具│ 单方法 │ 简单解读 │
|
||
└─────────────────────────────────────────────────────────────┘
|
||
|
||
未覆盖部分 (~60%):
|
||
- 流程规划:17% (流程模板定义)
|
||
- 流程执行:20% (多方法编排、结果串联)
|
||
- 综合结论:15% (论文级报告、方法学说明)
|
||
- 意图理解:5% (追问澄清)
|
||
- 数据诊断:4% (独立展示)
|
||
```
|
||
|
||
---
|
||
|
||
## 6. 建议的调整方向
|
||
|
||
### 6.1 重新定义开发重点
|
||
|
||
| 原计划重点 | 建议调整为 |
|
||
|------------|-----------|
|
||
| 配置中台完善 | 流程引擎建设 |
|
||
| 10 个工具量产 | 先做好 2-3 个完整流程 |
|
||
| 专家配置体系 | 流程模板 + 方法编排 |
|
||
|
||
### 6.2 建议的新 Phase 规划
|
||
|
||
```
|
||
Phase 1.5: 流程引擎 MVP(建议新增)
|
||
├── 1. 定义流程模板数据结构
|
||
├── 2. 实现流程执行引擎(多方法编排)
|
||
├── 3. 实现结果串联(上一步 → 下一步)
|
||
├── 4. 前端展示分步进度
|
||
└── 5. 验证:一个完整的"两组差异比较"流程
|
||
|
||
Phase 2: 智能规划(调整)
|
||
├── 原:决策表驱动规划
|
||
├── 新:决策表 → 选择流程模板 → 生成完整 SAP
|
||
└── 新:意图追问模块
|
||
|
||
Phase 3: 完善与扩展(调整)
|
||
├── 原:10 个工具
|
||
└── 新:3-5 个完整分析流程
|
||
```
|
||
|
||
### 6.3 流程模板示例
|
||
|
||
```typescript
|
||
// 流程模板数据结构
|
||
interface WorkflowTemplate {
|
||
id: string;
|
||
name: string; // "两组差异比较"
|
||
applicableTo: { // 适用条件
|
||
goal: 'Difference';
|
||
yType: 'Continuous';
|
||
xType: 'Categorical_2';
|
||
};
|
||
steps: WorkflowStep[];
|
||
}
|
||
|
||
interface WorkflowStep {
|
||
stepId: string;
|
||
name: string; // "正态性检验"
|
||
toolCode: string; // "ST_SHAPIRO" 或 "ST_T_TEST_IND"
|
||
isConditional: boolean; // 是否有条件分支
|
||
conditions?: { // 条件分支
|
||
if: string; // "shapiro.pValue < 0.05"
|
||
then: string; // "ST_MANN_WHITNEY"
|
||
else: string; // "ST_T_TEST_IND"
|
||
};
|
||
inputFrom?: string; // 上一步的输出作为输入
|
||
}
|
||
```
|
||
|
||
### 6.4 投入产出分析
|
||
|
||
| 投入 | 预估工时 | 产出价值 |
|
||
|------|----------|----------|
|
||
| 流程模板定义 | 2-3 天 | 从单方法到完整流程的跨越 |
|
||
| 流程执行引擎 | 5-7 天 | 多方法编排能力 |
|
||
| 结果串联 | 2-3 天 | 数据在步骤间流转 |
|
||
| 综合结论生成 | 3-5 天 | 论文级报告输出 |
|
||
| **总计** | **12-18 天** | **达到理想状态的 80%** |
|
||
|
||
---
|
||
|
||
## 7. 总结
|
||
|
||
### 7.1 核心结论
|
||
|
||
1. **理想状态 ≠ 配置中台**:配置中台是基础设施,不是智能化的核心。
|
||
|
||
2. **核心差距是"流程编排"**:现有计划是"单方法执行",理想状态是"多方法编排"。
|
||
|
||
3. **按现有计划无法达到理想状态**:缺少流程模板、流程引擎、结果串联、综合结论。
|
||
|
||
4. **需要新增 Phase 1.5**:在 Phase 2 之前,先建设"流程引擎"。
|
||
|
||
### 7.2 行动建议
|
||
|
||
| 优先级 | 行动 | 说明 |
|
||
|--------|------|------|
|
||
| P0 | 暂停配置中台开发 | 配置中台是锦上添花,不是雪中送炭 |
|
||
| P0 | 设计流程模板数据结构 | 这是一切的基础 |
|
||
| P0 | 实现流程执行引擎 | 让多个方法能够串联执行 |
|
||
| P1 | 实现一个完整流程 | "两组差异比较"从头到尾 |
|
||
| P2 | 扩展更多流程模板 | 基于成功经验复制 |
|
||
|
||
### 7.3 一句话总结
|
||
|
||
> **现有开发计划做的是"让 10 个工具都能用",
|
||
> 但理想状态需要的是"让 1 个分析流程足够智能"。**
|
||
>
|
||
> **方向不同,结果自然不同。**
|
||
|
||
---
|
||
|
||
## 8. 附录
|
||
|
||
### 8.1 相关文档
|
||
|
||
| 文档 | 路径 |
|
||
|------|------|
|
||
| 理想状态与智能化愿景设计 | `00-系统设计/SSA-Pro 理想状态与智能化愿景设计.md` |
|
||
| MVP 开发计划总览 | `04-开发计划/00-MVP开发计划总览.md` |
|
||
| 任务清单与进度追踪 | `04-开发计划/01-任务清单与进度追踪.md` |
|
||
| 架构设计方案 V4 | `00-系统设计/SSA-Pro 严谨型智能统计分析架构设计方案V4.md` |
|
||
|
||
### 8.2 术语对照
|
||
|
||
| 愿景设计术语 | 开发计划术语 | 含义 |
|
||
|-------------|-------------|------|
|
||
| 流程模板 | - | 预定义的多步骤分析流程 |
|
||
| 流程执行器 | Executor | 执行引擎(计划只执行单方法) |
|
||
| 路径规划器 | Planner | 选择工具/流程(计划只选工具) |
|
||
| 综合结论 | Critic | 结果解读(计划是简单解读) |
|
||
|
||
---
|
||
|
||
**文档维护者:** SSA 架构团队
|
||
**创建日期:** 2026-02-20
|
||
**版本:** v1.0
|