Phase 2A: WorkflowPlannerService, WorkflowExecutorService, Python data quality, 6 bug fixes, DescriptiveResultView, multi-step R code/Word export, MVP UI reuse. V11 UI: Gemini-style, multi-task, single-page scroll, Word export. Architecture: Block-based rendering consensus (4 block types). New R tools: chi_square, correlation, descriptive, logistic_binary, mann_whitney, t_test_paired. Docs: dev summary, block-based plan, status updates, task list v2.0. Co-authored-by: Cursor <cursoragent@cursor.com>
17 KiB
17 KiB
SSA-Pro 愿景与开发计划对比分析
文档版本: v1.0
创建日期: 2026-02-20
文档目的: 对比理想愿景与现有开发计划,识别差距,明确下一步方向
1. 对比概览
1.1 两份文档的定位
| 文档 | 定位 | 视角 |
|---|---|---|
| 理想状态与智能化愿景设计 | 目标终态 | 以终为始,用户视角 |
| MVP开发计划总览 | 实施路径 | 工程视角,分阶段交付 |
1.2 核心差异一句话总结
| 维度 | 愿景设计 | 开发计划 |
|---|---|---|
| 核心理念 | 规划流程 | 执行方法 |
| 执行粒度 | 多方法编排的完整流程 | 单个统计工具的执行 |
| 智能表现 | AI 理解意图、诊断数据、规划路径 | 决策表匹配选工具 |
2. 详细对比分析
2.1 用户交互模式对比
愿景设计的交互
用户输入:
"我有 200 个高血压患者的数据,分成治疗组和对照组,
想比较治疗前后的血压变化,看看新药是否有效。"
系统响应:
Step 1: 意图解析 → 识别为"差异比较"
Step 2: 数据诊断 → 发现正态性不满足
Step 3: 规划流程 → 生成 6 步 SAP
Step 4: 分步执行 → 依次运行
Step 5: 综合结论 → 论文级报告
开发计划的交互
用户操作:
1. 上传数据
2. 输入分析需求
3. 系统生成计划(选一个工具)
4. 用户确认执行
5. 返回结果
系统响应:
- Planner 选择 ST_T_TEST_IND
- Executor 执行 T 检验
- 返回 P 值 + 图表 + R 代码
差异分析
| 维度 | 愿景设计 | 开发计划 | 差距 |
|---|---|---|---|
| 用户输入 | 自然语言描述研究问题 | 需要较明确的分析需求 | 中 |
| 方法选择 | AI 理解意图 + 数据诊断 | 决策表匹配 | 中 |
| 执行粒度 | 6 步完整流程 | 1 个方法 | 🔴 大 |
| 输出形式 | 论文级综合报告 | P 值 + 图表 | 🔴 大 |
2.2 系统架构对比
愿景设计的架构(5 大核心组件)
┌─────────────────┐
│ 1. 意图理解器 │ ← LLM 意图识别
└────────┬────────┘
↓
┌─────────────────┐
│ 2. 数据诊断器 │ ← 分布/缺失/异常检测
└────────┬────────┘
↓
┌─────────────────┐
│ 3. 路径规划器 │ ← 决策表 + 流程模板 ⭐
└────────┬────────┘
↓
┌─────────────────┐
│ 4. 流程执行器 │ ← 多方法编排 ⭐
└────────┬────────┘
↓
┌─────────────────┐
│ 5. 结论生成器 │ ← 论文级综合结论
└─────────────────┘
开发计划的架构(Planner + Executor + 配置中台)
┌─────────────────────────────────────────┐
│ Planner (大脑) │
│ Rewriter → 决策表匹配 → Planner → Critic │
└────────────────┬────────────────────────┘
↓
┌─────────────────────────────────────────┐
│ Executor (四肢) │
│ 护栏检查 → 核心计算 → 代码生成 │
└────────────────┬────────────────────────┘
↑
┌────────────────┴────────────────────────┐
│ 配置中台 (专家知识库) │
│ 决策表 + R代码库 + 参数映射 + 护栏规则 │
└─────────────────────────────────────────┘
架构对比表
| 愿景组件 | 开发计划对应 | 覆盖程度 | 备注 |
|---|---|---|---|
| 意图理解器 | Rewriter + 决策表匹配 | 🟡 50% | 开发计划侧重四维匹配,缺少意图追问 |
| 数据诊断器 | R 服务内护栏检查 | 🟡 60% | 已有基础,但未独立成模块 |
| 路径规划器 | Planner + 决策表 | 🔴 30% | 关键差距:只选单个工具,不规划流程 |
| 流程执行器 | Executor | 🔴 20% | 关键差距:只执行单个方法,无编排能力 |
| 结论生成器 | Critic | 🟡 50% | 已有解读模板,但缺少综合整合 |
2.3 核心能力对比
2.3.1 方法选择能力
| 能力 | 愿景设计 | 开发计划 | 是否覆盖 |
|---|---|---|---|
| 四维匹配 (Goal/Y/X/Design) | ✅ | ✅ | ✅ 已覆盖 |
| 意图追问澄清 | ✅ | ❌ | ❌ 未覆盖 |
| 基于数据特征调整 | ✅ | ✅ (护栏) | ✅ 已覆盖 |
2.3.2 执行能力
| 能力 | 愿景设计 | 开发计划 | 是否覆盖 |
|---|---|---|---|
| 单方法执行 | ✅ | ✅ | ✅ 已覆盖 |
| 护栏检查 | ✅ | ✅ | ✅ 已覆盖 |
| 自动降级 (Switch) | ✅ | ✅ | ✅ 已覆盖 |
| 多方法编排 | ✅ | ❌ | 🔴 未覆盖 |
| 结果串联 | ✅ | ❌ | 🔴 未覆盖 |
| 分步展示 | ✅ | ❌ | 🔴 未覆盖 |
2.3.3 输出能力
| 能力 | 愿景设计 | 开发计划 | 是否覆盖 |
|---|---|---|---|
| 统计结果表格 | ✅ | ✅ | ✅ 已覆盖 |
| 可视化图表 | ✅ | ✅ | ✅ 已覆盖 |
| R 代码下载 | ✅ | ✅ | ✅ 已覆盖 |
| 简单解读 | ✅ | ✅ | ✅ 已覆盖 |
| 论文级综合结论 | ✅ | ❌ | 🔴 未覆盖 |
| 方法学说明 | ✅ | ❌ | 🔴 未覆盖 |
| 敏感性分析结果 | ✅ | ❌ | 🔴 未覆盖 |
2.4 流程模板 vs 单方法执行(关键差距)
这是两份文档最核心的差异。
愿景设计的流程模板
用户需求: "比较两组疗效差异"
系统规划的完整流程:
┌─────────┬─────────┬─────────┬─────────┬─────────┬─────────┐
│ 1.数据 │ 2.描述 │ 3.假设 │ 4.敏感性│ 5.效应量│ 6.可视化│
│ 预处理 │ 统计 │ 检验 │ 分析 │ │ │
└─────────┴─────────┴─────────┴─────────┴─────────┴─────────┘
↓ ↓ ↓ ↓ ↓ ↓
剔除异常 均值±SD T检验 Bootstrap Cohen's d 箱线图
处理缺失 中位数 /Wilcoxon T检验 95%CI
开发计划的单方法执行
用户需求: "比较两组疗效差异"
系统执行:
┌─────────────────────────────────────────┐
│ ST_T_TEST_IND │
│ 护栏检查 → T 检验 → 结果返回 │
└─────────────────────────────────────────┘
差距影响分析
| 缺失的步骤 | 对用户的影响 | 对论文的影响 |
|---|---|---|
| 数据预处理说明 | 不知道剔除了多少数据 | 无法写方法部分 |
| 描述性统计 | 缺少基线特征表 | 缺少 Table 1 |
| 敏感性分析 | 不知道结果是否稳健 | 审稿人会质疑 |
| 效应量计算 | 不知道临床意义 | 缺少临床解读 |
3. 相同之处
3.1 核心理念一致
| 理念 | 愿景设计 | 开发计划 |
|---|---|---|
| 白盒化 | 用户理解 AI 做了什么 | 执行路径可视化 |
| 严谨性 | 统计护栏防止滥用 | 护栏规则链 |
| 可交付 | 生成可复现的 R 代码 | 代码下载功能 |
3.2 技术选型一致
| 技术 | 愿景设计 | 开发计划 |
|---|---|---|
| Brain-Hand 分离 | ✅ | ✅ |
| LLM + R 服务 | ✅ | ✅ |
| 四维匹配 (Goal/Y/X/Design) | ✅ | ✅ |
| 护栏检查 | ✅ | ✅ |
| 代码生成 | ✅ | ✅ |
3.3 配置中台的价值
配置中台在两份文档中都被认可:
| 配置项 | 愿景设计中的作用 | 开发计划中的作用 |
|---|---|---|
| 决策表 | 方法选择的依据 | 工具匹配的规则 |
| 流程模板 | 规划完整分析流程 | ❌ 未涉及 |
| 护栏规则 | 数据自适应 | Block/Warn/Switch |
| 解读模板 | 论文级结论生成 | 结果解读 |
4. 能否达到理想状态?
4.1 结论:按现有计划执行,无法达到理想状态
| 理想目标 | 现有计划能否达成 | 原因 |
|---|---|---|
| AI 理解用户意图 | 🟡 部分 | 有决策表匹配,但缺少意图追问 |
| 数据自动诊断 | 🟡 部分 | R 服务内有护栏,但未独立呈现 |
| 规划完整分析流程 | 🔴 无法 | 计划只做单方法选择,无流程模板 |
| 多方法编排执行 | 🔴 无法 | 计划只做单方法执行,无编排能力 |
| 论文级综合报告 | 🔴 无法 | 计划只做简单解读,无综合整合 |
4.2 根本原因分析
现有开发计划的核心思路是:
配置中台 → 支撑 10 个工具的可配置化 → 扩展更多方法
但理想状态需要的是:
流程引擎 → 将多个方法编排成完整分析流程 → 真正的智能化
配置中台是基础设施,但不是智能化的核心。
5. 还缺什么?
5.1 缺失的核心组件
| 组件 | 功能 | 开发计划中是否有 |
|---|---|---|
| 流程模板定义 | 定义"差异比较流程"包含哪些步骤 | ❌ 完全没有 |
| 流程执行引擎 | 按顺序编排多个方法执行 | ❌ 完全没有 |
| 结果串联器 | 上一步输出作为下一步输入 | ❌ 完全没有 |
| 综合结论生成器 | 整合多步结果生成完整报告 | ❌ 完全没有 |
| 意图追问模块 | 不确定时向用户澄清 | ❌ 完全没有 |
5.2 需要增强的组件
| 组件 | 当前状态 | 需要增强 |
|---|---|---|
| 数据诊断器 | R 服务内部 | 提取为独立模块,前端可视化展示 |
| Planner 输出 | 输出 tool_code | 输出 workflow_steps[] |
| 结论生成 | 简单解读 | 论文级模板 + 方法学说明 |
5.3 差距可视化
┌─────────────────────────────────────────────────────────────┐
│ 理想状态 (100%) │
├─────────────────────────────────────────────────────────────┤
│ ████████████████████████████████████████████████████████████│
│ 意图理解 │ 数据诊断 │ 流程规划 │ 流程执行 │ 综合结论 │
│ 10% │ 10% │ 25% │ 25% │ 30% │
└─────────────────────────────────────────────────────────────┘
┌─────────────────────────────────────────────────────────────┐
│ 开发计划覆盖 (~40%) │
├─────────────────────────────────────────────────────────────┤
│ ██████████████████████████ │
│ 意图理解 │ 数据诊断 │ 流程规划 │ 流程执行 │ 综合结论 │
│ ✅ 5% │ ✅ 6% │ ❌ 8% │ ❌ 5% │ ✅ 15% │
│ 决策表 │ 护栏 │ 只选工具│ 单方法 │ 简单解读 │
└─────────────────────────────────────────────────────────────┘
未覆盖部分 (~60%):
- 流程规划:17% (流程模板定义)
- 流程执行:20% (多方法编排、结果串联)
- 综合结论:15% (论文级报告、方法学说明)
- 意图理解:5% (追问澄清)
- 数据诊断:4% (独立展示)
6. 建议的调整方向
6.1 重新定义开发重点
| 原计划重点 | 建议调整为 |
|---|---|
| 配置中台完善 | 流程引擎建设 |
| 10 个工具量产 | 先做好 2-3 个完整流程 |
| 专家配置体系 | 流程模板 + 方法编排 |
6.2 建议的新 Phase 规划
Phase 1.5: 流程引擎 MVP(建议新增)
├── 1. 定义流程模板数据结构
├── 2. 实现流程执行引擎(多方法编排)
├── 3. 实现结果串联(上一步 → 下一步)
├── 4. 前端展示分步进度
└── 5. 验证:一个完整的"两组差异比较"流程
Phase 2: 智能规划(调整)
├── 原:决策表驱动规划
├── 新:决策表 → 选择流程模板 → 生成完整 SAP
└── 新:意图追问模块
Phase 3: 完善与扩展(调整)
├── 原:10 个工具
└── 新:3-5 个完整分析流程
6.3 流程模板示例
// 流程模板数据结构
interface WorkflowTemplate {
id: string;
name: string; // "两组差异比较"
applicableTo: { // 适用条件
goal: 'Difference';
yType: 'Continuous';
xType: 'Categorical_2';
};
steps: WorkflowStep[];
}
interface WorkflowStep {
stepId: string;
name: string; // "正态性检验"
toolCode: string; // "ST_SHAPIRO" 或 "ST_T_TEST_IND"
isConditional: boolean; // 是否有条件分支
conditions?: { // 条件分支
if: string; // "shapiro.pValue < 0.05"
then: string; // "ST_MANN_WHITNEY"
else: string; // "ST_T_TEST_IND"
};
inputFrom?: string; // 上一步的输出作为输入
}
6.4 投入产出分析
| 投入 | 预估工时 | 产出价值 |
|---|---|---|
| 流程模板定义 | 2-3 天 | 从单方法到完整流程的跨越 |
| 流程执行引擎 | 5-7 天 | 多方法编排能力 |
| 结果串联 | 2-3 天 | 数据在步骤间流转 |
| 综合结论生成 | 3-5 天 | 论文级报告输出 |
| 总计 | 12-18 天 | 达到理想状态的 80% |
7. 总结
7.1 核心结论
-
理想状态 ≠ 配置中台:配置中台是基础设施,不是智能化的核心。
-
核心差距是"流程编排":现有计划是"单方法执行",理想状态是"多方法编排"。
-
按现有计划无法达到理想状态:缺少流程模板、流程引擎、结果串联、综合结论。
-
需要新增 Phase 1.5:在 Phase 2 之前,先建设"流程引擎"。
7.2 行动建议
| 优先级 | 行动 | 说明 |
|---|---|---|
| P0 | 暂停配置中台开发 | 配置中台是锦上添花,不是雪中送炭 |
| P0 | 设计流程模板数据结构 | 这是一切的基础 |
| P0 | 实现流程执行引擎 | 让多个方法能够串联执行 |
| P1 | 实现一个完整流程 | "两组差异比较"从头到尾 |
| P2 | 扩展更多流程模板 | 基于成功经验复制 |
7.3 一句话总结
现有开发计划做的是"让 10 个工具都能用", 但理想状态需要的是"让 1 个分析流程足够智能"。
方向不同,结果自然不同。
8. 附录
8.1 相关文档
| 文档 | 路径 |
|---|---|
| 理想状态与智能化愿景设计 | 00-系统设计/SSA-Pro 理想状态与智能化愿景设计.md |
| MVP 开发计划总览 | 04-开发计划/00-MVP开发计划总览.md |
| 任务清单与进度追踪 | 04-开发计划/01-任务清单与进度追踪.md |
| 架构设计方案 V4 | 00-系统设计/SSA-Pro 严谨型智能统计分析架构设计方案V4.md |
8.2 术语对照
| 愿景设计术语 | 开发计划术语 | 含义 |
|---|---|---|
| 流程模板 | - | 预定义的多步骤分析流程 |
| 流程执行器 | Executor | 执行引擎(计划只执行单方法) |
| 路径规划器 | Planner | 选择工具/流程(计划只选工具) |
| 综合结论 | Critic | 结果解读(计划是简单解读) |
文档维护者: SSA 架构团队
创建日期: 2026-02-20
版本: v1.0