Files
AIclinicalresearch/docs/03-业务模块/SSA-智能统计分析/00-系统设计/SSA-Pro 愿景与开发计划对比分析.md
HaHafeng 428a22adf2 feat(ssa): Complete Phase 2A frontend integration - multi-step workflow end-to-end
Phase 2A: WorkflowPlannerService, WorkflowExecutorService, Python data quality, 6 bug fixes, DescriptiveResultView, multi-step R code/Word export, MVP UI reuse. V11 UI: Gemini-style, multi-task, single-page scroll, Word export. Architecture: Block-based rendering consensus (4 block types). New R tools: chi_square, correlation, descriptive, logistic_binary, mann_whitney, t_test_paired. Docs: dev summary, block-based plan, status updates, task list v2.0.

Co-authored-by: Cursor <cursoragent@cursor.com>
2026-02-20 23:09:27 +08:00

17 KiB
Raw Blame History

SSA-Pro 愿景与开发计划对比分析

文档版本: v1.0
创建日期: 2026-02-20
文档目的: 对比理想愿景与现有开发计划,识别差距,明确下一步方向


1. 对比概览

1.1 两份文档的定位

文档 定位 视角
理想状态与智能化愿景设计 目标终态 以终为始,用户视角
MVP开发计划总览 实施路径 工程视角,分阶段交付

1.2 核心差异一句话总结

维度 愿景设计 开发计划
核心理念 规划流程 执行方法
执行粒度 多方法编排的完整流程 单个统计工具的执行
智能表现 AI 理解意图、诊断数据、规划路径 决策表匹配选工具

2. 详细对比分析

2.1 用户交互模式对比

愿景设计的交互

用户输入:
"我有 200 个高血压患者的数据,分成治疗组和对照组,
 想比较治疗前后的血压变化,看看新药是否有效。"

系统响应:
Step 1: 意图解析 → 识别为"差异比较"
Step 2: 数据诊断 → 发现正态性不满足
Step 3: 规划流程 → 生成 6 步 SAP
Step 4: 分步执行 → 依次运行
Step 5: 综合结论 → 论文级报告

开发计划的交互

用户操作:
1. 上传数据
2. 输入分析需求
3. 系统生成计划(选一个工具)
4. 用户确认执行
5. 返回结果

系统响应:
- Planner 选择 ST_T_TEST_IND
- Executor 执行 T 检验
- 返回 P 值 + 图表 + R 代码

差异分析

维度 愿景设计 开发计划 差距
用户输入 自然语言描述研究问题 需要较明确的分析需求
方法选择 AI 理解意图 + 数据诊断 决策表匹配
执行粒度 6 步完整流程 1 个方法 🔴
输出形式 论文级综合报告 P 值 + 图表 🔴

2.2 系统架构对比

愿景设计的架构5 大核心组件)

┌─────────────────┐
│ 1. 意图理解器   │ ← LLM 意图识别
└────────┬────────┘
         ↓
┌─────────────────┐
│ 2. 数据诊断器   │ ← 分布/缺失/异常检测
└────────┬────────┘
         ↓
┌─────────────────┐
│ 3. 路径规划器   │ ← 决策表 + 流程模板 ⭐
└────────┬────────┘
         ↓
┌─────────────────┐
│ 4. 流程执行器   │ ← 多方法编排 ⭐
└────────┬────────┘
         ↓
┌─────────────────┐
│ 5. 结论生成器   │ ← 论文级综合结论
└─────────────────┘

开发计划的架构Planner + Executor + 配置中台)

┌─────────────────────────────────────────┐
│              Planner (大脑)              │
│  Rewriter → 决策表匹配 → Planner → Critic │
└────────────────┬────────────────────────┘
                 ↓
┌─────────────────────────────────────────┐
│              Executor (四肢)             │
│  护栏检查 → 核心计算 → 代码生成          │
└────────────────┬────────────────────────┘
                 ↑
┌────────────────┴────────────────────────┐
│         配置中台 (专家知识库)            │
│  决策表 + R代码库 + 参数映射 + 护栏规则  │
└─────────────────────────────────────────┘

架构对比表

愿景组件 开发计划对应 覆盖程度 备注
意图理解器 Rewriter + 决策表匹配 🟡 50% 开发计划侧重四维匹配,缺少意图追问
数据诊断器 R 服务内护栏检查 🟡 60% 已有基础,但未独立成模块
路径规划器 Planner + 决策表 🔴 30% 关键差距:只选单个工具,不规划流程
流程执行器 Executor 🔴 20% 关键差距:只执行单个方法,无编排能力
结论生成器 Critic 🟡 50% 已有解读模板,但缺少综合整合

2.3 核心能力对比

2.3.1 方法选择能力

能力 愿景设计 开发计划 是否覆盖
四维匹配 (Goal/Y/X/Design) 已覆盖
意图追问澄清 未覆盖
基于数据特征调整 (护栏) 已覆盖

2.3.2 执行能力

能力 愿景设计 开发计划 是否覆盖
单方法执行 已覆盖
护栏检查 已覆盖
自动降级 (Switch) 已覆盖
多方法编排 🔴 未覆盖
结果串联 🔴 未覆盖
分步展示 🔴 未覆盖

2.3.3 输出能力

能力 愿景设计 开发计划 是否覆盖
统计结果表格 已覆盖
可视化图表 已覆盖
R 代码下载 已覆盖
简单解读 已覆盖
论文级综合结论 🔴 未覆盖
方法学说明 🔴 未覆盖
敏感性分析结果 🔴 未覆盖

2.4 流程模板 vs 单方法执行(关键差距)

这是两份文档最核心的差异。

愿景设计的流程模板

用户需求: "比较两组疗效差异"

系统规划的完整流程:
┌─────────┬─────────┬─────────┬─────────┬─────────┬─────────┐
│ 1.数据  │ 2.描述  │ 3.假设  │ 4.敏感性│ 5.效应量│ 6.可视化│
│ 预处理  │ 统计    │ 检验    │ 分析    │         │         │
└─────────┴─────────┴─────────┴─────────┴─────────┴─────────┘
    ↓         ↓         ↓         ↓         ↓         ↓
  剔除异常  均值±SD   T检验    Bootstrap  Cohen's d  箱线图
  处理缺失  中位数    /Wilcoxon  T检验     95%CI

开发计划的单方法执行

用户需求: "比较两组疗效差异"

系统执行:
┌─────────────────────────────────────────┐
│           ST_T_TEST_IND                 │
│  护栏检查 → T 检验 → 结果返回           │
└─────────────────────────────────────────┘

差距影响分析

缺失的步骤 对用户的影响 对论文的影响
数据预处理说明 不知道剔除了多少数据 无法写方法部分
描述性统计 缺少基线特征表 缺少 Table 1
敏感性分析 不知道结果是否稳健 审稿人会质疑
效应量计算 不知道临床意义 缺少临床解读

3. 相同之处

3.1 核心理念一致

理念 愿景设计 开发计划
白盒化 用户理解 AI 做了什么 执行路径可视化
严谨性 统计护栏防止滥用 护栏规则链
可交付 生成可复现的 R 代码 代码下载功能

3.2 技术选型一致

技术 愿景设计 开发计划
Brain-Hand 分离
LLM + R 服务
四维匹配 (Goal/Y/X/Design)
护栏检查
代码生成

3.3 配置中台的价值

配置中台在两份文档中都被认可:

配置项 愿景设计中的作用 开发计划中的作用
决策表 方法选择的依据 工具匹配的规则
流程模板 规划完整分析流程 未涉及
护栏规则 数据自适应 Block/Warn/Switch
解读模板 论文级结论生成 结果解读

4. 能否达到理想状态?

4.1 结论:按现有计划执行,无法达到理想状态

理想目标 现有计划能否达成 原因
AI 理解用户意图 🟡 部分 有决策表匹配,但缺少意图追问
数据自动诊断 🟡 部分 R 服务内有护栏,但未独立呈现
规划完整分析流程 🔴 无法 计划只做单方法选择,无流程模板
多方法编排执行 🔴 无法 计划只做单方法执行,无编排能力
论文级综合报告 🔴 无法 计划只做简单解读,无综合整合

4.2 根本原因分析

现有开发计划的核心思路是:

配置中台 → 支撑 10 个工具的可配置化 → 扩展更多方法

但理想状态需要的是:

流程引擎 → 将多个方法编排成完整分析流程 → 真正的智能化

配置中台是基础设施,但不是智能化的核心。


5. 还缺什么?

5.1 缺失的核心组件

组件 功能 开发计划中是否有
流程模板定义 定义"差异比较流程"包含哪些步骤 完全没有
流程执行引擎 按顺序编排多个方法执行 完全没有
结果串联器 上一步输出作为下一步输入 完全没有
综合结论生成器 整合多步结果生成完整报告 完全没有
意图追问模块 不确定时向用户澄清 完全没有

5.2 需要增强的组件

组件 当前状态 需要增强
数据诊断器 R 服务内部 提取为独立模块,前端可视化展示
Planner 输出 输出 tool_code 输出 workflow_steps[]
结论生成 简单解读 论文级模板 + 方法学说明

5.3 差距可视化

┌─────────────────────────────────────────────────────────────┐
│                     理想状态 (100%)                         │
├─────────────────────────────────────────────────────────────┤
│ ████████████████████████████████████████████████████████████│
│ 意图理解 │ 数据诊断 │ 流程规划 │ 流程执行 │ 综合结论       │
│   10%    │   10%   │   25%   │   25%   │   30%           │
└─────────────────────────────────────────────────────────────┘

┌─────────────────────────────────────────────────────────────┐
│                   开发计划覆盖 (~40%)                        │
├─────────────────────────────────────────────────────────────┤
│ ██████████████████████████                                  │
│ 意图理解 │ 数据诊断 │ 流程规划 │ 流程执行 │ 综合结论       │
│   ✅ 5%  │  ✅ 6%  │  ❌ 8%  │  ❌ 5%  │  ✅ 15%         │
│  决策表   │  护栏    │  只选工具│  单方法  │  简单解读       │
└─────────────────────────────────────────────────────────────┘

未覆盖部分 (~60%)
- 流程规划17% (流程模板定义)
- 流程执行20% (多方法编排、结果串联)
- 综合结论15% (论文级报告、方法学说明)
- 意图理解5% (追问澄清)
- 数据诊断4% (独立展示)

6. 建议的调整方向

6.1 重新定义开发重点

原计划重点 建议调整为
配置中台完善 流程引擎建设
10 个工具量产 先做好 2-3 个完整流程
专家配置体系 流程模板 + 方法编排

6.2 建议的新 Phase 规划

Phase 1.5: 流程引擎 MVP建议新增
├── 1. 定义流程模板数据结构
├── 2. 实现流程执行引擎(多方法编排)
├── 3. 实现结果串联(上一步 → 下一步)
├── 4. 前端展示分步进度
└── 5. 验证:一个完整的"两组差异比较"流程

Phase 2: 智能规划(调整)
├── 原:决策表驱动规划
├── 新:决策表 → 选择流程模板 → 生成完整 SAP
└── 新:意图追问模块

Phase 3: 完善与扩展(调整)
├── 原10 个工具
└── 新3-5 个完整分析流程

6.3 流程模板示例

// 流程模板数据结构
interface WorkflowTemplate {
  id: string;
  name: string;                    // "两组差异比较"
  applicableTo: {                  // 适用条件
    goal: 'Difference';
    yType: 'Continuous';
    xType: 'Categorical_2';
  };
  steps: WorkflowStep[];
}

interface WorkflowStep {
  stepId: string;
  name: string;                    // "正态性检验"
  toolCode: string;                // "ST_SHAPIRO" 或 "ST_T_TEST_IND"
  isConditional: boolean;          // 是否有条件分支
  conditions?: {                   // 条件分支
    if: string;                    // "shapiro.pValue < 0.05"
    then: string;                  // "ST_MANN_WHITNEY"
    else: string;                  // "ST_T_TEST_IND"
  };
  inputFrom?: string;              // 上一步的输出作为输入
}

6.4 投入产出分析

投入 预估工时 产出价值
流程模板定义 2-3 天 从单方法到完整流程的跨越
流程执行引擎 5-7 天 多方法编排能力
结果串联 2-3 天 数据在步骤间流转
综合结论生成 3-5 天 论文级报告输出
总计 12-18 天 达到理想状态的 80%

7. 总结

7.1 核心结论

  1. 理想状态 ≠ 配置中台:配置中台是基础设施,不是智能化的核心。

  2. 核心差距是"流程编排":现有计划是"单方法执行",理想状态是"多方法编排"。

  3. 按现有计划无法达到理想状态:缺少流程模板、流程引擎、结果串联、综合结论。

  4. 需要新增 Phase 1.5:在 Phase 2 之前,先建设"流程引擎"。

7.2 行动建议

优先级 行动 说明
P0 暂停配置中台开发 配置中台是锦上添花,不是雪中送炭
P0 设计流程模板数据结构 这是一切的基础
P0 实现流程执行引擎 让多个方法能够串联执行
P1 实现一个完整流程 "两组差异比较"从头到尾
P2 扩展更多流程模板 基于成功经验复制

7.3 一句话总结

现有开发计划做的是"让 10 个工具都能用" 但理想状态需要的是"让 1 个分析流程足够智能"。

方向不同,结果自然不同。


8. 附录

8.1 相关文档

文档 路径
理想状态与智能化愿景设计 00-系统设计/SSA-Pro 理想状态与智能化愿景设计.md
MVP 开发计划总览 04-开发计划/00-MVP开发计划总览.md
任务清单与进度追踪 04-开发计划/01-任务清单与进度追踪.md
架构设计方案 V4 00-系统设计/SSA-Pro 严谨型智能统计分析架构设计方案V4.md

8.2 术语对照

愿景设计术语 开发计划术语 含义
流程模板 - 预定义的多步骤分析流程
流程执行器 Executor 执行引擎(计划只执行单方法)
路径规划器 Planner 选择工具/流程(计划只选工具)
综合结论 Critic 结果解读(计划是简单解读)

文档维护者: SSA 架构团队
创建日期: 2026-02-20
版本: v1.0