feat(ssa): Complete Phase 2A frontend integration - multi-step workflow end-to-end

Phase 2A: WorkflowPlannerService, WorkflowExecutorService, Python data quality, 6 bug fixes, DescriptiveResultView, multi-step R code/Word export, MVP UI reuse. V11 UI: Gemini-style, multi-task, single-page scroll, Word export. Architecture: Block-based rendering consensus (4 block types). New R tools: chi_square, correlation, descriptive, logistic_binary, mann_whitney, t_test_paired. Docs: dev summary, block-based plan, status updates, task list v2.0. Co-authored-by: Cursor <cursoragent@cursor.com>
2026-02-20 23:09:27 +08:00
parent 23b422f758
commit 428a22adf2
62 changed files with 15416 additions and 299 deletions
--- a/docs/03-业务模块/SSA-智能统计分析/04-开发计划/00-MVP开发计划总览.md
+++ b/docs/03-业务模块/SSA-智能统计分析/04-开发计划/00-MVP开发计划总览.md
@@ -1,10 +1,61 @@
 # SSA-Pro MVP 开发计划总览

-> **文档版本：** v1.5  
+> **文档版本：** v1.7  
 > **创建日期：** 2026-02-18  
-> **最后更新：** 2026-02-18（纳入专家配置体系 + 决策表匹配 + R代码库）  
+> **最后更新：** 2026-02-20（纳入 Prompt 体系 + 多工具流程规划 + 数据质量核查报告）  
 > **项目代号：** SSA (Smart Statistical Analysis)  
-> **MVP 目标：** 打通完整闭环，上线 10 个核心统计工具，支持咨询模式
+> **MVP 目标：** 打通完整闭环，上线 10 个核心统计工具，支持多工具流程规划 + 数据质量核查
+
+---
+
+## 0. 🆕 智能化演进愿景（战略定位）
+
+> **详细文档参考：** `04-开发计划/06-智能化演进共识与MVP执行计划.md`
+
+### 0.1 产品终极目标
+
+> **SSA-Pro 的终极目标是 Level 3：颠覆性的智能分析助手**
+>
+> 让不懂统计的医生，能够完成专业级的统计分析。
+
+### 0.2 三阶段演进路线
+
+```
+Phase 1/2: 爬行期 (MVP) ← 当前阶段
+━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
+目标：打透 Tool Calling，建立用户信任
+机制：100个工具作为固定API，LLM 做智能调度
+AI角色：高级调度员 / 全科主任医师
+
+Phase 2.5: 行走期
+━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
+目标：引入受限的代码智能
+机制：数据清洗允许 LLM 生成代码，核心统计仍用固定工具
+
+Phase 3: 奔跑期 (终极愿景)
+━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
+目标：自愈型靶向代码修改
+机制：运行报错时，LLM 根据错误日志靶向修改工具代码
+关键：不是自由生成代码，而是基于现有工具的靶向修复
+```
+
+### 0.3 MVP 阶段的"为未来铺路"任务
+
+| 伏笔任务 | Phase 3 用途 | MVP 阶段行动 |
+|---------|-------------|-------------|
+| **Prompt 动态注入体系** | 支持专家配置热更新 | 🆕 骨架（AI工程师）+ 血肉（统计专家）分离 |
+| **多工具流程规划** | 复杂场景的自动化 | 🆕 LLM 生成 2-7 步串联执行流程 |
+| **数据质量核查报告** | 智能诊断异常数据 | 🆕 自动生成"数据体检报告"（评分 + 建议）|
+| **Prompt 世界观** | LLM 理解自己可以修改代码 | Prompt 中强调"代码库"概念 |
+| **向量库代码片段** | 便于 LLM 理解工具代码 | `tools_library` 存入核心代码片段 |
+| **结构化错误日志** | 用于错误反馈自愈 | 建立 JSON 格式的错误捕获管道 |
+| **黄金数据集积累** | 学习"什么错误如何修复" | 完整记录每次调用（含报错） |
+
+### 0.4 关键共识
+
+> ⚠️ **Phase 3 的"代码智能"不是让 LLM 自由发挥写代码**
+>
+> 而是：LLM 串联工具 → 执行 → 如果报错 → 错误日志反馈给 LLM → 靶向修改代码/参数 → 重新执行

 ---

@@ -16,9 +67,11 @@
 |------|------|
 | **统计工具** | 10 个高频工具（T检验、ANOVA、卡方、相关性等） |
 | **双模式支持** | 🆕 **智能分析模式**（上传数据→执行）+ **咨询模式**（无数据→SAP文档）|
-| **核心流程** | 上传数据 → AI规划 → 用户确认 → R执行 → 结果交付 |
+| **🆕 多工具流程规划** | LLM 规划 2-7 步串联流程（数据检查 → 前提检验 → 核心分析 → 效应量 → 结论）|
+| **🆕 数据质量核查报告** | 自动生成"数据体检报告"（缺失值/异常值/分布/平衡性），含质量评分和建议 |
+| **核心流程** | 上传数据 → **数据质量核查** → AI规划 → 用户确认 → **多步串联执行** → 结果交付 |
 | **交互能力** | 计划确认卡片、执行路径树、结果展示、代码下载、🆕 SAP文档导出 |
-| **智能能力** | RAG工具检索、Planner规划、Critic结果解读 |
+| **智能能力** | 🆕 **Prompt 动态注入** + RAG工具检索 + Planner规划 + Critic结果解读 |
 | **配置中台** | 🆕 统计决策表 + R代码库 + 参数映射 + 护栏规则链 + 解读模板 |
 | **数据安全** | LLM只看Schema，R服务处理真实数据 |