feat(ssa): Complete Phase 2A frontend integration - multi-step workflow end-to-end

Phase 2A: WorkflowPlannerService, WorkflowExecutorService, Python data quality, 6 bug fixes, DescriptiveResultView, multi-step R code/Word export, MVP UI reuse. V11 UI: Gemini-style, multi-task, single-page scroll, Word export. Architecture: Block-based rendering consensus (4 block types). New R tools: chi_square, correlation, descriptive, logistic_binary, mann_whitney, t_test_paired. Docs: dev summary, block-based plan, status updates, task list v2.0.

Co-authored-by: Cursor <cursoragent@cursor.com>
This commit is contained in:
2026-02-20 23:09:27 +08:00
parent 23b422f758
commit 428a22adf2
62 changed files with 15416 additions and 299 deletions

View File

@@ -1,10 +1,61 @@
# SSA-Pro MVP 开发计划总览
> **文档版本:** v1.5
> **文档版本:** v1.7
> **创建日期:** 2026-02-18
> **最后更新:** 2026-02-18(纳入专家配置体系 + 决策表匹配 + R代码库
> **最后更新:** 2026-02-20(纳入 Prompt 体系 + 多工具流程规划 + 数据质量核查报告
> **项目代号:** SSA (Smart Statistical Analysis)
> **MVP 目标:** 打通完整闭环,上线 10 个核心统计工具,支持咨询模式
> **MVP 目标:** 打通完整闭环,上线 10 个核心统计工具,支持多工具流程规划 + 数据质量核查
---
## 0. 🆕 智能化演进愿景(战略定位)
> **详细文档参考:** `04-开发计划/06-智能化演进共识与MVP执行计划.md`
### 0.1 产品终极目标
> **SSA-Pro 的终极目标是 Level 3颠覆性的智能分析助手**
>
> 让不懂统计的医生,能够完成专业级的统计分析。
### 0.2 三阶段演进路线
```
Phase 1/2: 爬行期 (MVP) ← 当前阶段
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
目标:打透 Tool Calling建立用户信任
机制100个工具作为固定APILLM 做智能调度
AI角色高级调度员 / 全科主任医师
Phase 2.5: 行走期
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
目标:引入受限的代码智能
机制:数据清洗允许 LLM 生成代码,核心统计仍用固定工具
Phase 3: 奔跑期 (终极愿景)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
目标:自愈型靶向代码修改
机制运行报错时LLM 根据错误日志靶向修改工具代码
关键:不是自由生成代码,而是基于现有工具的靶向修复
```
### 0.3 MVP 阶段的"为未来铺路"任务
| 伏笔任务 | Phase 3 用途 | MVP 阶段行动 |
|---------|-------------|-------------|
| **Prompt 动态注入体系** | 支持专家配置热更新 | 🆕 骨架AI工程师+ 血肉(统计专家)分离 |
| **多工具流程规划** | 复杂场景的自动化 | 🆕 LLM 生成 2-7 步串联执行流程 |
| **数据质量核查报告** | 智能诊断异常数据 | 🆕 自动生成"数据体检报告"(评分 + 建议)|
| **Prompt 世界观** | LLM 理解自己可以修改代码 | Prompt 中强调"代码库"概念 |
| **向量库代码片段** | 便于 LLM 理解工具代码 | `tools_library` 存入核心代码片段 |
| **结构化错误日志** | 用于错误反馈自愈 | 建立 JSON 格式的错误捕获管道 |
| **黄金数据集积累** | 学习"什么错误如何修复" | 完整记录每次调用(含报错) |
### 0.4 关键共识
> ⚠️ **Phase 3 的"代码智能"不是让 LLM 自由发挥写代码**
>
> 而是LLM 串联工具 → 执行 → 如果报错 → 错误日志反馈给 LLM → 靶向修改代码/参数 → 重新执行
---
@@ -16,9 +67,11 @@
|------|------|
| **统计工具** | 10 个高频工具T检验、ANOVA、卡方、相关性等 |
| **双模式支持** | 🆕 **智能分析模式**(上传数据→执行)+ **咨询模式**无数据→SAP文档|
| **核心流程** | 上传数据 → AI规划 → 用户确认 → R执行 → 结果交付 |
| **🆕 多工具流程规划** | LLM 规划 2-7 步串联流程(数据检查 → 前提检验 → 核心分析 → 效应量 → 结论)|
| **🆕 数据质量核查报告** | 自动生成"数据体检报告"(缺失值/异常值/分布/平衡性),含质量评分和建议 |
| **核心流程** | 上传数据 → **数据质量核查** → AI规划 → 用户确认 → **多步串联执行** → 结果交付 |
| **交互能力** | 计划确认卡片、执行路径树、结果展示、代码下载、🆕 SAP文档导出 |
| **智能能力** | RAG工具检索Planner规划Critic结果解读 |
| **智能能力** | 🆕 **Prompt 动态注入** + RAG工具检索 + Planner规划 + Critic结果解读 |
| **配置中台** | 🆕 统计决策表 + R代码库 + 参数映射 + 护栏规则链 + 解读模板 |
| **数据安全** | LLM只看SchemaR服务处理真实数据 |