Files
HaHafeng 371e1c069c feat(ssa): Complete QPER architecture - Query, Planner, Execute, Reflection layers
Implement the full QPER intelligent analysis pipeline:

- Phase E+: Block-based standardization for all 7 R tools, DynamicReport renderer, Word export enhancement

- Phase Q: LLM intent parsing with dynamic Zod validation against real column names, ClarificationCard component, DataProfile is_id_like tagging

- Phase P: ConfigLoader with Zod schema validation and hot-reload API, DecisionTableService (4-dimension matching), FlowTemplateService with EPV protection, PlannedTrace audit output

- Phase R: ReflectionService with statistical slot injection, sensitivity analysis conflict rules, ConclusionReport with section reveal animation, conclusion caching API, graceful R error classification

End-to-end test: 40/40 passed across two complete analysis scenarios.

Co-authored-by: Cursor <cursoragent@cursor.com>
2026-02-21 18:15:53 +08:00

94 lines
7.1 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# **SSA-Pro MVP 智能化增强指南:基于理想愿景的资产提取**
**文档版本:** v1.0
**创建日期:** 2026-02-20
**文档定位:** 作为《00-MVP开发计划总览》的高级补充包。
**核心主旨:** 摒弃“重型流程引擎”的代码包袱,全面吸收《理想状态与智能化愿景设计》中的“智能交互与决策”灵魂。
## **1\. 总体评估:愿景文档的闪光点在哪里?**
《SSA-Pro 理想状态与智能化愿景设计》精准指出了传统统计软件的通病——**“逼迫用户做统计学决策”**。它提出系统应该具备:意图理解、数据诊断、决策表匹配、以及综合结论生成。
这四个要素**完全不需要复杂的底层引擎支持**,它们属于\*\*认知层Cognitive Layer\*\*的能力。我们完全可以把它们吸收进现有的 SSA-Planner (智能规划师) 和 SSA-Critic (结果解读) 模块中。
## **2\. 五大可落地的“愿景精华”与 MVP 补充方案**
### **💡 精华一:从“选方法”到“翻译临床意图” (Clinical Intent Translation)**
* **愿景痛点**:医生不会说“给我做个 T 检验”,只会说“这药对高血压有效吗”。
* **MVP 现状**:现有的 RAG 检索过于依赖工具名(如用户没提到 T检验可能检索不到
* **如何低成本补入 MVP**
* **行动**:在 MVP 的 Phase 1大脑与咨询强化 Query Rewriter (查询重写器) 的 Prompt。
* **具体做法**:教 LLM 建立【临床黑话 \-\> 统计术语】的映射字典。
* 遇到“有效/无效、优于、比...好” ![][image1] 映射为“差异分析、优效检验”。
* 遇到“危险因素、风险、有没有关系” ![][image1] 映射为“相关性分析、回归分析”。
* **价值**:代码 0 增加,仅靠调优 Prompt就能让系统具备“听懂医生人话”的顶级智能感。
### **💡 精华二用“决策表”替代“AI的瞎猜” (Decision Table Driven)**
* **愿景痛点**完全依赖大模型LLM去选方法容易产生幻觉选错工具。
* **MVP 现状**:原计划由 LLM 阅读 10 个工具的描述,自己决定用哪个。
* **如何低成本补入 MVP**
* **行动**:在 Config Center (配置中台) 的 Excel 表格中,强制加入**决策要素树**。
* **具体做法**:在导入的 tools\_library.xlsx 中,除了工具名字,增加三列硬性约束:
1. **X 变量要求**(如:二分类)
2. **Y 变量要求**(如:连续数值)
3. **实验设计**(如:独立/配对)
* 在 PlannerService 生成方案时,不让 LLM 自由发挥,而是让 LLM 提取用户数据的 X/Y 特征,去**严格匹配**这个决策表。
* **价值**:用最原始的“规则引擎”约束 AI让方法选择的准确率达到 100%。
### **💡 精华三:用“场景宏工具”实现“一键全流程” (Macro-Tools for Scenarios)**
* **愿景痛点**:用户想要的是“全部分析完”,而不是一个个跑工具。
* **MVP 现状**:我们的底层是执行单节点 R 代码。
* **如何低成本补入 MVP**
* **行动****降维打击!绝对不要做 Node.js 的流程引擎。** 我们用 R 语言写“套餐脚本”。
* **具体做法**:在 MVP 的 10 个工具中,保留 8 个单点工具(如 T检验、卡方**额外新增 2 个“宏工具 (Macro-Tools)”**
* ST\_MACRO\_RCT\_EFFICACY (临床试验疗效一键包:内部包含 Table1 画表 \+ 缺失值填补 \+ 主效应 T检验 \+ 结论汇总)。
* 这个宏工具在系统看来,依然只是\*\*“一个 R 脚本”\*\*,但它内部执行了完整的流程。
* **价值**:满足了理想愿景中“完整流程编排”的需求,却把长达 18 天的引擎开发周期,缩短为 R 工程师 1 天写一个长脚本的成本。
### **💡 精华四:前置的数据诊断与自适应 (Data Diagnosis & Adaptation)**
* **愿景痛点**:数据格式不对,直接跑会报错。
* **MVP 现状**:现有的“统计护栏”是在 R 执行时报错降级。
* **如何低成本补入 MVP**
* **行动**:在 Planner 阶段增加轻量级的“数据诊断警告”。
* **具体做法**:在 Planner 读取到数据 Schema 后,如果发现用户想做 T 检验,但 Y 变量的类型是 String可能包含了 "mmol/L" 等单位)。
* Planner 在生成的 SAP 卡片上提前亮黄灯:*“警告:您的结局变量当前为文本型,系统将在执行前尝试自动提取数值。若提取失败可能报错。”*
* **价值**:将后置的报错提前到前置的“诊断”,给用户极强的安全感。
### **💡 精华五:论文级的结论生成 (Publication-Ready Interpretation)**
* **愿景痛点**:系统只输出冷冰冰的 P 值,距离真正的报告还差最后一步。
* **MVP 现状**:现有的 Critic 会解释 P 值。
* **如何低成本补入 MVP**
* **行动**:升级 Critic Agent 的输出模板。
* **具体做法**:把经典的医学报告规范(如 CONSORT 规范、STROBE 规范关于统计方法的描述要求)注入到 Critic 的 System Prompt 中。
* 强制要求 Critic 的输出结构包含:
1. **方法学描述**(可直接复制到论文 Method 部分,如:"Continuous variables were expressed as mean ± SD..."
2. **核心结论**
3. **临床意义提示**
* **价值**:真正实现了愿景中提到的“输出可直接用于论文”,产品价值瞬间翻倍。
## **3\. 补充进 《00-MVP开发计划总览》 的具体 Action Items**
为了将这些精华落地,建议在现有的 MVP 开发计划中补充以下任务(**不需要修改架构,也不增加过多工时**
| 原 MVP 阶段 | 需补充的任务项 (源自愿景) | 负责人 | 增加工时预估 |
| :---- | :---- | :---- | :---- |
| **Phase 1: 大脑与咨询** | **M1.4** Excel 配置表中增加 X/Y 变量类型与实验设计的“决策表”字段。 | 统计专家 | \+0.5 天 |
| **Phase 1: 大脑与咨询** | **B1.5** 优化 Planner Prompt使其能把临床意图如“对比疗效”映射为统计术语。 | 后端开发 | \+1 天 |
| **Phase 2: 四肢与执行** | **R2.4** 在 10 个工具指标外,编写 1-2 个包含多步操作的 **“场景宏工具 (Macro R Script)”**。 | R 开发 | \+1.5 天 |
| **Phase 3: 合体与交付** | **B3.1** 优化 Critic Prompt强制按学术期刊规范输出“方法学说明”和“综合报告”。 | 后端/专家 | \+0.5 天 |
## **4\. 总结:给理想主义者的致敬**
这套增强方案是对原愿景文档最好的回应:
**“我们完全认同您提出的所有智能化用户体验(意图识别、智能诊断、流程包、论文级报告),并且我们找到了无需重建底层引擎,用极低成本在 MVP 阶段就能实现它们的方法。”**
[image1]: <data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAABMAAAAXCAYAAADpwXTaAAAAX0lEQVR4XmNgGAWjYCQAeXn50+hiZAOgYU/QxcgGcnJy2kA8HV2cbAB03SwgDkIXB0lIkomnAfF1oBHM1DBsERCfRzGMHCCPy5ukAmgETEAXJwvIUzFpMMpTM9GOcAAAmV0cRTlI2MMAAAAASUVORK5CYII=>