Implement the full QPER intelligent analysis pipeline: - Phase E+: Block-based standardization for all 7 R tools, DynamicReport renderer, Word export enhancement - Phase Q: LLM intent parsing with dynamic Zod validation against real column names, ClarificationCard component, DataProfile is_id_like tagging - Phase P: ConfigLoader with Zod schema validation and hot-reload API, DecisionTableService (4-dimension matching), FlowTemplateService with EPV protection, PlannedTrace audit output - Phase R: ReflectionService with statistical slot injection, sensitivity analysis conflict rules, ConclusionReport with section reveal animation, conclusion caching API, graceful R error classification End-to-end test: 40/40 passed across two complete analysis scenarios. Co-authored-by: Cursor <cursoragent@cursor.com>
94 lines
7.1 KiB
Markdown
94 lines
7.1 KiB
Markdown
# **SSA-Pro MVP 智能化增强指南:基于理想愿景的资产提取**
|
||
|
||
**文档版本:** v1.0
|
||
|
||
**创建日期:** 2026-02-20
|
||
|
||
**文档定位:** 作为《00-MVP开发计划总览》的高级补充包。
|
||
|
||
**核心主旨:** 摒弃“重型流程引擎”的代码包袱,全面吸收《理想状态与智能化愿景设计》中的“智能交互与决策”灵魂。
|
||
|
||
## **1\. 总体评估:愿景文档的闪光点在哪里?**
|
||
|
||
《SSA-Pro 理想状态与智能化愿景设计》精准指出了传统统计软件的通病——**“逼迫用户做统计学决策”**。它提出系统应该具备:意图理解、数据诊断、决策表匹配、以及综合结论生成。
|
||
|
||
这四个要素**完全不需要复杂的底层引擎支持**,它们属于\*\*认知层(Cognitive Layer)\*\*的能力。我们完全可以把它们吸收进现有的 SSA-Planner (智能规划师) 和 SSA-Critic (结果解读) 模块中。
|
||
|
||
## **2\. 五大可落地的“愿景精华”与 MVP 补充方案**
|
||
|
||
### **💡 精华一:从“选方法”到“翻译临床意图” (Clinical Intent Translation)**
|
||
|
||
* **愿景痛点**:医生不会说“给我做个 T 检验”,只会说“这药对高血压有效吗”。
|
||
* **MVP 现状**:现有的 RAG 检索过于依赖工具名(如用户没提到 T检验,可能检索不到)。
|
||
* **如何低成本补入 MVP**:
|
||
* **行动**:在 MVP 的 Phase 1(大脑与咨询)中,强化 Query Rewriter (查询重写器) 的 Prompt。
|
||
* **具体做法**:教 LLM 建立【临床黑话 \-\> 统计术语】的映射字典。
|
||
* 遇到“有效/无效、优于、比...好” ![][image1] 映射为“差异分析、优效检验”。
|
||
* 遇到“危险因素、风险、有没有关系” ![][image1] 映射为“相关性分析、回归分析”。
|
||
* **价值**:代码 0 增加,仅靠调优 Prompt,就能让系统具备“听懂医生人话”的顶级智能感。
|
||
|
||
### **💡 精华二:用“决策表”替代“AI的瞎猜” (Decision Table Driven)**
|
||
|
||
* **愿景痛点**:完全依赖大模型(LLM)去选方法,容易产生幻觉,选错工具。
|
||
* **MVP 现状**:原计划由 LLM 阅读 10 个工具的描述,自己决定用哪个。
|
||
* **如何低成本补入 MVP**:
|
||
* **行动**:在 Config Center (配置中台) 的 Excel 表格中,强制加入**决策要素树**。
|
||
* **具体做法**:在导入的 tools\_library.xlsx 中,除了工具名字,增加三列硬性约束:
|
||
1. **X 变量要求**(如:二分类)
|
||
2. **Y 变量要求**(如:连续数值)
|
||
3. **实验设计**(如:独立/配对)
|
||
* 在 PlannerService 生成方案时,不让 LLM 自由发挥,而是让 LLM 提取用户数据的 X/Y 特征,去**严格匹配**这个决策表。
|
||
* **价值**:用最原始的“规则引擎”约束 AI,让方法选择的准确率达到 100%。
|
||
|
||
### **💡 精华三:用“场景宏工具”实现“一键全流程” (Macro-Tools for Scenarios)**
|
||
|
||
* **愿景痛点**:用户想要的是“全部分析完”,而不是一个个跑工具。
|
||
* **MVP 现状**:我们的底层是执行单节点 R 代码。
|
||
* **如何低成本补入 MVP**:
|
||
* **行动**:**降维打击!绝对不要做 Node.js 的流程引擎。** 我们用 R 语言写“套餐脚本”。
|
||
* **具体做法**:在 MVP 的 10 个工具中,保留 8 个单点工具(如 T检验、卡方),**额外新增 2 个“宏工具 (Macro-Tools)”**:
|
||
* ST\_MACRO\_RCT\_EFFICACY (临床试验疗效一键包:内部包含 Table1 画表 \+ 缺失值填补 \+ 主效应 T检验 \+ 结论汇总)。
|
||
* 这个宏工具在系统看来,依然只是\*\*“一个 R 脚本”\*\*,但它内部执行了完整的流程。
|
||
* **价值**:满足了理想愿景中“完整流程编排”的需求,却把长达 18 天的引擎开发周期,缩短为 R 工程师 1 天写一个长脚本的成本。
|
||
|
||
### **💡 精华四:前置的数据诊断与自适应 (Data Diagnosis & Adaptation)**
|
||
|
||
* **愿景痛点**:数据格式不对,直接跑会报错。
|
||
* **MVP 现状**:现有的“统计护栏”是在 R 执行时报错降级。
|
||
* **如何低成本补入 MVP**:
|
||
* **行动**:在 Planner 阶段增加轻量级的“数据诊断警告”。
|
||
* **具体做法**:在 Planner 读取到数据 Schema 后,如果发现用户想做 T 检验,但 Y 变量的类型是 String(可能包含了 "mmol/L" 等单位)。
|
||
* Planner 在生成的 SAP 卡片上提前亮黄灯:*“警告:您的结局变量当前为文本型,系统将在执行前尝试自动提取数值。若提取失败可能报错。”*
|
||
* **价值**:将后置的报错提前到前置的“诊断”,给用户极强的安全感。
|
||
|
||
### **💡 精华五:论文级的结论生成 (Publication-Ready Interpretation)**
|
||
|
||
* **愿景痛点**:系统只输出冷冰冰的 P 值,距离真正的报告还差最后一步。
|
||
* **MVP 现状**:现有的 Critic 会解释 P 值。
|
||
* **如何低成本补入 MVP**:
|
||
* **行动**:升级 Critic Agent 的输出模板。
|
||
* **具体做法**:把经典的医学报告规范(如 CONSORT 规范、STROBE 规范关于统计方法的描述要求)注入到 Critic 的 System Prompt 中。
|
||
* 强制要求 Critic 的输出结构包含:
|
||
1. **方法学描述**(可直接复制到论文 Method 部分,如:"Continuous variables were expressed as mean ± SD...")
|
||
2. **核心结论**
|
||
3. **临床意义提示**
|
||
* **价值**:真正实现了愿景中提到的“输出可直接用于论文”,产品价值瞬间翻倍。
|
||
|
||
## **3\. 补充进 《00-MVP开发计划总览》 的具体 Action Items**
|
||
|
||
为了将这些精华落地,建议在现有的 MVP 开发计划中补充以下任务(**不需要修改架构,也不增加过多工时**):
|
||
|
||
| 原 MVP 阶段 | 需补充的任务项 (源自愿景) | 负责人 | 增加工时预估 |
|
||
| :---- | :---- | :---- | :---- |
|
||
| **Phase 1: 大脑与咨询** | **M1.4** Excel 配置表中增加 X/Y 变量类型与实验设计的“决策表”字段。 | 统计专家 | \+0.5 天 |
|
||
| **Phase 1: 大脑与咨询** | **B1.5** 优化 Planner Prompt,使其能把临床意图(如“对比疗效”)映射为统计术语。 | 后端开发 | \+1 天 |
|
||
| **Phase 2: 四肢与执行** | **R2.4** 在 10 个工具指标外,编写 1-2 个包含多步操作的 **“场景宏工具 (Macro R Script)”**。 | R 开发 | \+1.5 天 |
|
||
| **Phase 3: 合体与交付** | **B3.1** 优化 Critic Prompt,强制按学术期刊规范输出“方法学说明”和“综合报告”。 | 后端/专家 | \+0.5 天 |
|
||
|
||
## **4\. 总结:给理想主义者的致敬**
|
||
|
||
这套增强方案是对原愿景文档最好的回应:
|
||
|
||
**“我们完全认同您提出的所有智能化用户体验(意图识别、智能诊断、流程包、论文级报告),并且我们找到了无需重建底层引擎,用极低成本在 MVP 阶段就能实现它们的方法。”**
|
||
|
||
[image1]: <data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAABMAAAAXCAYAAADpwXTaAAAAX0lEQVR4XmNgGAWjYCQAeXn50+hiZAOgYU/QxcgGcnJy2kA8HV2cbAB03SwgDkIXB0lIkomnAfF1oBHM1DBsERCfRzGMHCCPy5ukAmgETEAXJwvIUzFpMMpTM9GOcAAAmV0cRTlI2MMAAAAASUVORK5CYII=> |