Files

HaHafeng 371e1c069c feat(ssa): Complete QPER architecture - Query, Planner, Execute, Reflection layers

Implement the full QPER intelligent analysis pipeline:

- Phase E+: Block-based standardization for all 7 R tools, DynamicReport renderer, Word export enhancement

- Phase Q: LLM intent parsing with dynamic Zod validation against real column names, ClarificationCard component, DataProfile is_id_like tagging

- Phase P: ConfigLoader with Zod schema validation and hot-reload API, DecisionTableService (4-dimension matching), FlowTemplateService with EPV protection, PlannedTrace audit output

- Phase R: ReflectionService with statistical slot injection, sensitivity analysis conflict rules, ConclusionReport with section reveal animation, conclusion caching API, graceful R error classification

End-to-end test: 40/40 passed across two complete analysis scenarios.

Co-authored-by: Cursor <cursoragent@cursor.com>

2026-02-21 18:15:53 +08:00

7.1 KiB

Raw Blame History

SSA-Pro MVP 智能化增强指南：基于理想愿景的资产提取

文档版本： v1.0

创建日期： 2026-02-20

文档定位： 作为《00-MVP开发计划总览》的高级补充包。

核心主旨： 摒弃“重型流程引擎”的代码包袱，全面吸收《理想状态与智能化愿景设计》中的“智能交互与决策”灵魂。

1. 总体评估：愿景文档的闪光点在哪里？

《SSA-Pro 理想状态与智能化愿景设计》精准指出了传统统计软件的通病——“逼迫用户做统计学决策”。它提出系统应该具备：意图理解、数据诊断、决策表匹配、以及综合结论生成。

这四个要素完全不需要复杂的底层引擎支持，它们属于**认知层（Cognitive Layer）**的能力。我们完全可以把它们吸收进现有的 SSA-Planner (智能规划师) 和 SSA-Critic (结果解读) 模块中。

2. 五大可落地的“愿景精华”与 MVP 补充方案

💡 精华一：从“选方法”到“翻译临床意图” (Clinical Intent Translation)

愿景痛点：医生不会说“给我做个 T 检验”，只会说“这药对高血压有效吗”。
MVP 现状：现有的 RAG 检索过于依赖工具名（如用户没提到 T检验，可能检索不到）。
如何低成本补入 MVP：
- 行动：在 MVP 的 Phase 1（大脑与咨询）中，强化 Query Rewriter (查询重写器) 的 Prompt。
- 具体做法：教 LLM 建立【临床黑话 -> 统计术语】的映射字典。
  - 遇到“有效/无效、优于、比...好” 映射为“差异分析、优效检验”。
  - 遇到“危险因素、风险、有没有关系” 映射为“相关性分析、回归分析”。
- 价值：代码 0 增加，仅靠调优 Prompt，就能让系统具备“听懂医生人话”的顶级智能感。

💡 精华二：用“决策表”替代“AI的瞎猜” (Decision Table Driven)

愿景痛点：完全依赖大模型（LLM）去选方法，容易产生幻觉，选错工具。
MVP 现状：原计划由 LLM 阅读 10 个工具的描述，自己决定用哪个。
如何低成本补入 MVP：
- 行动：在 Config Center (配置中台) 的 Excel 表格中，强制加入决策要素树。
- 具体做法：在导入的 tools_library.xlsx 中，除了工具名字，增加三列硬性约束：
  1. X 变量要求（如：二分类）
  2. Y 变量要求（如：连续数值）
  3. 实验设计（如：独立/配对）
- 在 PlannerService 生成方案时，不让 LLM 自由发挥，而是让 LLM 提取用户数据的 X/Y 特征，去严格匹配这个决策表。
- 价值：用最原始的“规则引擎”约束 AI，让方法选择的准确率达到 100%。

💡 精华三：用“场景宏工具”实现“一键全流程” (Macro-Tools for Scenarios)

愿景痛点：用户想要的是“全部分析完”，而不是一个个跑工具。
MVP 现状：我们的底层是执行单节点 R 代码。
如何低成本补入 MVP：
- 行动：降维打击！绝对不要做 Node.js 的流程引擎。 我们用 R 语言写“套餐脚本”。
- 具体做法：在 MVP 的 10 个工具中，保留 8 个单点工具（如 T检验、卡方），额外新增 2 个“宏工具 (Macro-Tools)”：
  - ST_MACRO_RCT_EFFICACY (临床试验疗效一键包：内部包含 Table1 画表 + 缺失值填补 + 主效应 T检验 + 结论汇总)。
  - 这个宏工具在系统看来，依然只是**“一个 R 脚本”**，但它内部执行了完整的流程。
- 价值：满足了理想愿景中“完整流程编排”的需求，却把长达 18 天的引擎开发周期，缩短为 R 工程师 1 天写一个长脚本的成本。

💡 精华四：前置的数据诊断与自适应 (Data Diagnosis & Adaptation)

愿景痛点：数据格式不对，直接跑会报错。
MVP 现状：现有的“统计护栏”是在 R 执行时报错降级。
如何低成本补入 MVP：
- 行动：在 Planner 阶段增加轻量级的“数据诊断警告”。
- 具体做法：在 Planner 读取到数据 Schema 后，如果发现用户想做 T 检验，但 Y 变量的类型是 String（可能包含了 "mmol/L" 等单位）。
- Planner 在生成的 SAP 卡片上提前亮黄灯：“警告：您的结局变量当前为文本型，系统将在执行前尝试自动提取数值。若提取失败可能报错。”
- 价值：将后置的报错提前到前置的“诊断”，给用户极强的安全感。

💡 精华五：论文级的结论生成 (Publication-Ready Interpretation)

愿景痛点：系统只输出冷冰冰的 P 值，距离真正的报告还差最后一步。
MVP 现状：现有的 Critic 会解释 P 值。
如何低成本补入 MVP：
- 行动：升级 Critic Agent 的输出模板。
- 具体做法：把经典的医学报告规范（如 CONSORT 规范、STROBE 规范关于统计方法的描述要求）注入到 Critic 的 System Prompt 中。
- 强制要求 Critic 的输出结构包含：
  1. 方法学描述（可直接复制到论文 Method 部分，如："Continuous variables were expressed as mean ± SD..."）
  2. 核心结论
  3. 临床意义提示
- 价值：真正实现了愿景中提到的“输出可直接用于论文”，产品价值瞬间翻倍。

3. 补充进《00-MVP开发计划总览》的具体 Action Items

为了将这些精华落地，建议在现有的 MVP 开发计划中补充以下任务（不需要修改架构，也不增加过多工时）：

原 MVP 阶段	需补充的任务项 (源自愿景)	负责人	增加工时预估
Phase 1: 大脑与咨询	M1.4 Excel 配置表中增加 X/Y 变量类型与实验设计的“决策表”字段。	统计专家	+0.5 天
Phase 1: 大脑与咨询	B1.5 优化 Planner Prompt，使其能把临床意图（如“对比疗效”）映射为统计术语。	后端开发	+1 天
Phase 2: 四肢与执行	R2.4 在 10 个工具指标外，编写 1-2 个包含多步操作的 “场景宏工具 (Macro R Script)”。	R 开发	+1.5 天
Phase 3: 合体与交付	B3.1 优化 Critic Prompt，强制按学术期刊规范输出“方法学说明”和“综合报告”。	后端/专家	+0.5 天

4. 总结：给理想主义者的致敬

这套增强方案是对原愿景文档最好的回应：

“我们完全认同您提出的所有智能化用户体验（意图识别、智能诊断、流程包、论文级报告），并且我们找到了无需重建底层引擎，用极低成本在 MVP 阶段就能实现它们的方法。”

7.1 KiB Raw Blame History Unescape Escape