Implement the full QPER intelligent analysis pipeline: - Phase E+: Block-based standardization for all 7 R tools, DynamicReport renderer, Word export enhancement - Phase Q: LLM intent parsing with dynamic Zod validation against real column names, ClarificationCard component, DataProfile is_id_like tagging - Phase P: ConfigLoader with Zod schema validation and hot-reload API, DecisionTableService (4-dimension matching), FlowTemplateService with EPV protection, PlannedTrace audit output - Phase R: ReflectionService with statistical slot injection, sensitivity analysis conflict rules, ConclusionReport with section reveal animation, conclusion caching API, graceful R error classification End-to-end test: 40/40 passed across two complete analysis scenarios. Co-authored-by: Cursor <cursoragent@cursor.com>
7.1 KiB
7.1 KiB
SSA-Pro MVP 智能化增强指南:基于理想愿景的资产提取
文档版本: v1.0
创建日期: 2026-02-20
文档定位: 作为《00-MVP开发计划总览》的高级补充包。
核心主旨: 摒弃“重型流程引擎”的代码包袱,全面吸收《理想状态与智能化愿景设计》中的“智能交互与决策”灵魂。
1. 总体评估:愿景文档的闪光点在哪里?
《SSA-Pro 理想状态与智能化愿景设计》精准指出了传统统计软件的通病——“逼迫用户做统计学决策”。它提出系统应该具备:意图理解、数据诊断、决策表匹配、以及综合结论生成。
这四个要素完全不需要复杂的底层引擎支持,它们属于**认知层(Cognitive Layer)**的能力。我们完全可以把它们吸收进现有的 SSA-Planner (智能规划师) 和 SSA-Critic (结果解读) 模块中。
2. 五大可落地的“愿景精华”与 MVP 补充方案
💡 精华一:从“选方法”到“翻译临床意图” (Clinical Intent Translation)
- 愿景痛点:医生不会说“给我做个 T 检验”,只会说“这药对高血压有效吗”。
- MVP 现状:现有的 RAG 检索过于依赖工具名(如用户没提到 T检验,可能检索不到)。
- 如何低成本补入 MVP:
- 行动:在 MVP 的 Phase 1(大脑与咨询)中,强化 Query Rewriter (查询重写器) 的 Prompt。
- 具体做法:教 LLM 建立【临床黑话 -> 统计术语】的映射字典。
- 遇到“有效/无效、优于、比...好”
映射为“差异分析、优效检验”。
- 遇到“危险因素、风险、有没有关系”
映射为“相关性分析、回归分析”。
- 遇到“有效/无效、优于、比...好”
- 价值:代码 0 增加,仅靠调优 Prompt,就能让系统具备“听懂医生人话”的顶级智能感。
💡 精华二:用“决策表”替代“AI的瞎猜” (Decision Table Driven)
- 愿景痛点:完全依赖大模型(LLM)去选方法,容易产生幻觉,选错工具。
- MVP 现状:原计划由 LLM 阅读 10 个工具的描述,自己决定用哪个。
- 如何低成本补入 MVP:
- 行动:在 Config Center (配置中台) 的 Excel 表格中,强制加入决策要素树。
- 具体做法:在导入的 tools_library.xlsx 中,除了工具名字,增加三列硬性约束:
- X 变量要求(如:二分类)
- Y 变量要求(如:连续数值)
- 实验设计(如:独立/配对)
- 在 PlannerService 生成方案时,不让 LLM 自由发挥,而是让 LLM 提取用户数据的 X/Y 特征,去严格匹配这个决策表。
- 价值:用最原始的“规则引擎”约束 AI,让方法选择的准确率达到 100%。
💡 精华三:用“场景宏工具”实现“一键全流程” (Macro-Tools for Scenarios)
- 愿景痛点:用户想要的是“全部分析完”,而不是一个个跑工具。
- MVP 现状:我们的底层是执行单节点 R 代码。
- 如何低成本补入 MVP:
- 行动:降维打击!绝对不要做 Node.js 的流程引擎。 我们用 R 语言写“套餐脚本”。
- 具体做法:在 MVP 的 10 个工具中,保留 8 个单点工具(如 T检验、卡方),额外新增 2 个“宏工具 (Macro-Tools)”:
- ST_MACRO_RCT_EFFICACY (临床试验疗效一键包:内部包含 Table1 画表 + 缺失值填补 + 主效应 T检验 + 结论汇总)。
- 这个宏工具在系统看来,依然只是**“一个 R 脚本”**,但它内部执行了完整的流程。
- 价值:满足了理想愿景中“完整流程编排”的需求,却把长达 18 天的引擎开发周期,缩短为 R 工程师 1 天写一个长脚本的成本。
💡 精华四:前置的数据诊断与自适应 (Data Diagnosis & Adaptation)
- 愿景痛点:数据格式不对,直接跑会报错。
- MVP 现状:现有的“统计护栏”是在 R 执行时报错降级。
- 如何低成本补入 MVP:
- 行动:在 Planner 阶段增加轻量级的“数据诊断警告”。
- 具体做法:在 Planner 读取到数据 Schema 后,如果发现用户想做 T 检验,但 Y 变量的类型是 String(可能包含了 "mmol/L" 等单位)。
- Planner 在生成的 SAP 卡片上提前亮黄灯:“警告:您的结局变量当前为文本型,系统将在执行前尝试自动提取数值。若提取失败可能报错。”
- 价值:将后置的报错提前到前置的“诊断”,给用户极强的安全感。
💡 精华五:论文级的结论生成 (Publication-Ready Interpretation)
- 愿景痛点:系统只输出冷冰冰的 P 值,距离真正的报告还差最后一步。
- MVP 现状:现有的 Critic 会解释 P 值。
- 如何低成本补入 MVP:
- 行动:升级 Critic Agent 的输出模板。
- 具体做法:把经典的医学报告规范(如 CONSORT 规范、STROBE 规范关于统计方法的描述要求)注入到 Critic 的 System Prompt 中。
- 强制要求 Critic 的输出结构包含:
- 方法学描述(可直接复制到论文 Method 部分,如:"Continuous variables were expressed as mean ± SD...")
- 核心结论
- 临床意义提示
- 价值:真正实现了愿景中提到的“输出可直接用于论文”,产品价值瞬间翻倍。
3. 补充进 《00-MVP开发计划总览》 的具体 Action Items
为了将这些精华落地,建议在现有的 MVP 开发计划中补充以下任务(不需要修改架构,也不增加过多工时):
| 原 MVP 阶段 | 需补充的任务项 (源自愿景) | 负责人 | 增加工时预估 |
|---|---|---|---|
| Phase 1: 大脑与咨询 | M1.4 Excel 配置表中增加 X/Y 变量类型与实验设计的“决策表”字段。 | 统计专家 | +0.5 天 |
| Phase 1: 大脑与咨询 | B1.5 优化 Planner Prompt,使其能把临床意图(如“对比疗效”)映射为统计术语。 | 后端开发 | +1 天 |
| Phase 2: 四肢与执行 | R2.4 在 10 个工具指标外,编写 1-2 个包含多步操作的 “场景宏工具 (Macro R Script)”。 | R 开发 | +1.5 天 |
| Phase 3: 合体与交付 | B3.1 优化 Critic Prompt,强制按学术期刊规范输出“方法学说明”和“综合报告”。 | 后端/专家 | +0.5 天 |
4. 总结:给理想主义者的致敬
这套增强方案是对原愿景文档最好的回应:
“我们完全认同您提出的所有智能化用户体验(意图识别、智能诊断、流程包、论文级报告),并且我们找到了无需重建底层引擎,用极低成本在 MVP 阶段就能实现它们的方法。”