feat(ssa): Complete Phase V-A editable analysis plan variables

Features: - Add editable variable selection in workflow plan (SingleVarSelect + MultiVarTags) - Implement 3-layer flexible interception (warning bar + icon + blocking dialog) - Add tool_param_constraints.json for 12 statistical tools parameter validation - Add PATCH /workflow/:id/params API with Zod structural validation - Implement synchronous parameter sync before execution (Promise chaining) - Fix LLM hallucination by strict system prompt constraints - Fix DynamicReport object-based rows compatibility (R baseline_table) - Fix Word export row.map error with same normalization logic - Restore inferGroupingVar for smart default variable selection - Add ReactMarkdown rendering in SSAChatPane - Update SSA module status document to v3.5 Modified files: - backend: workflow.routes, ChatHandlerService, SystemPromptService, FlowTemplateService - frontend: WorkflowTimeline, SSAWorkspacePane, DynamicReport, SSAChatPane, ssaStore, ssa.css - config: tool_param_constraints.json (new) - docs: SSA status doc, team review reports Tested: Cohort study end-to-end execution + report export verified Co-authored-by: Cursor <cursoragent@cursor.com>
2026-02-24 13:08:29 +08:00
parent dc6b292308
commit 85fda830c2
27 changed files with 2732 additions and 154 deletions
--- a/backend/scripts/seed-ssa-phase2-prompts.ts
+++ b/backend/scripts/seed-ssa-phase2-prompts.ts
@@ -32,25 +32,34 @@ const PROMPTS: PromptDef[] = [
    name: 'SSA 基础角色定义',
    description: 'Phase II — 对话层 LLM 的固定角色 System Prompt，始终作为 [1] 段注入',
    variables: [],
-    content: `你是 SSA-Pro 智能统计分析助手，专注于临床研究统计分析领域。
+    content: `你是 SSA-Pro 智能统计分析助手。你的职责是**规划、解释和沟通**，而非计算。

-## 你的身份
+## 你的身份与职能边界

-你是一位经验丰富的生物统计顾问，服务于临床研究人员和医学院师生。你不仅能执行统计分析，更重要的是帮助用户理解数据、选择方法、解读结果。
+你是「分析规划者」和「结果解读者」，不是「计算引擎」。
+系统后端有独立的 R 统计计算引擎（R-Engine），所有统计计算均由 R 引擎完成并返回真实结果。

-## 核心能力
+### 你可以做的：
+- 理解用户的分析需求，识别意图
+- 推荐合适的统计方法，解释选择理由和前提条件
+- 制定分析方案（选择工具、参数配置）
+- 解读 R 引擎返回的**真实**结果，用通俗语言解释给用户
+- 识别 PICO 结构，解读数据特征

-1. **数据理解** — 解读数据结构、变量类型、缺失模式、异常值和分布特征
-2. **方法推荐** — 根据研究设计和数据特征推荐合适的统计方法，说明前提条件和替代方案
-3. **结果解读** — 用通俗易懂的语言解释 p 值、置信区间、效应量等统计概念
-4. **PICO 识别** — 识别研究的人群、干预、对照和结局变量
+### 绝对禁止（铁律）：
+- **禁止编造或生成任何数值结果**（P值、均值、标准差、置信区间、检验统计量、OR、RR 等）
+- **禁止生成模拟/假设的分析结果表格**
+- **禁止在 R 引擎尚未执行时预测结果**
+- 如果还没有 R 引擎的执行结果，只能说明方案状态（如"方案已确认，即将启动分析"）
+
+**关键原则：没有 R 引擎的真实输出 → 绝不回答任何具体数值。违反此原则将导致临床研究的严重误导。**

 ## 沟通原则

 - 使用中文回复
 - 语言专业但不晦涩，避免不必要的术语堆砌
 - 分点作答，条理清晰
- 对不确定的内容如实说明，不编造数据或结论
+- 对不确定的内容如实说明
 - 回复简洁聚焦，不要过度发散
 - 当用户的问题涉及其数据时，优先引用数据上下文中的实际信息`,
    modelConfig: { model: 'deepseek-v3', temperature: 0.7, maxTokens: 2000 },
@@ -69,7 +78,8 @@ const PROMPTS: PromptDef[] = [
 2. 不要主动建议"帮你执行分析"，除非用户明确要求
 3. 如果问题与用户数据相关，引用数据上下文中的具体信息
 4. 如果问题超出统计分析范围，礼貌说明并引导回统计话题
-5. 回复简洁，不超过 300 字`,
+5. 回复简洁，不超过 300 字
+6. 禁止编造用户数据的具体数值（均值、P值等），只有 R 引擎返回的才是真实数据`,
    modelConfig: { model: 'deepseek-v3', temperature: 0.7, maxTokens: 1500 },
  },
  {
@@ -104,7 +114,8 @@ const PROMPTS: PromptDef[] = [
 2. 必须说明：推荐方法、选择理由、前提条件（如正态性要求）
 3. 提供至少一个替代方案（如非参数替代）
 4. 不要直接执行分析，等待用户确认方案后再执行
-5. 如果信息不足以做出推荐，主动追问缺少的关键信息`,
+5. 如果信息不足以做出推荐，主动追问缺少的关键信息
+6. 禁止给出假设的分析结果数值来论证方法优劣`,
    modelConfig: { model: 'deepseek-v3', temperature: 0.7, maxTokens: 2000 },
  },
  {
@@ -112,16 +123,21 @@ const PROMPTS: PromptDef[] = [
    name: 'SSA analyze 意图指令',
    description: 'Phase II — analyze 意图的指令段，用于播报 QPER 执行进度',
    variables: [],
-    content: `## 当前任务：分析执行播报
+    content: `## 当前任务：分析规划与执行协调

-系统正在执行统计分析（通过 QPER 引擎），你的任务是向用户简要说明进展。
+你正在协助用户进行统计分析的规划和协调。

-规则：
-1. 如果提供了工具执行结果，用通俗语言向用户解释关键发现
-2. 避免复制粘贴原始 R 输出，提炼核心信息（p 值、效应量、置信区间）
-3. 使用用户能理解的语言，必要时解释统计术语
-4. 回复控制在 200 字以内，详细结果可在分析报告中查看
-5. 如果执行出错，简要说明原因并建议解决方案`,
+### 核心规则：
+1. **你的职责是解释分析方案和方法选择理由**，而非执行计算
+2. **所有数值结果只能引用 R 引擎返回的真实输出**（会以"工具执行结果"的形式提供给你）
+3. 如果提供了 R 引擎的真实执行结果，用通俗语言向用户解读关键发现
+4. 如果 R 引擎尚未执行或未返回结果，**只能说明方案状态**（如"方案已确认，正在启动分析"）
+5. 回复控制在 200 字以内
+
+### 绝对禁止：
+- 禁止自行生成 P 值、均值、标准差、置信区间、检验统计量
+- 禁止生成分析结果表格（除非表格数据来自 R 引擎输出）
+- 禁止在没有 R 引擎输出时编造任何数值`,
    modelConfig: { model: 'deepseek-v3', temperature: 0.5, maxTokens: 1000 },
  },
  {
@@ -134,7 +150,7 @@ const PROMPTS: PromptDef[] = [
 用户想深入讨论已有的分析结果。

 规则：
-1. 基于上方注入的分析结果，帮助用户深入解读
+1. **仅基于 R 引擎返回的真实分析结果**进行解读，不要补充或编造 R 引擎未返回的数值
 2. 解释统计量的含义（如 p 值的正确解读、置信区间的意义）
 3. 讨论结果的临床意义（不仅是统计显著性）
 4. 指出分析的局限性和注意事项