# **Phase 1.5 补充任务:隐私安全与自动化工具** **优先级:** P0 (必须在正式处理患者数据前完成) **目的:** 解决合规性风险,降低项目部署的人力成本 ## **1\. PII 数据脱敏中间件 (Anonymizer Middleware)** 在 SoftRuleEngine 和 ChatService 调用 LLM 之前,必须对文本进行处理。 * \[ \] **实现 PII 识别正则库**: * 识别身份证号、手机号、中文姓名(2-4字)、MRN 号。 * \[ \] **实现脱敏/还原逻辑**: * **发送前 (Masking)**: 张三 (ID: 420101...) \-\> \[PATIENT\_NAME\_1\] (ID: \[ID\_CARD\_1\]) * **接收后 (Unmasking)**: 将 LLM 回复中的 \[PATIENT\_NAME\_1\] 还原为 张三 显示给前端。 * \[ \] **安全审计日志**: * 记录所有发送给 LLM 的原始 Payload(加密存储),用于事后合规审计。 ## **2\. Redcap Schema 自动对齐工具 (Auto-Mapper)** 减少 iit\_field\_mapping 的人工配置工作量。 * \[ \] **Data Dictionary 解析器**: * 读取 Redcap 导出的 Data Dictionary (CSV/JSON)。 * 提取所有字段的 Variable Name 和 Field Label。 * \[ \] **LLM 语义映射 Job**: * 输入:系统标准字段列表(如 age, gender, visit\_date)。 * 输入:Redcap 字段列表(如 nl\_age, sex\_v2, d\_visit)。 * Prompt: "请将以下 Redcap 字段与系统标准字段进行语义匹配,返回 JSON 映射表。" * \[ \] **人工确认 UI**: * 在管理后台提供一个界面,显示 LLM 猜测的映射关系,管理员点击 "Confirm" 后写入数据库。 ## **3\. 错误处理与熔断机制** * \[ \] **ReAct 循环熔断**: * 设置 SoftRuleEngine 最大重试次数为 3。 * 设置 ReActEngine 最大 Step 为 5。 * 超过限制时,返回固定的 Fallback 回复:"抱歉,该任务过于复杂或数据不足,请人工介入。"