feat(admin): Add user management and upgrade to module permission system

Features - User Management (Phase 4.1): - Database: Add user_modules table for fine-grained module permissions - Database: Add 4 user permissions (view/create/edit/delete) to role_permissions - Backend: UserService (780 lines) - CRUD with tenant isolation - Backend: UserController + UserRoutes (648 lines) - 13 API endpoints - Backend: Batch import users from Excel - Frontend: UserListPage (412 lines) - list/filter/search/pagination - Frontend: UserFormPage (341 lines) - create/edit with module config - Frontend: UserDetailPage (393 lines) - details/tenant/module management - Frontend: 3 modal components (592 lines) - import/assign/configure - API: GET/POST/PUT/DELETE /api/admin/users/* endpoints Architecture Upgrade - Module Permission System: - Backend: Add getUserModules() method in auth.service - Backend: Login API returns modules array in user object - Frontend: AuthContext adds hasModule() method - Frontend: Navigation filters modules based on user.modules - Frontend: RouteGuard checks requiredModule instead of requiredVersion - Frontend: Remove deprecated version-based permission system - UX: Only show accessible modules in navigation (clean UI) - UX: Smart redirect after login (avoid 403 for regular users) Fixes: - Fix UTF-8 encoding corruption in ~100 docs files - Fix pageSize type conversion in userService (String to Number) - Fix authUser undefined error in TopNavigation - Fix login redirect logic with role-based access check - Update Git commit guidelines v1.2 with UTF-8 safety rules Database Changes: - CREATE TABLE user_modules (user_id, tenant_id, module_code, is_enabled) - ADD UNIQUE CONSTRAINT (user_id, tenant_id, module_code) - INSERT 4 permissions + role assignments - UPDATE PUBLIC tenant with 8 module subscriptions Technical: - Backend: 5 new files (~2400 lines) - Frontend: 10 new files (~2500 lines) - Docs: 1 development record + 2 status updates + 1 guideline update - Total: ~4900 lines of code Status: User management 100% complete, module permission system operational
2026-01-16 13:42:10 +08:00
parent 98d862dbd4
commit 66255368b7
560 changed files with 70424 additions and 52353 deletions
--- a/docs/03-业务模块/ASL-AI智能文献/02-技术设计/06-质量保障与可追溯策略.md
+++ b/docs/03-业务模块/ASL-AI智能文献/02-技术设计/06-质量保障与可追溯策略.md
@@ -1,71 +1,71 @@
 # ASL 质量保障与可追溯策略

-> **鏂囨。鐗堟湰锛?* V1.0  
-> **鍒涘缓鏃ユ湡锛?* 2025-11-15  
-> **閫傜敤妯″潡锛?* AI 鏅鸿兘鏂囩尞锛圓SL锛? 
-> **鐩<EFBFBD>爣锛?* 鍒嗛樁娈垫彁鍗囨枃鐚<E69E83>瓫閫夈€佹暟鎹<E69A9F>彁鍙栫殑鍑嗙‘鐜囥€佽川閲忔帶鍒跺拰鍙<E68BB0>拷婧<E68BB7>€?
+> **文档版本：** V1.0  
+> **创建日期：** 2025-11-15  
+> **适用模块：** AI 智能文献（ASL）  
+> **目标：** 分阶段提升文献筛选、数据提取的准确率、质量控制和可追溯性

 ---

 ## 📋 文档概述

-鏈<EFBFBD>枃妗ｅ畾涔変簡 ASL 妯″潡鍦?**MVP 鈫?V1.0 鈫?V2.0** 涓変釜闃舵<E99783>涓<EFBFBD>紝濡備綍閫愭<E996AB>鎻愬崌锛?
-1. **鎻愬彇鍑嗙‘鐜?*锛氫粠鍩虹<E98DA9>鍙<EFBFBD>敤 鈫?楂樿川閲?鈫?鍖诲<E98D96>绾ф爣鍑?
-2. **璐ㄩ噺鎺у埗**锛氫粠浜哄伐鎶芥煡 鈫?鑷<>姩楠岃瘉 鈫?鏅鸿兘浠茶<E6B5A0>
-3. **鍙<EFBFBD>拷婧<EFBFBD>€?*锛氫粠鍩烘湰璁板綍 鈫?瀹屾暣璇佹嵁閾?鈫?瀹¤<E780B9>绾ф棩蹇?
+本文档定义了 ASL 模块在 **MVP → V1.0 → V2.0** 三个阶段中，如何逐步提升：
+1. **提取准确率**：从基础可用 → 高质量 → 医学级标准
+2. **质量控制**：从人工抽查 → 自动验证 → 智能仲裁
+3. **可追溯性**：从基本记录 → 完整证据链 → 审计级日志

 ### 核心设计原则

 | 原则 | 说明 |
 |------|------|
-| **鎴愭湰鍙<EFBFBD>帶** | MVP 闃舵<EFBFBD>浼樺厛浣跨敤 DeepSeek + Qwen3锛屾垚鏈<EFBFBD>晱鎰?|
-| **璐ㄩ噺鍙<EFBFBD>崌绾?* | 鍙<>垏鎹㈠埌 GPT-5-Pro + Claude-4.5 楂樼<EFBFBD>缁勫悎 |
-| **鍒嗘<EFBFBD>瀹炴柦** | 閬垮厤杩囧害璁捐<EFBFBD>锛屾瘡涓<EFBFBD>樁娈典氦浠樺彲鐢ㄥ姛鑳?|
-| **鍖诲<EFBFBD>鍦烘櫙浼樺寲** | 閽堝<E996BD>鑻辨枃鍖诲<E98D96>鏂囩尞鐨勭壒鐐逛紭鍖栫瓥鐣?|
+| **成本可控** | MVP 阶段优先使用 DeepSeek + Qwen3，成本敏感 |
+| **质量可升级** | 可切换到 GPT-5-Pro + Claude-4.5 高端组合 |
+| **分步实施** | 避免过度设计，每个阶段交付可用功能 |
+| **医学场景优化** | 针对英文医学文献的特点优化策略 |

 ---

 ## 🎯 三阶段路线图

 ```
-MVP (4鍛?              V1.0 (6鍛?            V2.0 (8鍛?
-鈹溾攢 鍩虹<E98DA9>鍙屾ā鍨嬮獙璇?     鈹溾攢 鏅鸿兘璐ㄩ噺鎺у埗      鈹溾攢 鍖诲<E98D96>绾ц川閲忎繚闅?
-鈹溾攢 JSON Schema 绾︽潫    鈹溾攢 鍒嗘<E98D92>鎻愬彇浼樺寲      鈹溾攢 澶氭ā鍨嬪叡璇嗕徊瑁?
-鈹溾攢 缃<>俊搴﹁瘎鍒?         鈹溾攢 璇佹嵁閾惧畬鏁磋拷婧?   鈹溾攢 鑷<>姩璐ㄩ噺瀹¤<E780B9>
-鈹溾攢 浜哄伐澶嶆牳鏈哄埗        鈹溾攢 瑙勫垯寮曟搸楠岃瘉      鈹溾攢 鎻愮ず璇嶇増鏈<E5A297><E98F88>鐞?
-鈹斺攢 鍩烘湰杩芥函鏃ュ織        鈹斺攢 Few-shot 绀轰緥搴?  鈹斺攢 HITL 鏅鸿兘鍒嗘祦
-   鈫?                     鈫?                   鈫?
-  鍙<EFBFBD>敤                  楂樿川閲?               鍖诲<EFBFBD>绾?
+MVP (4周)              V1.0 (6周)            V2.0 (8周)
+├─ 基础双模型验证      ├─ 智能质量控制      ├─ 医学级质量保障
+├─ JSON Schema 约束    ├─ 分段提取优化      ├─ 多模型共识仲裁
+├─ 置信度评分          ├─ 证据链完整追溯    ├─ 自动质量审计
+├─ 人工复核机制        ├─ 规则引擎验证      ├─ 提示词版本管理
+└─ 基本追溯日志        └─ Few-shot 示例库   └─ HITL 智能分流
+   ↓                      ↓                    ↓
+  可用                  高质量                医学级
 ```

 ---

-## 馃殌 MVP 闃舵<EFBFBD>锛? 鍛<>級
+## 🚀 MVP 阶段（4 周）

 ### 目标定位

- **鍑嗙‘鐜囩洰鏍?*锛氣墺 85%
- **鎴愭湰棰勭畻**锛氱瓫閫?1000 绡囨枃鐚?鈮?楼50
+- **准确率目标**：≥ 85%
+- **成本预算**：筛选 1000 篇文献 ≤ ¥50
 - **交付标准**：基础功能可用，支持双模型对比

 ### 一、模型选择策略

 #### 1.1 主力模型组合（成本优先）

-| 瑙掕壊 | 妯″瀷 | Model ID | 鐢ㄩ€?| 鎴愭湰 |
+| 角色 | 模型 | Model ID | 用途 | 成本 |
 |------|------|---------|------|------|
-| **妯″瀷 A** | DeepSeek-V3 | `deepseek-chat` | 蹇<EFBFBD>€熷垵绛?| 楼0.001/1K tokens |
+| **模型 A** | DeepSeek-V3 | `deepseek-chat` | 快速初筛 | ¥0.001/1K tokens |
 | **模型 B** | Qwen3-72B | `qwen-max` | 交叉验证 | ¥0.004/1K tokens |

-**鍒囨崲閫夐」**锛堣川閲忎紭鍏堬級锛?
+**切换选项**（质量优先）：
 - **高端组合**：GPT-5-Pro (`gpt-5-pro`) + Claude-4.5-Sonnet (`claude-sonnet-4-5-20250929`)
- **鎴愭湰澧炲姞**锛氱害 3-5 鍊?
- **鍑嗙‘鐜囨彁鍗?*锛?5% 鈫?92%+
+- **成本增加**：约 3-5 倍
+- **准确率提升**：85% → 92%+

 #### 1.2 模型调用策略

 ```typescript
-// 鍙屾ā鍨嬪苟琛岃皟鐢?
+// 双模型并行调用
 async function dualModelScreening(
  literature: Literature,
  protocol: Protocol
@@ -80,7 +80,7 @@ async function dualModelScreening(
  const decisionA = parseJSON(resultA.content);
  const decisionB = parseJSON(resultB.content);

-  // 涓€鑷存€у垽鏂?
+  // 一致性判断
  if (decisionA.decision === decisionB.decision) {
    return {
      finalDecision: decisionA.decision,
@@ -90,7 +90,7 @@ async function dualModelScreening(
    };
  }

-  // 鍐茬獊 鈫?浜哄伐澶嶆牳
+  // 冲突 → 人工复核
  return {
    finalDecision: 'uncertain',
    consensus: 'conflict',
@@ -100,16 +100,16 @@ async function dualModelScreening(
 }
 ```

-### 浜屻€佹牳蹇冩妧鏈<EFBFBD>瓥鐣?
+### 二、核心技术策略

-#### 2.1 鉁?鍙屾ā鍨嬩氦鍙夐獙璇?
+#### 2.1 ✅ 双模型交叉验证

-**瀹炴柦鏂规<EFBFBD>**锛?
- 鎵€鏈夌瓫閫変换鍔″悓鏃惰皟鐢ㄤ袱涓<EFBFBD>ā鍨?
- 鑷<EFBFBD>姩瀵规瘮缁撴灉锛屾爣璁板樊寮?
- 涓€鑷寸巼浣滀负璐ㄩ噺鎸囨爣锛堢洰鏍?鈮?80%锛?
+**实施方案**：
+- 所有筛选任务同时调用两个模型
+- 自动对比结果，标记差异
+- 一致率作为质量指标（目标 ≥ 80%）

-**浠ｇ爜绀轰緥**锛?
+**代码示例**：
 ```typescript
 interface DualModelResult {
  consensus: 'high' | 'conflict';
@@ -119,14 +119,14 @@ interface DualModelResult {
 }
 ```

-#### 2.2 鉁?JSON Schema 绾︽潫
+#### 2.2 ✅ JSON Schema 约束

-**瀹炴柦鏂规<EFBFBD>**锛?
- 瀹氫箟涓ユ牸鐨勮緭鍑烘牸寮?
- 浣跨敤鏋氫妇闄愬埗鍙栧€?
- 鍖哄垎蹇呭～/鍙<>€夊瓧娈?
+**实施方案**：
+- 定义严格的输出格式
+- 使用枚举限制取值
+- 区分必填/可选字段

-**Schema 瀹氫箟**锛?
+**Schema 定义**：
 ```json
 {
  "$schema": "http://json-schema.org/draft-07/schema#",
@@ -177,10 +177,10 @@ interface DualModelResult {
 }
 ```

-**鎻愮ず璇嶆ā鏉?*锛?
+**提示词模板**：
 ```typescript
 const prompt = `
-浣犳槸涓€浣嶅尰瀛︽枃鐚<EFBFBD>瓫閫変笓瀹躲€傝<EFBFBD>鏍规嵁浠ヤ笅 PICO 鏍囧噯鍒ゆ柇杩欑瘒鏂囩尞鏄<E5B09E>惁搴旇<E690B4>绾冲叆绯荤粺璇勪环銆?
+你是一位医学文献筛选专家。请根据以下 PICO 标准判断这篇文献是否应该纳入系统评价。

 # PICO 标准
 - Population: ${protocol.population}
@@ -193,26 +193,26 @@ const prompt = `
 摘要: ${literature.abstract}

 # 输出要求
-璇蜂弗鏍兼寜鐓т互涓?JSON Schema 杈撳嚭缁撴灉锛?
+请严格按照以下 JSON Schema 输出结果：

 ${JSON.stringify(schema, null, 2)}

-娉ㄦ剰锛?
-1. decision 鍙<EFBFBD>兘鏄?"include"銆?exclude" 鎴?"uncertain"
-2. reason 蹇呴』鍏蜂綋璇存槑鍒ゆ柇渚濇嵁锛?0-500瀛楋級
-3. confidence 涓?0-1 涔嬮棿鐨勬暟鍊硷紝琛ㄧず浣犵殑鍒ゆ柇鎶婃彙
+注意：
+1. decision 只能是 "include"、"exclude" 或 "uncertain"
+2. reason 必须具体说明判断依据（10-500字）
+3. confidence 为 0-1 之间的数值，表示你的判断把握
 4. pico 字段逐项评估匹配程度
 `;
 ```

-#### 2.3 鉁?缃<>俊搴﹁瘎鍒?
+#### 2.3 ✅ 置信度评分

-**瀹炴柦鏂规<EFBFBD>**锛?
- 瑕佹眰妯″瀷瀵规瘡涓<EFBFBD>垽鏂<EFBFBD>粰鍑虹疆淇″害锛?-1锛?
- 缃<EFBFBD>俊搴?< 0.7 鑷<EFBFBD>姩鏍囪<EFBFBD>涓洪渶浜哄伐澶嶆牳
- 璁板綍缃<EFBFBD>俊搴﹀垎甯冿紝浼樺寲闃堝€?
+**实施方案**：
+- 要求模型对每个判断给出置信度（0-1）
+- 置信度 < 0.7 自动标记为需人工复核
+- 记录置信度分布，优化阈值

-**鑷<EFBFBD>姩鍒嗘祦瑙勫垯**锛?
+**自动分流规则**：
 ```typescript
 function autoTriage(result: DualModelResult) {
  const avgConfidence = (
@@ -220,29 +220,29 @@ function autoTriage(result: DualModelResult) {
    result.models[1].confidence
  ) / 2;

-  // 瑙勫垯1锛氬啿绐?鈫?蹇呴』澶嶆牳
+  // 规则1：冲突 → 必须复核
  if (result.consensus === 'conflict') {
    return { needReview: true, priority: 'high' };
  }

-  // 瑙勫垯2锛氫綆缃<EFBFBD>俊搴?鈫?闇€瑕佸<E79195>鏍?
+  // 规则2：低置信度 → 需要复核
  if (avgConfidence < 0.7) {
    return { needReview: true, priority: 'medium' };
  }

-  // 瑙勫垯3锛氶珮缃<EFBFBD>俊搴?+ 涓€鑷?鈫?鑷<>姩閫氳繃
+  // 规则3：高置信度 + 一致 → 自动通过
  return { needReview: false, priority: 'low' };
 }
 ```

-#### 2.4 鉁?鍩虹<E98DA9>鍙<EFBFBD>拷婧?
+#### 2.4 ✅ 基础可追溯

-**瀹炴柦鏂规<EFBFBD>**锛?
+**实施方案**：
 - 保存原始提示词和模型输出
 - 记录模型版本和时间戳
 - 关联人工复核记录

-**鏁版嵁搴撹<EFBFBD>璁?*锛?
+**数据库设计**：
 ```prisma
 model ScreeningResult {
  id              String   @id @default(uuid())
@@ -259,7 +259,7 @@ model ScreeningResult {
  modelBOutput    Json
  modelBConfidence Float
  
-  // 鏈€缁堝喅绛?
+  // 最终决策
  finalDecision   String   // "include"/"exclude"/"uncertain"
  consensus       String   // "high"/"conflict"
  needReview      Boolean
@@ -270,7 +270,7 @@ model ScreeningResult {
  reviewDecision  String?
  reviewNotes     String?
  
-  // 鍙<EFBFBD>拷婧<EFBFBD>俊鎭?
+  // 可追溯信息
  promptTemplate  String   @db.Text  // 使用的提示词模板
  createdAt       DateTime @default(now())
  
@@ -280,53 +280,53 @@ model ScreeningResult {

 ### 三、MVP 成本预算

-**鍦烘櫙锛氱瓫閫?1000 绡囨枃鐚?*
+**场景：筛选 1000 篇文献**

 | 项目 | DeepSeek | Qwen3 | 合计 |
 |------|----------|-------|------|
 | 输入 tokens（平均） | 800 | 800 | - |
 | 输出 tokens（平均） | 200 | 200 | - |
 | 单次成本 | ¥0.001 | ¥0.004 | ¥0.005 |
-| **1000 绡囨€绘垚鏈?* | 楼1 | 楼4 | **楼5** |
+| **1000 篇总成本** | ¥1 | ¥4 | **¥5** |

-**鍐茬獊鐜?20% 浜哄伐澶嶆牳**锛?
- 鑷<EFBFBD>姩閫氳繃锛?00 绡?脳 楼0.005 = 楼4
- 浜哄伐澶嶆牳锛?00 绡?脳 2 鍒嗛挓 = 6.7 灏忔椂
- **鎬绘垚鏈?*锛毬? + 浜哄伐鎴愭湰
+**冲突率 20% 人工复核**：
+- 自动通过：800 篇 × ¥0.005 = ¥4
+- 人工复核：200 篇 × 2 分钟 = 6.7 小时
+- **总成本**：¥4 + 人工成本

 ### 四、MVP 验收标准

 | 指标 | 目标 | 验证方法 |
 |------|------|----------|
-| 鍙屾ā鍨嬩竴鑷寸巼 | 鈮?80% | 缁熻<EFBFBD>鎶ヨ〃 |
-| JSON Schema 楠岃瘉閫氳繃鐜?| 鈮?95% | 鑷<>姩妫€鏌?|
-| 浜哄伐澶嶆牳闃熷垪鍗犳瘮 | 鈮?20% | 绯荤粺缁熻<EFBFBD> |
-| 鎻愬彇缁撴灉鍙<EFBFBD>拷婧?| 100% | 瀹¤<EFBFBD>妫€鏌?|
-| 鎴愭湰鎺у埗 | 鈮?楼50/1000 绡?| 璐﹀崟鐩戞帶 |
+| 双模型一致率 | ≥ 80% | 统计报表 |
+| JSON Schema 验证通过率 | ≥ 95% | 自动检查 |
+| 人工复核队列占比 | ≤ 20% | 系统统计 |
+| 提取结果可追溯 | 100% | 审计检查 |
+| 成本控制 | ≤ ¥50/1000 篇 | 账单监控 |

 ---

-## 馃搱 V1.0 闃舵<EFBFBD>锛? 鍛<>級
+## 📈 V1.0 阶段（6 周）

 ### 目标定位

- **鍑嗙‘鐜囩洰鏍?*锛氣墺 90%
- **鎴愭湰棰勭畻**锛氱瓫閫?1000 绡囨枃鐚?鈮?楼80
- **浜や粯鏍囧噯**锛氶珮璐ㄩ噺杈撳嚭锛屾櫤鑳借川閲忔帶鍒?
+- **准确率目标**：≥ 90%
+- **成本预算**：筛选 1000 篇文献 ≤ ¥80
+- **交付标准**：高质量输出，智能质量控制

-### 涓€銆佹ā鍨嬬瓥鐣ヤ紭鍖?
+### 一、模型策略优化

 #### 1.1 成本优化策略

-**鏍稿績鎬濊矾**锛?0% 鐢ㄤ綆鎴愭湰妯″瀷锛?0% 楂樹环鍊间换鍔＄敤椤剁骇妯″瀷
+**核心思路**：80% 用低成本模型，20% 高价值任务用顶级模型

 ```typescript
 async function smartScreening(literature: Literature, protocol: Protocol) {
-  // 绗<EFBFBD>竴闃舵<EFBFBD>锛氬揩閫熷垵绛涳紙DeepSeek锛?
+  // 第一阶段：快速初筛（DeepSeek）
  const quickResult = await llmService.chat('deepseek', buildPrompt(...));
  const quickDecision = parseJSON(quickResult.content);

-  // 濡傛灉楂樼疆淇″害 + 鏄庣‘缁撹<E7BC81> 鈫?鐩存帴閲囩撼
+  // 如果高置信度 + 明确结论 → 直接采纳
  if (
    quickDecision.confidence > 0.85 && 
    quickDecision.decision !== 'uncertain'
@@ -338,7 +338,7 @@ async function smartScreening(literature: Literature, protocol: Protocol) {
    };
  }

-  // 鍚﹀垯 鈫?鍚<>敤楂樼<E6A582>妯″瀷澶嶆牳
+  // 否则 → 启用高端模型复核
  const detailedResult = await llmService.chat('gpt5', buildPrompt(...));
  return {
    finalDecision: detailedResult.decision,
@@ -348,21 +348,21 @@ async function smartScreening(literature: Literature, protocol: Protocol) {
 }
 ```

-**棰勬湡鎴愭湰鑺傜渷**锛?
- 80% 浠诲姟鐢?DeepSeek锛?00 脳 楼0.001 = 楼0.8
- 20% 浠诲姟鐢?GPT-5锛?00 脳 楼0.10 = 楼20
- **鎬绘垚鏈?*锛毬?0.8锛堢浉姣斿叏鐢?GPT-5 鑺傜渷 80%锛?
+**预期成本节省**：
+- 80% 任务用 DeepSeek：800 × ¥0.001 = ¥0.8
+- 20% 任务用 GPT-5：200 × ¥0.10 = ¥20
+- **总成本**：¥20.8（相比全用 GPT-5 节省 80%）

-### 浜屻€佹牳蹇冩妧鏈<EFBFBD><EFBFBD>寮?
+### 二、核心技术增强

-#### 2.1 鉁?Few-shot 绀轰緥搴?
+#### 2.1 ✅ Few-shot 示例库

-**瀹炴柦鏂规<EFBFBD>**锛?
+**实施方案**：
 - 人工标注 20-30 个高质量示例
 - 针对不同研究类型分类（RCT、队列、病例对照）
- 鍔ㄦ€侀€夋嫨鐩镐技绀轰緥宓屽叆鎻愮ず璇?
+- 动态选择相似示例嵌入提示词

-**绀轰緥鏍煎紡**锛?
+**示例格式**：
 ```json
 {
  "examples": [
@@ -371,7 +371,7 @@ async function smartScreening(literature: Literature, protocol: Protocol) {
      "abstract": "...",
      "goldStandard": {
        "decision": "include",
-        "reason": "RCT鐮旂┒锛屼汉缇や负绯栧翱鐥呮偅鑰咃紙鍖归厤P锛夛紝骞查<EFBFBD>涓洪樋鍙稿尮鏋楋紙鍖归厤I锛夛紝瀵圭収涓哄畨鎱板墏锛堝尮閰岰锛夛紝缁撳眬涓哄績琛€绠′簨浠讹紙鍖归厤O锛?,
+        "reason": "RCT研究，人群为糖尿病患者（匹配P），干预为阿司匹林（匹配I），对照为安慰剂（匹配C），结局为心血管事件（匹配O）",
        "pico": {
          "population": "match",
          "intervention": "match",
@@ -385,12 +385,12 @@ async function smartScreening(literature: Literature, protocol: Protocol) {
 }
 ```

-**鎻愮ず璇嶅<EFBFBD>寮?*锛?
+**提示词增强**：
 ```typescript
 const promptWithExamples = `
-# 鍙傝€冪ず渚?
+# 参考示例

-浠ヤ笅鏄?3 涓<>爣娉ㄥソ鐨勭ず渚嬶紝甯<E7B49D>姪浣犵悊瑙ｅ垽鏂<E59EBD>爣鍑嗭細
+以下是 3 个标注好的示例，帮助你理解判断标准：

 ${examples.map((ex, i) => `
 ## 示例 ${i + 1}
@@ -400,22 +400,22 @@ ${examples.map((ex, i) => `
 理由: ${ex.goldStandard.reason}
 `).join('\n')}

-# 寰呯瓫閫夋枃鐚?
+# 待筛选文献
 标题: ${literature.title}
 摘要: ${literature.abstract}

-璇峰弬鑰冧笂杩扮ず渚嬶紝杈撳嚭浣犵殑鍒ゆ柇缁撴灉锛圝SON鏍煎紡锛夈€?
+请参考上述示例，输出你的判断结果（JSON格式）。
 `;
 ```

-#### 2.2 鉁?鍒嗘<E98D92>鎻愬彇
+#### 2.2 ✅ 分段提取

-**瀹炴柦鏂规<EFBFBD>**锛?
+**实施方案**：
 - 针对全文数据提取，按章节分段处理
 - 每段独立提取，减少上下文混淆
- 鏈€鍚庡悎骞剁粨鏋滐紝浜ゅ弶楠岃瘉涓€鑷存€?
+- 最后合并结果，交叉验证一致性

-**鍒嗘<EFBFBD>绛栫暐**锛?
+**分段策略**：
 ```typescript
 async function segmentedExtraction(fullText: string, protocol: Protocol) {
  // 分段
@@ -437,54 +437,54 @@ async function segmentedExtraction(fullText: string, protocol: Protocol) {
 }
 ```

-**鎻愬彇绀轰緥锛堟柟娉曞<EFBFBD>閮ㄥ垎锛?*锛?
+**提取示例（方法学部分）**：
 ```typescript
 const methodsPrompt = `
 请从以下方法学部分提取研究设计信息：

-# 鏂规硶瀛﹀師鏂?
+# 方法学原文
 ${methodsSection}

 # 提取字段
 - 研究设计类型（RCT/cohort/case-control等）
- 鏍锋湰閲忥紙骞查<EFBFBD>缁?瀵圭収缁勶級
+- 样本量（干预组/对照组）
 - 纳入标准
 - 排除标准
- 闅忔満鍖栨柟娉曪紙濡傞€傜敤锛?
- 鐩叉硶锛堝<EFBFBD>閫傜敤锛?
+- 随机化方法（如适用）
+- 盲法（如适用）

-# 杈撳嚭鏍煎紡锛圝SON锛?
+# 输出格式（JSON）
 ${methodsSchema}
 `;
 ```

-#### 2.3 鉁?瑙勫垯寮曟搸楠岃瘉
+#### 2.3 ✅ 规则引擎验证

-**瀹炴柦鏂规<EFBFBD>**锛?
+**实施方案**：
 - 定义业务规则，自动检查逻辑错误
- 鏁板€艰寖鍥撮獙璇?
- 蹇呭～瀛楁<EFBFBD>瀹屾暣鎬ф<EFBFBD>鏌?
+- 数值范围验证
+- 必填字段完整性检查

-**楠岃瘉瑙勫垯**锛?
+**验证规则**：
 ```typescript
 const validationRules = [
  {
-    name: '鏍锋湰閲忓悎鐞嗘€?,
+    name: '样本量合理性',
    check: (data) => {
      const total = data.sampleSize.intervention + data.sampleSize.control;
      return total >= 10 && total <= 100000;
    },
-    errorMessage: '鏍锋湰閲忚秴鍑哄悎鐞嗚寖鍥达紙10-100000锛?
+    errorMessage: '样本量超出合理范围（10-100000）'
  },
  {
-    name: 'P鍊艰寖鍥?,
+    name: 'P值范围',
    check: (data) => {
      return data.pValue >= 0 && data.pValue <= 1;
    },
    errorMessage: 'P值必须在0-1之间'
  },
  {
-    name: '蹇呭～瀛楁<EFBFBD>瀹屾暣鎬?,
+    name: '必填字段完整性',
    check: (data) => {
      const required = ['studyDesign', 'sampleSize', 'primaryOutcome'];
      return required.every(field => data[field] != null);
@@ -507,14 +507,14 @@ function validateExtraction(data: ExtractionResult): ValidationReport {
 }
 ```

-#### 2.4 鉁?瀹屾暣璇佹嵁閾?
+#### 2.4 ✅ 完整证据链

-**瀹炴柦鏂规<EFBFBD>**锛?
+**实施方案**：
 - 记录原文引用位置（页码、段落、句子）
- 淇濆瓨妯″瀷瀹屾暣杈撳嚭锛堝惈涓<EFBFBD>棿鎺ㄧ悊锛?
- 鍏宠仈鎵€鏈変汉宸ヤ慨鏀硅<EFBFBD>褰?
+- 保存模型完整输出（含中间推理）
+- 关联所有人工修改记录

-**鏁版嵁搴撳<EFBFBD>寮?*锛?
+**数据库增强**：
 ```prisma
 model ExtractionResult {
  id              String   @id @default(uuid())
@@ -522,7 +522,7 @@ model ExtractionResult {
  // 提取内容
  extractedData   Json
  
-  // 璇佹嵁閾撅紙鏂板<EFBFBD>锛?
+  // 证据链（新增）
  evidenceChain   Json     // {
                           //   "sampleSize": {
                           //     "value": 150,
@@ -538,7 +538,7 @@ model ExtractionResult {
  modelName       String
  modelVersion    String
  promptVersion   String   // "v1.2.0"
-  rawOutput       String   @db.Text  // 鍘熷<EFBFBD>杈撳嚭锛堝惈CoT鎺ㄧ悊锛?
+  rawOutput       String   @db.Text  // 原始输出（含CoT推理）
  
  // 修改历史
  revisions       ExtractionRevision[]
@@ -551,7 +551,7 @@ model ExtractionRevision {
  id              String   @id @default(uuid())
  extractionId    String
  
-  fieldName       String   // 淇<EFBFBD>敼鐨勫瓧娈?
+  fieldName       String   // 修改的字段
  oldValue        Json
  newValue        Json
  reason          String   // 修改理由
@@ -566,41 +566,41 @@ model ExtractionRevision {

 ### 三、V1.0 成本预算

-**鍦烘櫙锛氱瓫閫?1000 绡?+ 鎻愬彇 200 绡囧叏鏂?*
+**场景：筛选 1000 篇 + 提取 200 篇全文**

 | 任务 | 策略 | 成本 |
 |------|------|------|
-| 鏍囬<EFBFBD>鎽樿<EFBFBD>绛涢€?| 80% DeepSeek + 20% GPT-5 | 楼21 |
-| 鍏ㄦ枃鏁版嵁鎻愬彇 | 鍒嗘<E98D92>鎻愬彇锛圙PT-5锛?| 楼60 |
-| **鎬绘垚鏈?* | - | **楼81** |
+| 标题摘要筛选 | 80% DeepSeek + 20% GPT-5 | ¥21 |
+| 全文数据提取 | 分段提取（GPT-5） | ¥60 |
+| **总成本** | - | **¥81** |

 ### 四、V1.0 验收标准

 | 指标 | 目标 | 验证方法 |
 |------|------|----------|
-| 鎻愬彇鍑嗙‘鐜?| 鈮?90% | 浜哄伐鎶芥煡 50 绡?|
-| Few-shot 绀轰緥搴?| 鈮?20 涓?| 浜哄伐鏍囨敞 |
-| 瑙勫垯寮曟搸瑕嗙洊鐜?| 鈮?80% | 浠ｇ爜瀹℃煡 |
-| 璇佹嵁閾惧畬鏁存€?| 100% | 瀹¤<EFBFBD>妫€鏌?|
-| 鎴愭湰鎺у埗 | 鈮?楼80/椤圭洰 | 璐﹀崟鐩戞帶 |
+| 提取准确率 | ≥ 90% | 人工抽查 50 篇 |
+| Few-shot 示例库 | ≥ 20 个 | 人工标注 |
+| 规则引擎覆盖率 | ≥ 80% | 代码审查 |
+| 证据链完整性 | 100% | 审计检查 |
+| 成本控制 | ≤ ¥80/项目 | 账单监控 |

 ---

-## 馃弳 V2.0 闃舵<EFBFBD>锛? 鍛<>級
+## 🏆 V2.0 阶段（8 周）

 ### 目标定位

- **鍑嗙‘鐜囩洰鏍?*锛氣墺 95%锛堝尰瀛︾骇锛?
+- **准确率目标**：≥ 95%（医学级）
 - **成本预算**：按需配置
- **浜や粯鏍囧噯**锛氳嚜鍔ㄥ寲璐ㄩ噺瀹¤<E780B9>锛岀<E9949B>鍚堜复搴婄爺绌惰<E7BB8C>鑼?
+- **交付标准**：自动化质量审计，符合临床研究规范

 ### 一、医学级质量保障

-#### 1.1 鉁?涓夋ā鍨嬪叡璇嗕徊瑁?
+#### 1.1 ✅ 三模型共识仲裁

-**瀹炴柦鏂规<EFBFBD>**锛?
+**实施方案**：
 - 双模型冲突时，自动启用第三方仲裁
- 涓夋ā鍨嬫姇绁ㄥ喅绛?
+- 三模型投票决策
 - 记录仲裁过程

 ```typescript
@@ -608,7 +608,7 @@ async function threeModelArbitration(
  literature: Literature,
  protocol: Protocol
 ) {
-  // 绗<EFBFBD>竴杞<EFBFBD>細鍙屾ā鍨?
+  // 第一轮：双模型
  const [resultA, resultB] = await Promise.all([
    llmService.chat('deepseek', buildPrompt(...)),
    llmService.chat('qwen', buildPrompt(...))
@@ -619,11 +619,11 @@ async function threeModelArbitration(
    return { finalDecision: resultA.decision, arbitration: false };
  }

-  // 鍐茬獊 鈫?鍚<>敤 Claude 浠茶<EFBFBD>
-  console.log('妫€娴嬪埌鍐茬獊锛屽惎鐢?Claude-4.5 浠茶<EFBFBD>...');
+  // 冲突 → 启用 Claude 仲裁
+  console.log('检测到冲突，启用 Claude-4.5 仲裁...');
  const resultC = await llmService.chat('claude', buildPrompt(...));

-  // 涓夋ā鍨嬫姇绁?
+  // 三模型投票
  const votes = [resultA.decision, resultB.decision, resultC.decision];
  const voteCount = {
    include: votes.filter(v => v === 'include').length,
@@ -631,7 +631,7 @@ async function threeModelArbitration(
    uncertain: votes.filter(v => v === 'uncertain').length,
  };

-  // 澶氭暟鍐?
+  // 多数决
  const winner = Object.entries(voteCount)
    .sort((a, b) => b[1] - a[1])[0][0];

@@ -644,39 +644,39 @@ async function threeModelArbitration(
 }
 ```

-**鎴愭湰鎺у埗**锛?
- 浠呭湪鍐茬獊鏃跺惎鐢ㄤ徊瑁侊紙棰勮<EFBFBD> 10-15%锛?
- 鍗曟<EFBFBD>浠茶<EFBFBD>棰濆<EFBFBD>鎴愭湰锛毬?.021锛圕laude-4.5锛?
+**成本控制**：
+- 仅在冲突时启用仲裁（预计 10-15%）
+- 单次仲裁额外成本：¥0.021（Claude-4.5）

-#### 1.2 鉁?HITL 鏅鸿兘鍒嗘祦
+#### 1.2 ✅ HITL 智能分流

-**瀹炴柦鏂规<EFBFBD>**锛?
+**实施方案**：
 - 基于规则的智能优先级排序
- 楂樹环鍊?楂橀<E6A582>闄╀换鍔′紭鍏堜汉宸ュ<E5AEB8>鏍?
+- 高价值/高风险任务优先人工复核
 - 低风险任务自动化处理

-**鍒嗘祦瑙勫垯**锛?
+**分流规则**：
 ```typescript
 function intelligentTriage(result: ScreeningResult): TriageDecision {
  let priority = 0;
  let needReview = false;

-  // 瑙勫垯1锛氫笁妯″瀷浠嶄笉涓€鑷?鈫?鏈€楂樹紭鍏堢骇
+  // 规则1：三模型仍不一致 → 最高优先级
  if (result.arbitration && result.consensus === 'weak') {
    priority = 100;
    needReview = true;
  }
-  // 瑙勫垯2锛歊CT 鐮旂┒ 鈫?涓<>瓑浼樺厛绾?
+  // 规则2：RCT 研究 → 中等优先级
  else if (result.studyDesign === 'RCT') {
    priority = 70;
    needReview = result.confidence < 0.9;
  }
-  // 瑙勫垯3锛氬叧閿<EFBFBD>粨灞€鎸囨爣 鈫?楂樹紭鍏堢骇
+  // 规则3：关键结局指标 → 高优先级
  else if (result.outcome.includes('mortality')) {
    priority = 80;
    needReview = result.confidence < 0.85;
  }
-  // 瑙勫垯4锛氶珮缃<EFBFBD>俊搴?+ 涓€鑷?鈫?鑷<>姩閫氳繃
+  // 规则4：高置信度 + 一致 → 自动通过
  else if (result.confidence > 0.95 && result.consensus === 'high') {
    priority = 10;
    needReview = false;
@@ -686,27 +686,27 @@ function intelligentTriage(result: ScreeningResult): TriageDecision {
 }
 ```

-#### 1.3 鉁?鎻愮ず璇嶇増鏈<E5A297><E98F88>鐞?
+#### 1.3 ✅ 提示词版本管理

-**瀹炴柦鏂规<EFBFBD>**锛?
- Git 绠＄悊鎻愮ず璇嶆ā鏉?
+**实施方案**：
+- Git 管理提示词模板
 - 版本号标记（语义化版本）
 - A/B 测试不同版本效果

-**鐩<EFBFBD>綍缁撴瀯**锛?
+**目录结构**：
 ```
 backend/prompts/asl/
 ├── screening/
-鈹?  鈹溾攢鈹€ v1.0.0-basic.txt
-鈹?  鈹溾攢鈹€ v1.1.0-with-examples.txt
-鈹?  鈹斺攢鈹€ v1.2.0-cot.txt
+│   ├── v1.0.0-basic.txt
+│   ├── v1.1.0-with-examples.txt
+│   └── v1.2.0-cot.txt
 ├── extraction/
-鈹?  鈹溾攢鈹€ v1.0.0-methods.txt
-鈹?  鈹斺攢鈹€ v1.1.0-methods-segmented.txt
+│   ├── v1.0.0-methods.txt
+│   └── v1.1.0-methods-segmented.txt
 └── changelog.md
 ```

-**鐗堟湰璁板綍**锛?
+**版本记录**：
 ```prisma
 model PromptVersion {
  id              String   @id @default(uuid())
@@ -727,14 +727,14 @@ model PromptVersion {
 }
 ```

-#### 1.4 鉁?鑷<>姩璐ㄩ噺瀹¤<E780B9>
+#### 1.4 ✅ 自动质量审计

-**瀹炴柦鏂规<EFBFBD>**锛?
- 瀹氭湡鎵归噺鎶芥煡锛?0%锛?
+**实施方案**：
+- 定期批量抽查（10%）
 - 自动生成质量报告
 - 异常检测和告警

-**瀹¤<EFBFBD>鎶ヨ〃**锛?
+**审计报表**：
 ```typescript
 interface QualityAuditReport {
  period: { start: Date; end: Date };
@@ -742,8 +742,8 @@ interface QualityAuditReport {
  sampledTasks: number;
  
  metrics: {
-    accuracy: number;           // 鍑嗙‘鐜?
-    interRaterAgreement: number; // 浜烘満涓€鑷存€?
+    accuracy: number;           // 准确率
+    interRaterAgreement: number; // 人机一致性
    falsePositiveRate: number;   // 假阳性率
    falseNegativeRate: number;   // 假阴性率
  };
@@ -766,14 +766,14 @@ interface QualityAuditReport {

 ### 二、高级提示词工程

-#### 2.1 鉁?Chain of Thought (CoT)
+#### 2.1 ✅ Chain of Thought (CoT)

-**瀹炴柦鏂规<EFBFBD>**锛?
+**实施方案**：
 - 要求模型输出推理过程
- 鍒嗘<EFBFBD>楠ゅ垽鏂?PICO 鍖归厤搴?
- 鏈€鍚庣粰鍑虹患鍚堢粨璁?
+- 分步骤判断 PICO 匹配度
+- 最后给出综合结论

-**鎻愮ず璇嶇ず渚?*锛?
+**提示词示例**：
 ```
 请按照以下步骤判断这篇文献是否应该纳入：

@@ -788,15 +788,15 @@ interface QualityAuditReport {
 - Outcome: 详细分析结局指标是否匹配

 # Step 3: 综合判断
- 姹囨€讳互涓婂垎鏋?
- 缁欏嚭鏈€缁堝喅绛栵紙include/exclude/uncertain锛?
- 璇勪及缃<EFBFBD>俊搴︼紙0-1锛?
+- 汇总以上分析
+- 给出最终决策（include/exclude/uncertain）
+- 评估置信度（0-1）

 # 输出格式
 {
  "reasoning": {
-    "studyDesign": "杩欐槸涓€椤?..",
-    "population": "浜虹兢鍖归厤搴﹀垎鏋?..",
+    "studyDesign": "这是一项...",
+    "population": "人群匹配度分析...",
    "intervention": "干预措施分析...",
    "comparison": "对照分析...",
    "outcome": "结局指标分析..."
@@ -807,19 +807,19 @@ interface QualityAuditReport {
 }
 ```

-#### 2.2 鉁?鍔ㄦ€佺ず渚嬮€夋嫨
+#### 2.2 ✅ 动态示例选择

-**瀹炴柦鏂规<EFBFBD>**锛?
- 璁＄畻寰呯瓫閫夋枃鐚<EFBFBD>笌绀轰緥搴撶殑璇<EFBFBD>箟鐩镐技搴?
- 鍔ㄦ€侀€夋嫨鏈€鐩镐技鐨?3-5 涓<>ず渚?
- 宓屽叆鎻愮ず璇?
+**实施方案**：
+- 计算待筛选文献与示例库的语义相似度
+- 动态选择最相似的 3-5 个示例
+- 嵌入提示词

 ```typescript
 async function selectSimilarExamples(
  literature: Literature,
  examplePool: Example[]
 ): Promise<Example[]> {
-  // 浣跨敤宓屽叆妯″瀷璁＄畻鐩镐技搴?
+  // 使用嵌入模型计算相似度
  const literatureEmbedding = await getEmbedding(
    `${literature.title} ${literature.abstract}`
  );
@@ -829,7 +829,7 @@ async function selectSimilarExamples(
    similarity: cosineSimilarity(literatureEmbedding, ex.embedding)
  }));

-  // 杩斿洖鏈€鐩镐技鐨?5 涓?
+  // 返回最相似的 5 个
  return similarities
    .sort((a, b) => b.similarity - a.similarity)
    .slice(0, 5)
@@ -839,25 +839,25 @@ async function selectSimilarExamples(

 ### 三、V2.0 成本预算

-**鍦烘櫙锛氶珮璐ㄩ噺绯荤粺璇勪环椤圭洰锛堢瓫閫?5000 绡?+ 鎻愬彇 300 绡囷級**
+**场景：高质量系统评价项目（筛选 5000 篇 + 提取 300 篇）**

 | 任务 | 策略 | 成本 |
 |------|------|------|
-| 鏍囬<EFBFBD>鎽樿<EFBFBD>绛涢€?| 鎴愭湰浼樺寲 + 15% 浠茶<EFBFBD> | 楼120 |
-| 鍏ㄦ枃鏁版嵁鎻愬彇 | GPT-5 + Claude 鍙屾ā鍨?| 楼350 |
+| 标题摘要筛选 | 成本优化 + 15% 仲裁 | ¥120 |
+| 全文数据提取 | GPT-5 + Claude 双模型 | ¥350 |
 | 质量审计 | 10% 抽查 | ¥30 |
-| **鎬绘垚鏈?* | - | **楼500** |
+| **总成本** | - | **¥500** |

 ### 四、V2.0 验收标准

 | 指标 | 目标 | 验证方法 |
 |------|------|----------|
-| 鎻愬彇鍑嗙‘鐜?| 鈮?95% | 浜哄伐鎶芥煡 100 绡?|
-| 浜烘満涓€鑷存€?| 鈮?90% | Cohen's Kappa |
-| 鍋囬槼鎬х巼 | 鈮?5% | 缁熻<EFBFBD>鍒嗘瀽 |
-| 鍋囬槾鎬х巼 | 鈮?3% | 缁熻<EFBFBD>鍒嗘瀽 |
-| 鎻愮ず璇嶇増鏈<EFBFBD><EFBFBD>鐞?| 100% | Git 鍘嗗彶 |
-| 鑷<EFBFBD>姩鍖栧<EFBFBD>璁?| 姣忓懆 1 娆?| 绯荤粺鎶ヨ〃 |
+| 提取准确率 | ≥ 95% | 人工抽查 100 篇 |
+| 人机一致性 | ≥ 90% | Cohen's Kappa |
+| 假阳性率 | ≤ 5% | 统计分析 |
+| 假阴性率 | ≤ 3% | 统计分析 |
+| 提示词版本管理 | 100% | Git 历史 |
+| 自动化审计 | 每周 1 次 | 系统报表 |

 ---

@@ -865,87 +865,87 @@ async function selectSimilarExamples(

 | 维度 | MVP | V1.0 | V2.0 |
 |------|-----|------|------|
-| **鍑嗙‘鐜?* | 85% | 90% | 95% |
-| **妯″瀷缁勫悎** | DeepSeek + Qwen3 | 鎴愭湰浼樺寲绛栫暐 | 涓夋ā鍨嬩徊瑁?|
-| **璐ㄩ噺鎺у埗** | 鍙屾ā鍨嬮獙璇?| 瑙勫垯寮曟搸 + Few-shot | HITL + 鑷<EFBFBD>姩瀹¤<EFBFBD> |
-| **鍙<EFBFBD>拷婧<EFBFBD>€?* | 鍩烘湰鏃ュ織 | 瀹屾暣璇佹嵁閾?| 瀹¤<E780B9>绾ц<E7BBBE>褰?|
-| **鎴愭湰/1000 绡?* | 楼5 | 楼21 | 楼24 + 浠茶<EFBFBD> |
-| **寮€鍙戝懆鏈?* | 4 鍛?| 6 鍛?| 8 鍛?|
-| **閫傜敤鍦烘櫙** | 蹇<EFBFBD>€熼獙璇?| 甯歌<E794AF>椤圭洰 | 楂樿川閲忓彂琛?|
+| **准确率** | 85% | 90% | 95% |
+| **模型组合** | DeepSeek + Qwen3 | 成本优化策略 | 三模型仲裁 |
+| **质量控制** | 双模型验证 | 规则引擎 + Few-shot | HITL + 自动审计 |
+| **可追溯性** | 基本日志 | 完整证据链 | 审计级记录 |
+| **成本/1000 篇** | ¥5 | ¥21 | ¥24 + 仲裁 |
+| **开发周期** | 4 周 | 6 周 | 8 周 |
+| **适用场景** | 快速验证 | 常规项目 | 高质量发表 |

 ---

 ## 🔄 实施路径

-### 闃舵<EFBFBD> 1: MVP 寮€鍙戯紙Week 1-4锛?
+### 阶段 1: MVP 开发（Week 1-4）

 **Week 1**：基础架构
- [ ] LLM 鏈嶅姟灏佽<EFBFBD>锛圖eepSeek + Qwen3锛?
+- [ ] LLM 服务封装（DeepSeek + Qwen3）
 - [ ] JSON Schema 定义
 - [ ] 数据库表设计

-**Week 2**锛氭牳蹇冨姛鑳?
- [ ] 鍙屾ā鍨嬪苟琛岃皟鐢?
+**Week 2**：核心功能
+- [ ] 双模型并行调用
 - [ ] 一致性判断逻辑
 - [ ] 人工复核队列

-**Week 3**锛氬墠绔<E5A2A0>紑鍙?
+**Week 3**：前端开发
 - [ ] 筛选工作台
 - [ ] 冲突对比视图
 - [ ] 人工复核界面

-**Week 4**锛氭祴璇曢獙鏀?
+**Week 4**：测试验收
 - [ ] 功能测试
- [ ] 鍑嗙‘鐜囪瘎浼?
+- [ ] 准确率评估
 - [ ] 成本监控

-### 闃舵<EFBFBD> 2: V1.0 澧炲己锛圵eek 5-10锛?
+### 阶段 2: V1.0 增强（Week 5-10）

-**Week 5-6**锛氭櫤鑳戒紭鍖?
+**Week 5-6**：智能优化
 - [ ] 成本优化策略
- [ ] Few-shot 绀轰緥搴?
+- [ ] Few-shot 示例库
 - [ ] 动态示例选择

-**Week 7-8**锛氳川閲忔帶鍒?
+**Week 7-8**：质量控制
 - [ ] 分段提取
 - [ ] 规则引擎
 - [ ] 证据链完整化

-**Week 9-10**锛氭祴璇曚紭鍖?
+**Week 9-10**：测试优化
 - [ ] A/B 测试
- [ ] 鍑嗙‘鐜囨彁鍗?
+- [ ] 准确率提升
 - [ ] 文档完善

-### 闃舵<EFBFBD> 3: V2.0 瀹屽杽锛圵eek 11-18锛?
+### 阶段 3: V2.0 完善（Week 11-18）

-**Week 11-13**锛氶珮绾у姛鑳?
- [ ] 涓夋ā鍨嬩徊瑁?
+**Week 11-13**：高级功能
+- [ ] 三模型仲裁
 - [ ] HITL 智能分流
- [ ] 鎻愮ず璇嶇増鏈<EFBFBD><EFBFBD>鐞?
+- [ ] 提示词版本管理

-**Week 14-16**锛氳川閲忓<E996B2>璁?
+**Week 14-16**：质量审计
 - [ ] 自动审计系统
 - [ ] 质量报表
- [ ] 寮傚父妫€娴?
+- [ ] 异常检测

-**Week 17-18**锛氬彂甯冨噯澶?
+**Week 17-18**：发布准备
 - [ ] 全量测试
 - [ ] 医学专家验证
- [ ] 鏂囨。鍜屽煿璁?
+- [ ] 文档和培训

 ---

 ## 📚 相关文档

- [CloseAI 闆嗘垚鎸囧崡](../../../02-閫氱敤鑳藉姏灞?01-LLM澶фā鍨嬬綉鍏?03-CloseAI闆嗘垚鎸囧崡.md)
+- [CloseAI 集成指南](../../../02-通用能力层/01-LLM大模型网关/03-CloseAI集成指南.md)
 - [AI 模型集成设计](./04-AI模型集成设计.md)
- [鏁版嵁搴撹<EFBFBD>璁<EFBFBD>(./01-鏁版嵁搴撹<E690B4>璁?md)
+- [数据库设计](./01-数据库设计.md)
 - [API 设计规范](./02-API设计规范.md)

 ---

-**鏇存柊鏃ュ織**锛?
- 2025-11-15: 鍒涘缓鏂囨。锛屽畾涔?MVP/V1.0/V2.0 涓夐樁娈电瓥鐣?
+**更新日志**：
+- 2025-11-15: 创建文档，定义 MVP/V1.0/V2.0 三阶段策略