# å…¨æ–‡å¤ç­›è´¨é‡ä¿éšœä¸Žå¯è¿½æº¯ç­–ç•¥

> **æ–‡æ¡£ç‰ˆæœ¬ï¼?* V1.0  
> **åˆ›å»ºæ—¥æœŸï¼?* 2025-11-22  
> **é€‚ç”¨æ¨¡å—ï¼?* AI æ™ºèƒ½æ–‡çŒ® - å…¨æ–‡å¤ç­›  
> **ç›®æ ‡ï¼?* åˆ†é˜¶æ®µæå‡å…¨æ–‡å¤ç­›çš„å‡†ç¡®çŽ‡ã€æ–¹æ³•å­¦è´¨é‡åˆ¤æ–­å’Œå®Œæ•´å¯è¿½æº¯æ€?

---

## ðŸ“‹ æ–‡æ¡£æ¦‚è¿°

æœ¬æ–‡æ¡£å®šä¹‰äº†**å…¨æ–‡å¤ç­›æ¨¡å—**åœ?**MVP â†?V1.0 â†?V2.0** ä¸‰ä¸ªé˜¶æ®µçš„è´¨é‡ä¿éšœç­–ç•¥ã€?

### å…¨æ–‡å¤ç­› vs æ ‡é¢˜æ‘˜è¦åˆç­›ï¼šæ ¸å¿ƒå·®å¼?

| ç»´åº¦ | æ ‡é¢˜æ‘˜è¦åˆç­› | å…¨æ–‡å¤ç­› | ç­–ç•¥å·®å¼‚ |
|------|-------------|---------|---------|
| **ä¿¡æ¯é‡?* | 200-500å­?| 5,000-20,000å­?| ðŸ”´ éœ€åˆ†æ®µå¤„ç† |
| **åˆ¤æ–­ä¾æ®** | PICOSåŒ¹é…åº?| 12å­—æ®µæ–¹æ³•å­¦è´¨é‡?| ðŸ”´ éœ€ä¸“ä¸šåˆ¤æ–­æ ‡å‡† |
| **å†³ç­–å¤æ‚åº?* | ä½?æ˜?å? | é«?12ä¸ªå­—æ®µÃ?çº? | ðŸ”´ éœ€ç»“æž„åŒ–æå?|
| **å®¹é”™ç­–ç•¥** | å®é”™å‹¿æ¼ | ä¸èƒ½æ¼å…³é”®ä¿¡æ?| ðŸ”´ éœ€éªŒè¯æœºåˆ¶ |
| **Tokenæˆæœ¬** | Â¥0.005/ç¯?| Â¥0.05-0.20/ç¯?| ðŸ”´ éœ€æˆæœ¬ä¼˜åŒ– |
| **å¯è¿½æº¯æ€?* | å¼•ç”¨æ‘˜è¦ | å…·ä½“é¡µç /æ®µè½/è¡¨æ ¼ | ðŸ”´ éœ€è¯æ®é“?|

### æ ¸å¿ƒè®¾è®¡åŽŸåˆ™

| åŽŸåˆ™ | è¯´æ˜Ž |
|------|------|
| **å¾ªè¯åŒ»å­¦æ ‡å‡†** | åŸºäºŽCochrane RoB 2.0å·¥å…·çš„æ–¹æ³•å­¦è´¨é‡è¯„ä¼°æ ‡å‡† |
| **ç»“æž„åŒ–æå?* | Nougat + åˆ†æ®µæå– + å…¨æ–‡éªŒè¯ï¼Œé¿å…?Lost in the Middle" |
| **å®Œæ•´è¯æ®é“?* | æ¯ä¸ªå­—æ®µå¼ºåˆ¶è¦æ±‚åŽŸæ–‡å¼•ç”¨ï¼ˆé¡µç ã€æ®µè½ã€è¡¨æ ¼ï¼‰ |
| **åˆ†æ­¥å®žæ–½** | MVPå…ˆéªŒè¯å¯è¡Œæ€§ï¼ŒV1.0æå‡è´¨é‡ï¼ŒV2.0è¾¾åˆ°åŒ»å­¦çº§æ ‡å‡?|
| **æˆæœ¬ä¸Žè´¨é‡å¹³è¡?* | MVPç”¨æˆæœ¬å‹å¥½æ¨¡åž‹ï¼Œå…³é”®å­—æ®µç”¨é«˜ç«¯æ¨¡åž‹éªŒè¯?|

---

## ðŸŽ¯ ä¸‰é˜¶æ®µè·¯çº¿å›¾

```
MVP (3å‘?              V1.0 (5å‘?            V2.0 (8å‘?
â”œâ”€ Nougatç»“æž„åŒ–æå?   â”œâ”€ Cochraneæ ‡å‡†Prompt  â”œâ”€ ä¸‰æ¨¡åž‹ä»²è£?
â”œâ”€ 12å­—æ®µåˆ†æ®µæå–      â”œâ”€ Few-shotåŒ»å­¦æ¡ˆä¾‹åº? â”œâ”€ åŒ»å­¦é€»è¾‘è§„åˆ™å¼•æ“Ž
â”œâ”€ åŒæ¨¡åž‹éªŒè¯?         â”œâ”€ å®Œæ•´è¯æ®é“?         â”œâ”€ è‡ªåŠ¨è´¨é‡å®¡è®¡
â”œâ”€ å­—æ®µçº§å†²çªæ£€æµ?     â”œâ”€ å…¨æ–‡äº¤å‰éªŒè¯        â”œâ”€ HITLæ™ºèƒ½åˆ†æµ
â””â”€ åŸºç¡€å¯è¿½æº?         â””â”€ åˆ†çº§äººå·¥å¤æ ¸        â””â”€ å®¡è®¡çº§æ—¥å¿?
   â†?                     â†?                   â†?
  å‡†ç¡®çŽ?â‰?85%           å‡†ç¡®çŽ?â‰?92%          å‡†ç¡®çŽ?â‰?96%
```

---

## ðŸš€ MVP é˜¶æ®µï¼? å‘¨ï¼‰

### ç›®æ ‡å®šä½

- **å‡†ç¡®çŽ‡ç›®æ ?*ï¼šâ‰¥ 85%
- **ä¿¡æ¯å®Œæ•´çŽ?*ï¼šâ‰¥ 90%ï¼?2å­—æ®µä¸é—æ¼ï¼‰
- **æˆæœ¬é¢„ç®—**ï¼šâ‰¤ Â¥0.05/ç¯‡ï¼ˆDeepSeek-V3 + Qwen3-Maxï¼?
- **äº¤ä»˜æ ‡å‡†**ï¼šåŸºç¡€åŠŸèƒ½å¯ç”¨ï¼Œæ”¯æŒç»“æž„åŒ–æå–å’ŒåŒæ¨¡åž‹éªŒè¯

---

### ä¸€ã€æ ¸å¿ƒæŠ€æœ¯ç­–ç•?

#### 1.1 âœ?Nougatç»“æž„åŒ–æå–ï¼ˆå…³é”®ä¼˜åŠ¿ï¼?

**ä¸ºä»€ä¹ˆé€‰æ‹©Nougat**ï¼?

| å¯¹æ¯”ç»´åº¦ | PyMuPDF | Nougat |
|---------|---------|--------|
| è¾“å‡ºæ ¼å¼ | çº¯æ–‡æœ?| Markdownç»“æž„åŒ?|
| ç« èŠ‚è¯†åˆ« | éœ€LLMäºŒæ¬¡è¯†åˆ«ï¼?0%å‡†ç¡®çŽ‡ï¼‰ | å¤©ç„¶ä¿ç•™ç»“æž„ï¼?5%å‡†ç¡®çŽ‡ï¼‰âœ?|
| è¡¨æ ¼å¤„ç† | æ–‡æœ¬ä¹±ç  | Markdownè¡¨æ ¼ âœ?|
| å…¬å¼è¯†åˆ« | ä¹±ç  | LaTeXæ ¼å¼ âœ?|
| é€‚ç”¨åœºæ™¯ | ä¸­æ–‡è®ºæ–‡ | è‹±æ–‡å­¦æœ¯è®ºæ–‡ âœ?|

**å®žæ–½æ–¹æ¡ˆ**ï¼?

```typescript
// æ··åˆç­–ç•¥ï¼šNougatä¼˜å…ˆï¼ŒPyMuPDFé™çº§
async function extractFullText(pdfBuffer: Buffer, filename: string) {
  // Step 1: æ£€æµ‹è¯­è¨€
  const language = await detectLanguage(pdfBuffer);
  
  // Step 2: è‹±æ–‡è®ºæ–‡ä¼˜å…ˆç”¨Nougat
  if (language === 'english') {
    try {
      const nougatResult = await extractionClient.extractPdf(
        pdfBuffer, filename, 'nougat'
      );
      
      if (nougatResult.quality > 0.8) {
        return {
          method: 'nougat',
          text: nougatResult.text,
          format: 'markdown',
          structured: true  // â­?å…³é”®ä¼˜åŠ¿
        };
      }
    } catch (error) {
      console.warn('Nougatå¤±è´¥ï¼Œé™çº§åˆ°PyMuPDF');
    }
  }
  
  // Step 3: ä¸­æ–‡è®ºæ–‡æˆ–Nougatå¤±è´¥ï¼Œç”¨PyMuPDF
  const pymupdfResult = await extractionClient.extractPdf(
    pdfBuffer, filename, 'pymupdf'
  );
  
  return {
    method: 'pymupdf',
    text: pymupdfResult.text,
    format: 'plaintext',
    structured: false  // éœ€è¦LLMè¯†åˆ«ç»“æž„
  };
}
```

---

#### 1.2 âœ?12å­—æ®µåˆ†æ®µæå–ï¼ˆé¿å…Lost in the Middleï¼?

**æ ¸å¿ƒé—®é¢˜**ï¼šå…¨æ–?0K tokensä¸€æ¬¡æ€§å–‚ç»™LLMï¼Œä¸­é—´ç« èŠ‚ä¿¡æ¯é—æ¼çŽ‡é«˜è¾¾33%

**è§£å†³æ–¹æ¡ˆ**ï¼šæŒ‰å­—æ®µå®šå‘æå–ç›¸å…³ç« èŠ‚

```typescript
// 12å­—æ®µæå–è·¯ç”±è¡?
const FIELD_EXTRACTION_ROUTES = {
  'ç ”ç©¶è®¾è®¡': {
    sections: ['abstract', 'methods'],
    maxTokens: 3000,
    priority: 'high'
  },
  'ç ”ç©¶äººç¾¤': {
    sections: ['methods', 'results'],
    maxTokens: 3500,
    priority: 'high',
    lookForTables: true  // Table 1: Baseline
  },
  'å¹²é¢„æŽªæ–½': {
    sections: ['methods', 'results'],
    maxTokens: 3000,
    priority: 'high'
  },
  'å¯¹ç…§æŽªæ–½': {
    sections: ['methods', 'results'],
    maxTokens: 2500,
    priority: 'high'
  },
  'ç»“å±€æŒ‡æ ‡': {
    sections: ['methods', 'results'],
    maxTokens: 4000,
    priority: 'high',
    lookForTables: true  // Results tables
  },
  'éšæœºåŒ–æ–¹æ³?: {
    sections: ['methods', 'figures'],
    maxTokens: 2500,
    priority: 'critical',  // å…³é”®å­—æ®µ
    keywords: ['randomization', 'allocation', 'sequence', 'CONSORT']
  },
  'ç›²æ³•': {
    sections: ['methods'],
    maxTokens: 2000,
    priority: 'critical'
  },
  'æ ·æœ¬é‡è®¡ç®?: {
    sections: ['methods'],
    maxTokens: 2000,
    priority: 'medium'
  },
  'åŸºçº¿å¯æ¯”æ€?: {
    sections: ['results', 'tables'],
    maxTokens: 3000,
    priority: 'high',
    specificTable: 'Table 1'
  },
  'ç»“æžœå®Œæ•´æ€?: {
    sections: ['results', 'figures'],
    maxTokens: 4000,
    priority: 'critical',
    keywords: ['ITT', 'per-protocol', 'missing data', 'dropout']
  },
  'é€‰æ‹©æ€§æŠ¥å‘?: {
    sections: ['methods', 'results', 'supplementary'],
    maxTokens: 3000,
    priority: 'medium',
    checkTrialRegistry: true  // å¯¹æ¯”æ³¨å†Œæ–¹æ¡ˆ
  },
  'å…¶ä»–åå€?: {
    sections: ['methods', 'discussion', 'supplementary'],
    maxTokens: 3000,
    priority: 'medium'
  }
};

// åˆ†æ®µå¹¶è¡Œæå–
async function extractAllFields(sections: ParsedSections) {
  const extractionTasks = Object.entries(FIELD_EXTRACTION_ROUTES).map(
    ([fieldName, config]) => ({
      field: fieldName,
      task: extractFieldWithEvidence(fieldName, sections, config)
    })
  );
  
  // å¹¶è¡Œæ‰§è¡Œï¼ˆé™ä½Žå»¶è¿Ÿï¼‰
  const results = await Promise.all(
    extractionTasks.map(t => t.task)
  );
  
  return results;
}
```

**ä¼˜åŠ¿**ï¼?
- âœ?é¿å…ä¸­é—´ä¿¡æ¯é—æ¼ï¼ˆå‡†ç¡®çŽ‡ 70% â†?90%ï¼?
- âœ?Tokenæ¶ˆè€—é™ä½?0%ï¼?0K â†?12Kï¼?
- âœ?å¹¶è¡Œæå–ï¼Œå»¶è¿Ÿé™ä½?0%
- âœ?æ¯ä¸ªå­—æ®µLLMæ³¨æ„åŠ›æ›´é›†ä¸­

---

#### 1.3 âœ?åŒæ¨¡åž‹äº¤å‰éªŒè¯?

**æ¨¡åž‹ç»„åˆ**ï¼šDeepSeek-V3 + Qwen3-Maxï¼ˆæˆæœ¬å‹å¥½ï¼‰

```typescript
// åŒæ¨¡åž‹å¹¶è¡Œè°ƒç”?
async function dualModelExtraction(
  fieldName: string,
  relevantContent: string,
  prompt: string
) {
  const [resultA, resultB] = await Promise.all([
    llmService.chat('deepseek-v3', prompt, relevantContent),
    llmService.chat('qwen-max', prompt, relevantContent)
  ]);
  
  // è§£æžç»“æžœ
  const assessmentA = parseFieldAssessment(resultA);
  const assessmentB = parseFieldAssessment(resultB);
  
  // å†²çªæ£€æµ?
  const hasConflict = assessmentA.level !== assessmentB.level;
  
  return {
    field: fieldName,
    modelA: {
      model: 'deepseek-v3',
      assessment: assessmentA.level,  // 'å®Œæ•´'/'ä¸å®Œæ•?/'æ— æ³•åˆ¤æ–­'
      evidence: assessmentA.evidence,
      confidence: assessmentA.confidence
    },
    modelB: {
      model: 'qwen-max',
      assessment: assessmentB.level,
      evidence: assessmentB.evidence,
      confidence: assessmentB.confidence
    },
    hasConflict,
    needReview: hasConflict || 
                assessmentA.confidence < 0.7 || 
                assessmentB.confidence < 0.7
  };
}
```

---

#### 1.4 âœ?å­—æ®µçº§å†²çªæ£€æµ‹ä¸Žåˆ†çº§å¤æ ¸

**ä¸æ˜¯ç®€å•çš„"å…¨éƒ¨å†²çªå°±äººå·¥å¤æ ?ï¼Œè€Œæ˜¯æ ¹æ®å­—æ®µé‡è¦æ€§åˆ†çº?*ï¼?

```typescript
// å­—æ®µé‡è¦æ€§åˆ†çº?
const FIELD_IMPORTANCE = {
  critical: ['éšæœºåŒ–æ–¹æ³?, 'ç›²æ³•', 'ç»“æžœå®Œæ•´æ€?],      // æ ¸å¿ƒåå€šé£Žé™?
  high: ['ç ”ç©¶è®¾è®¡', 'ç ”ç©¶äººç¾¤', 'å¹²é¢„æŽªæ–½', 'ç»“å±€æŒ‡æ ‡', 'åŸºçº¿å¯æ¯”æ€?],
  medium: ['æ ·æœ¬é‡è®¡ç®?, 'é€‰æ‹©æ€§æŠ¥å‘?, 'å…¶ä»–åå€?]
};

// æ™ºèƒ½åˆ†æµ
function prioritizeReview(conflicts: FieldConflict[]): ReviewQueue {
  const queue = {
    urgent: [],      // å…³é”®å­—æ®µå†²çª â†?ç«‹å³äººå·¥å¤æ ¸
    important: [],   // é«˜ä¼˜å…ˆçº§å­—æ®µå†²çª â†?24å°æ—¶å†…å¤æ ?
    normal: []       // ä¸­ç­‰ä¼˜å…ˆçº§å­—æ®µå†²çª?â†?48å°æ—¶å†…å¤æ ?
  };
  
  for (const conflict of conflicts) {
    if (!conflict.hasConflict) continue;
    
    if (FIELD_IMPORTANCE.critical.includes(conflict.field)) {
      queue.urgent.push({
        ...conflict,
        reason: 'å…³é”®æ–¹æ³•å­¦å­—æ®µå†²çªï¼Œå½±å“åå€šé£Žé™©è¯„ä¼?,
        deadline: new Date(Date.now() + 2 * 3600 * 1000) // 2å°æ—¶
      });
    } else if (FIELD_IMPORTANCE.high.includes(conflict.field)) {
      queue.important.push({
        ...conflict,
        reason: 'é«˜ä¼˜å…ˆçº§å­—æ®µå†²çª',
        deadline: new Date(Date.now() + 24 * 3600 * 1000) // 24å°æ—¶
      });
    } else {
      queue.normal.push({
        ...conflict,
        reason: 'ä¸€èˆ¬å­—æ®µå†²çª?,
        deadline: new Date(Date.now() + 48 * 3600 * 1000) // 48å°æ—¶
      });
    }
  }
  
  return queue;
}
```

---

#### 1.5 âœ?åŸºç¡€è¯æ®é“¾ï¼ˆåŽŸæ–‡å¼•ç”¨ï¼?

**MVPé˜¶æ®µè¦æ±‚**ï¼šæ¯ä¸ªå­—æ®µå¿…é¡»æœ‰åŽŸæ–‡å¼•ç”¨

```typescript
interface FieldEvidence {
  field: string;
  assessment: 'å®Œæ•´' | 'ä¸å®Œæ•? | 'æ— æ³•åˆ¤æ–­';
  
  // â­?å¼ºåˆ¶è¦æ±‚
  evidence: {
    quote: string;           // åŽŸæ–‡å¼•ç”¨ï¼?00-300å­—ï¼‰
    location: {
      section: string;       // "Methods"
      page?: number;         // 3ï¼ˆå¦‚æžœPDFæœ‰é¡µç ï¼‰
      paragraph?: number;    // 2
      table?: string;        // "Table 1"
      figure?: string;       // "Figure 1"
    };
    highlightedKeywords: string[];  // å…³é”®ä¿¡å·è¯?
  };
  
  reasoning: string;        // åˆ¤æ–­ç†ç”±ï¼?0-200å­—ï¼‰
  confidence: number;       // 0.0-1.0
}

// åŽå¤„ç†éªŒè¯ï¼šç¡®ä¿æ¯ä¸ªå­—æ®µéƒ½æœ‰è¯æ®
function validateEvidence(result: ExtractionResult): ValidationReport {
  const errors = [];
  
  for (const [field, data] of Object.entries(result.fields)) {
    // æ£€æŸ?ï¼šå¿…é¡»æœ‰å¼•ç”¨
    if (!data.evidence?.quote) {
      errors.push({
        field,
        type: 'missing_evidence',
        message: `å­—æ®µ"${field}"ç¼ºå°‘åŽŸæ–‡å¼•ç”¨`
      });
    }
    
    // æ£€æŸ?ï¼šå¼•ç”¨ä¸èƒ½å¤ªçŸ­ï¼ˆé¿å…æ•·è¡ï¼?
    if (data.evidence?.quote && data.evidence.quote.length < 50) {
      errors.push({
        field,
        type: 'insufficient_evidence',
        message: `å­—æ®µ"${field}"çš„å¼•ç”¨è¿‡çŸ­ï¼ˆ<50å­—ï¼‰ï¼Œå¯èƒ½ä¸è¶³ä»¥æ”¯æŒåˆ¤æ–­`
      });
    }
    
    // æ£€æŸ?ï¼šå¿…é¡»æœ‰ä½ç½®ä¿¡æ¯
    if (!data.evidence?.location?.section) {
      errors.push({
        field,
        type: 'missing_location',
        message: `å­—æ®µ"${field}"æœªæ ‡æ³¨åŽŸæ–‡ä½ç½®`
      });
    }
  }
  
  return {
    isValid: errors.length === 0,
    errors,
    completeness: 1 - (errors.length / (Object.keys(result.fields).length * 3))
  };
}
```

---

### äºŒã€?2å­—æ®µä¸“ä¸šPromptæ¨¡æ¿ï¼ˆMVPç‰ˆï¼‰

#### ç¤ºä¾‹ï¼šéšæœºåŒ–æ–¹æ³•ï¼ˆå…³é”®å­—æ®µï¼‰

```markdown
# å­—æ®µæå–ä»»åŠ¡ï¼šéšæœºåŒ–æ–¹æ³•

## èƒŒæ™¯è¯´æ˜Ž
ä½ æ˜¯ä¸€ä½å¾ªè¯åŒ»å­¦ä¸“å®¶ï¼Œæ­£åœ¨è¯„ä¼°ä¸€ç¯‡RCTç ”ç©¶çš„æ–¹æ³•å­¦è´¨é‡ã€?
è¯·æ ¹æ®Cochraneåå€šé£Žé™©è¯„ä¼°å·¥å…·ï¼ˆRoB 2.0ï¼‰çš„æ ‡å‡†ï¼Œåˆ¤æ–­è¯¥ç ”ç©¶çš„éšæœºåŒ–æ–¹æ³•æ˜¯å¦å……åˆ†ã€?

## å¾…åˆ†æžå†…å®?
ä»¥ä¸‹æ˜¯è®ºæ–‡çš„Methodsç« èŠ‚å’Œç›¸å…³å›¾è¡¨ï¼š

${relevantContent}

## åˆ¤æ–­æ ‡å‡†

### å®Œæ•´ï¼ˆLow risk of biasï¼?
éœ€**åŒæ—¶æ»¡è¶³**ä»¥ä¸‹æ¡ä»¶ï¼?
1. âœ?æ˜Žç¡®è¯´æ˜Žéšæœºåºåˆ—ç”Ÿæˆæ–¹æ³•
   - ç¤ºä¾‹ï¼šcomputer-generated random sequence, random number table, 
           central randomization, minimization
2. âœ?è¯´æ˜Žåˆ†é…éšè—æ–¹æ³•
   - ç¤ºä¾‹ï¼šsealed opaque envelopes, central allocation, 
           pharmacy-controlled, IWRS (Interactive Web Response System)
3. âœ?æ— é€‰æ‹©åå€šçš„è¯æ®
   - åŸºçº¿ç‰¹å¾å¹³è¡¡
   - æ— å¼‚å¸¸çš„å…¥ç»„æ—¶é—´æ¨¡å¼

### ä¸å®Œæ•´ï¼ˆHigh/Unclear risk of biasï¼?
ä»¥ä¸‹æƒ…å†µåˆ¤å®šä¸ºä¸å®Œæ•´ï¼?
- â?ä»…æåˆ?éšæœºåˆ†ç»„"ä½†æ— å…·ä½“æ–¹æ³•
- â?ä½¿ç”¨ä¸å½“çš„éšæœºåŒ–æ–¹æ³•ï¼ˆæŒ‰æ—¥æœŸã€ä½é™¢å·ã€äº¤æ›¿åˆ†é…ï¼‰
- â?æ— åˆ†é…éšè—æˆ–åˆ†é…éšè—ä¸å½“ï¼ˆå¼€æ”¾åˆ†é…è¡¨ï¼?
- â?åŸºçº¿å­˜åœ¨æ˜¾è‘—ä¸å¹³è¡¡ä¸”æ— è°ƒæ•?
- âš ï¸ æ–¹æ³•æè¿°æ¨¡ç³Šï¼Œæ— æ³•åˆ¤æ–­å……åˆ†æ€?

### æ— æ³•åˆ¤æ–­ï¼ˆUnclear riskï¼?
- è®ºæ–‡å®Œå…¨æœªæåŠéšæœºåŒ–æ–¹æ³•
- ä»…åœ¨å…¶ä»–åœ°æ–¹ï¼ˆå¦‚æ³¨å†Œæ–¹æ¡ˆï¼‰æåˆ°ï¼Œä½†æœ¬æ–‡æœªæè¿°

## å…³é”®ä¿¡å·è¯?

**é«˜è´¨é‡ä¿¡å·ï¼ˆå®Œæ•´ï¼?*ï¼?
- "computer-generated random sequence"
- "central randomization/allocation"
- "sealed opaque envelopes"
- "stratified randomization"
- "block randomization"
- "minimization"
- "allocation concealment"

**é£Žé™©ä¿¡å·ï¼ˆä¸å®Œæ•´ï¼?*ï¼?
- "alternating allocation"
- "by date of birth"
- "by hospital number"
- "open allocation"
- "assigned by investigator"

## æå–æŒ‡å—

1. **ä¼˜å…ˆæŸ¥æ‰¾ä½ç½®**ï¼?
   - Methodsç« èŠ‚çš?Randomization"å°èŠ‚
   - Figure 1 (CONSORTæµç¨‹å›?
   - Trial Registrationä¿¡æ¯
   - è¡¥å……ææ–™ï¼ˆSupplementary Materialsï¼?

2. **äº¤å‰éªŒè¯**ï¼?
   - Methodsæè¿° vs. Resultsä¸­çš„åŸºçº¿æ•°æ®
   - å£°ç§°çš„æ–¹æ³?vs. å®žé™…çš„åŸºçº¿å¹³è¡¡æƒ…å†?

3. **ç‰¹æ®Šæƒ…å†µ**ï¼?
   - å¦‚æžœæåˆ°"see protocol"æˆ?see trial registration"ï¼Œæ ‡è®°ä¸ºéœ€è¦æŸ¥é˜…å¤–éƒ¨èµ„æ–?
   - å¦‚æžœæ˜¯å¤šä¸­å¿ƒç ”ç©¶ï¼Œåº”è¯¥æœ‰ä¸­å¿ƒéšæœºåŒ–ç³»ç»?

## è¾“å‡ºæ ¼å¼ï¼ˆä¸¥æ ¼JSONï¼?

{
  "assessment": "å®Œæ•´" | "ä¸å®Œæ•? | "æ— æ³•åˆ¤æ–­",
  "evidence": {
    "quote": "åŽŸæ–‡å¼•ç”¨ï¼?00-300å­—ï¼ŒåŒ…å«å…³é”®æ–¹æ³•æè¿°ï¼?,
    "location": {
      "section": "Methods",
      "subsection": "Randomization",
      "page": 3,
      "paragraph": 2,
      "figure": "Figure 1 (CONSORT diagram)"
    },
    "highlightedKeywords": [
      "å…³é”®è¯?",
      "å…³é”®è¯?"
    ]
  },
  "reasoning": "åˆ¤æ–­ç†ç”±ï¼šæ ¹æ®åŽŸæ–‡å¼•ç”¨ï¼Œè¯¥ç ”ç©?..",
  "confidence": 0.95,
  "robAssessment": "Low risk" | "High risk" | "Unclear risk",
  "needsExternalVerification": false,
  "notes": "å…¶ä»–è¯´æ˜Žï¼ˆå¯é€‰ï¼‰"
}

## æ³¨æ„äº‹é¡¹

1. **ä¸¥æ ¼éµå®ˆCochraneæ ‡å‡†**ï¼šå®å¯åˆ¤æ–­ä¸º"ä¸å®Œæ•?ï¼Œä¸è¦è¿‡äºŽå®½æ?
2. **å¼•ç”¨å¿…é¡»å…·ä½“**ï¼šä¸è¦ç¬¼ç»Ÿåœ°è¯?Methodsç« èŠ‚æåˆ°"ï¼Œå¿…é¡»ç»™å‡ºå…·ä½“å¼•ç”?
3. **ç½®ä¿¡åº¦è¯šå®?*ï¼šå¦‚æžœä¿¡æ¯ä¸æ¸…æ™°ï¼Œé™ä½Žconfidenceå¹¶æ ‡è®°needsExternalVerification
4. **åŒºåˆ†"æœªåš"å’?æœªæŠ¥å‘?**ï¼?
   - å¦‚æžœè®ºæ–‡æ˜Žç¡®è¯?no randomization"ï¼Œassessment="ä¸å®Œæ•?
   - å¦‚æžœè®ºæ–‡å®Œå…¨æœªæåŠï¼Œassessment="æ— æ³•åˆ¤æ–­"
```

**å…¶ä»–11ä¸ªå­—æ®µçš„Promptæ¨¡æ¿**ï¼šç±»ä¼¼ç»“æž„ï¼Œæ ¹æ®Cochraneæ ‡å‡†è°ƒæ•´åˆ¤æ–­æ ‡å‡†

---

### ä¸‰ã€MVPæˆæœ¬é¢„ç®—

**åœºæ™¯ï¼?00ç¯‡å…¨æ–‡å¤ç­?*

| çŽ¯èŠ‚ | Tokenæ¶ˆè€?| æ¨¡åž‹ | æˆæœ¬ |
|------|----------|------|------|
| Nougatæå– | - | æœ¬åœ°æ¨¡åž‹ | Â¥0 |
| 12å­—æ®µæå–ï¼ˆåŒæ¨¡åž‹ï¼?| 12K Ã— 2 = 24K | DeepSeek-V3 + Qwen3-Max | Â¥0.06/ç¯?|
| å†²çªå­—æ®µäººå·¥å¤æ ¸ï¼?0%ï¼?| - | äººå·¥ | 2åˆ†é’Ÿ/å­—æ®µ |
| **100ç¯‡æ€»æˆæœ?* | - | - | **Â¥6 + äººå·¥æˆæœ¬** |

**å¯¹æ¯”**ï¼?
- å…¨æ–‡ä¸€æ¬¡æ€§æå–ï¼šÂ¥10/100ç¯?
- åˆ†æ®µæå–ï¼šÂ?/100ç¯?
- **èŠ‚çœ40%æˆæœ¬ + å‡†ç¡®çŽ‡æå?*

---

### å››ã€MVPéªŒæ”¶æ ‡å‡†

| æŒ‡æ ‡ | ç›®æ ‡ | éªŒè¯æ–¹æ³• |
|------|------|----------|
| å­—æ®µæå–å®Œæ•´çŽ?| â‰?90% | 12å­—æ®µéƒ½æœ‰ç»“æžœï¼ˆéž"æ— æ³•åˆ¤æ–­"ï¼?|
| åŒæ¨¡åž‹ä¸€è‡´çŽ‡ | â‰?75% | 12å­—æ®µä¸­è‡³å°?ä¸ªä¸€è‡?|
| è¯æ®é“¾å®Œæ•´æ€?| 100% | æ¯ä¸ªå­—æ®µéƒ½æœ‰åŽŸæ–‡å¼•ç”¨å’Œä½ç½?|
| äººå·¥å¤æ ¸é˜Ÿåˆ— | â‰?30% | éœ€è¦äººå·¥ä»‹å…¥çš„æ–‡çŒ®å æ¯” |
| NougatæˆåŠŸçŽ?| â‰?85% | è‹±æ–‡è®ºæ–‡æˆåŠŸæå–æ¯”ä¾‹ |
| å¤„ç†é€Ÿåº¦ | â‰?3åˆ†é’Ÿ/ç¯?| ä»ŽPDFåˆ°ç»“æžœçš„æ€»æ—¶é•?|

---

## ðŸ“ˆ V1.0 é˜¶æ®µï¼? å‘¨ï¼‰

### ç›®æ ‡å®šä½

- **å‡†ç¡®çŽ‡ç›®æ ?*ï¼šâ‰¥ 92%
- **ä¿¡æ¯å®Œæ•´çŽ?*ï¼šâ‰¥ 95%
- **æˆæœ¬é¢„ç®—**ï¼šâ‰¤ Â¥0.08/ç¯‡ï¼ˆæ™ºèƒ½æˆæœ¬ä¼˜åŒ–ï¼?
- **äº¤ä»˜æ ‡å‡†**ï¼šé«˜è´¨é‡è¾“å‡ºï¼Œå®Œæ•´è¯æ®é“¾ï¼Œæ™ºèƒ½è´¨é‡æŽ§åˆ?

---

### ä¸€ã€è´¨é‡æå‡ç­–ç•?

#### 1.1 âœ?Cochraneæ ‡å‡†Promptå¢žå¼º

**åœ¨MVPåŸºç¡€ä¸Šå¢žåŠ?*ï¼?

1. **Few-shotåŒ»å­¦æ¡ˆä¾‹**ï¼ˆæ¯ä¸ªå­—æ®?-5ä¸ªçœŸå®žæ¡ˆä¾‹ï¼‰

```markdown
## å‚è€ƒæ¡ˆä¾?

ä»¥ä¸‹æ˜?ä¸ªçœŸå®žRCTç ”ç©¶çš„éšæœºåŒ–æ–¹æ³•è¯„ä¼°æ¡ˆä¾‹ï¼Œå¸®åŠ©ä½ ç†è§£åˆ¤æ–­æ ‡å‡†ï¼?

### æ¡ˆä¾‹1ï¼šé«˜è´¨é‡RCTï¼ˆNEJM, 2023ï¼?
**åŽŸæ–‡å¼•ç”¨**ï¼?
"Randomization was performed with the use of a computer-generated sequence 
with stratification according to center and baseline NIHSS score (â‰?0 or >10). 
Allocation was concealed through a central web-based system (IWRS)."

**è¯„ä¼°ç»“æžœ**ï¼šå®Œæ•?
**ç†ç”±**ï¼?
1. âœ?æ˜Žç¡®çš„åºåˆ—ç”Ÿæˆæ–¹æ³•ï¼ˆcomputer-generatedï¼?
2. âœ?åˆ†å±‚éšæœºåŒ–ï¼ˆæé«˜å¹³è¡¡æ€§ï¼‰
3. âœ?ä¸­å¿ƒåˆ†é…éšè—ï¼ˆIWRSï¼?
4. âœ?åŸºçº¿Table 1æ˜¾ç¤ºä¸¤ç»„å¹³è¡¡è‰¯å¥½ï¼ˆP>0.05ï¼?
**RoB 2.0åˆ¤æ–­**ï¼šLow risk of bias

---

### æ¡ˆä¾‹2ï¼šè´¨é‡ä¸è¶³ï¼ˆæŸæœŸåˆ? 2020ï¼?
**åŽŸæ–‡å¼•ç”¨**ï¼?
"Patients were randomly assigned to receive either drug A or placebo 
in a 1:1 ratio. Randomization was performed by the study coordinator."

**è¯„ä¼°ç»“æžœ**ï¼šä¸å®Œæ•´
**ç†ç”±**ï¼?
1. â?æœªè¯´æ˜Žåºåˆ—ç”Ÿæˆæ–¹æ³•ï¼ˆä»…è¯´"éšæœº"ï¼?
2. â?ç”±ç ”ç©¶åè°ƒå‘˜æ‰§è¡ŒéšæœºåŒ–ï¼ˆæ— åˆ†é…éšè—ï¼‰
3. âš ï¸ Table 1æ˜¾ç¤ºå¯¹ç…§ç»„å¹´é¾„åå¤§ï¼ˆ66.2 vs 62.1, P=0.04ï¼?
**RoB 2.0åˆ¤æ–­**ï¼šHigh risk of bias
**é—®é¢˜**ï¼šå¯èƒ½å­˜åœ¨é€‰æ‹©åå€?

---

### æ¡ˆä¾‹3ï¼šè¾¹ç•Œæƒ…å†µï¼ˆLancet, 2021ï¼?
**åŽŸæ–‡å¼•ç”¨**ï¼?
"Randomization was done with sequentially numbered, opaque, sealed envelopes 
prepared by an independent statistician not otherwise involved in the trial."

**è¯„ä¼°ç»“æžœ**ï¼šå®Œæ•?
**ç†ç”±**ï¼?
1. âœ?è™½éžä¸­å¿ƒéšæœºåŒ–ï¼Œä½†ä½¿ç”¨å¯†å°ä¿¡å°?
2. âœ?ç‹¬ç«‹ç¬¬ä¸‰æ–¹å‡†å¤‡ï¼ˆç»Ÿè®¡å¸ˆï¼‰
3. âœ?ä¸é€å…‰ï¼ˆopaqueï¼‰ä¸”å¯†å°ï¼ˆsealedï¼?
4. âœ?åŸºçº¿å¹³è¡¡è‰¯å¥½
**RoB 2.0åˆ¤æ–­**ï¼šLow risk of bias
**è¯´æ˜Ž**ï¼šç¬¦åˆCochraneæ ‡å‡†ï¼ˆå¯†å°ä¿¡å°?+ ç‹¬ç«‹å‡†å¤‡å¯æŽ¥å—ï¼‰

---

çŽ°åœ¨è¯·ä½ å‚è€ƒä»¥ä¸Šæ¡ˆä¾‹çš„è¯„ä¼°æ–¹å¼ï¼Œåˆ†æžå½“å‰è®ºæ–?..
```

2. **Chain of ThoughtæŽ¨ç†**

```markdown
## è¾“å‡ºæ ¼å¼ï¼ˆå¢žå¼ºç‰ˆï¼?

{
  "assessment": "å®Œæ•´",
  
  // â­?æ–°å¢žï¼šé€æ­¥æŽ¨ç†è¿‡ç¨‹
  "reasoning_steps": {
    "step1_sequenceGeneration": {
      "finding": "è®ºæ–‡æåˆ°'computer-generated random sequence'",
      "evaluation": "æ»¡è¶³åºåˆ—ç”Ÿæˆæ–¹æ³•è¦æ±‚ âœ?
    },
    "step2_allocationConcealment": {
      "finding": "ä½¿ç”¨'central web-based system (IWRS)'",
      "evaluation": "æ»¡è¶³åˆ†é…éšè—è¦æ±‚ âœ?
    },
    "step3_baselineBalance": {
      "finding": "Table 1æ˜¾ç¤ºä¸»è¦ç‰¹å¾P>0.05",
      "evaluation": "æ— æ˜Žæ˜¾é€‰æ‹©åå€šè¯æ?âœ?
    },
    "step4_finalJudgment": {
      "conclusion": "ä¸‰é¡¹æ ‡å‡†å‡æ»¡è¶³ï¼Œåˆ¤æ–­ä¸?å®Œæ•´'",
      "confidence": 0.95
    }
  },
  
  "evidence": { ... },
  "robAssessment": "Low risk"
}
```

---

#### 1.2 âœ?å…¨æ–‡äº¤å‰éªŒè¯ï¼ˆé˜²é—æ¼ï¼?

**åœ¨åˆ†æ®µæå–åŽï¼Œå¢žåŠ å…¨æ–‡éªŒè¯çŽ¯èŠ?*ï¼?

```typescript
// é˜¶æ®µ1ï¼šåˆ†æ®µæå–ï¼ˆå·²å®Œæˆï¼‰
const segmentedResults = await extractAllFieldsSegmented(sections);

// â­?é˜¶æ®µ2ï¼šå…¨æ–‡äº¤å‰éªŒè¯ï¼ˆæ–°å¢žï¼?
async function crossValidateWithFullText(
  segmentedResults: FieldResult[],
  fullTextMarkdown: string
): Promise<ValidationReport> {
  
  // éªŒè¯1ï¼šæ£€æŸ¥æ˜¯å¦æœ‰é—æ¼ä¿¡æ¯
  const missingInfoChecks = await Promise.all([
    checkForMissingInfo('éšæœºåŒ–æ–¹æ³?, fullTextMarkdown, segmentedResults),
    checkForMissingInfo('ç›²æ³•', fullTextMarkdown, segmentedResults),
    // ... å…¶ä»–å…³é”®å­—æ®µ
  ]);
  
  // éªŒè¯2ï¼šæ£€æŸ¥æ˜¯å¦æœ‰çŸ›ç›¾ä¿¡æ¯
  const contradictionChecks = await checkContradictions(
    segmentedResults,
    fullTextMarkdown
  );
  
  // éªŒè¯3ï¼šæ£€æŸ¥æ˜¯å¦æåˆ°è¡¥å……ææ–?
  const supplementaryCheck = checkSupplementaryMaterial(fullTextMarkdown);
  
  return {
    missingInfoAlerts: missingInfoChecks.filter(c => c.hasIssue),
    contradictions: contradictionChecks,
    needsSupplementary: supplementaryCheck.needsExternal,
    overallCompleteness: calculateCompleteness(...)
  };
}

// ç¤ºä¾‹ï¼šæ£€æŸ¥é—æ¼ä¿¡æ?
async function checkForMissingInfo(
  field: string,
  fullText: string,
  extractedResult: FieldResult
): Promise<ValidationAlert> {
  
  // å¦‚æžœå·²ç»åˆ¤å®šä¸?å®Œæ•´"ï¼Œè·³è¿?
  if (extractedResult.assessment === 'å®Œæ•´') {
    return { field, hasIssue: false };
  }
  
  // åœ¨å…¨æ–‡ä¸­æœç´¢å…³é”®è¯?
  const keywords = FIELD_KEYWORDS[field];  // é¢„å®šä¹‰å…³é”®è¯è¡?
  const foundKeywords = keywords.filter(kw => 
    fullText.toLowerCase().includes(kw.toLowerCase())
  );
  
  // å¦‚æžœå…¨æ–‡ä¸­æœ‰å…³é”®è¯ï¼Œä½†æå–ç»“æžœæ˜¯"æ— æ³•åˆ¤æ–­"
  if (foundKeywords.length > 0 && extractedResult.assessment === 'æ— æ³•åˆ¤æ–­') {
    return {
      field,
      hasIssue: true,
      severity: 'warning',
      message: `å…¨æ–‡ä¸­å‘çŽ°å…³é”®è¯ã€?{foundKeywords.join(', ')}ã€‘ï¼Œ
                ä½†å­—æ®?${field}"åˆ¤æ–­ä¸?æ— æ³•åˆ¤æ–­"ï¼Œå¯èƒ½å­˜åœ¨é—æ¼`,
      suggestedAction: 'targeted_re_extraction',
      keywords: foundKeywords
    };
  }
  
  return { field, hasIssue: false };
}
```

**æ•ˆæžœ**ï¼?
- é—æ¼ä¿¡æ¯æ£€å‡ºçŽ‡ï¼?% â†?80%
- å‡†ç¡®çŽ‡æå‡ï¼š85% â†?92%

---

#### 1.3 âœ?åŒ»å­¦é€»è¾‘è§„åˆ™å¼•æ“Ž

**è‡ªåŠ¨æ£€æŸ¥å¸¸è§çš„é€»è¾‘é”™è¯¯**ï¼?

```typescript
const MEDICAL_LOGIC_RULES = [
  {
    id: 'rule_001',
    name: 'RCTå¿…é¡»æœ‰éšæœºåŒ–',
    check: (data) => {
      const isRCT = data.ç ”ç©¶è®¾è®¡.toLowerCase().includes('rct') ||
                    data.ç ”ç©¶è®¾è®¡.includes('éšæœº');
      const hasRandomization = data.éšæœºåŒ–æ–¹æ³?!== 'æ— æ³•åˆ¤æ–­';
      return !isRCT || hasRandomization;
    },
    severity: 'error',
    message: 'ç ”ç©¶å£°ç§°æ˜¯RCTä½†æœªæ‰¾åˆ°éšæœºåŒ–æ–¹æ³•æè¿?,
    action: 'flag_for_urgent_review'
  },
  
  {
    id: 'rule_002',
    name: 'åŒç›²ç ”ç©¶å¿…é¡»è¯´æ˜Žç›²æ³•',
    check: (data) => {
      const isDoubleBlind = data.ç ”ç©¶è®¾è®¡.includes('åŒç›²') ||
                            data.ç ”ç©¶è®¾è®¡.includes('double-blind');
      const hasBlinding = data.ç›²æ³• !== 'æ— æ³•åˆ¤æ–­' && 
                          data.ç›²æ³• !== 'ä¸å®Œæ•?;
      return !isDoubleBlind || hasBlinding;
    },
    severity: 'error',
    message: 'å£°ç§°åŒç›²ä½†ç›²æ³•æè¿°ä¸å®Œæ•´',
    action: 'flag_for_review'
  },
  
  {
    id: 'rule_003',
    name: 'æ ·æœ¬é‡ä¸ŽåŸºçº¿æ•°æ®ä¸€è‡´æ€?,
    check: (data) => {
      const planned = extractNumber(data.æ ·æœ¬é‡è®¡ç®?;
      const enrolled = extractNumber(data.ç ”ç©¶äººç¾¤);
      if (!planned || !enrolled) return true;  // æ— æ³•æå–åˆ™è·³è¿?
      
      const deviation = Math.abs(planned - enrolled) / planned;
      return deviation < 0.3;  // åå·®<30%
    },
    severity: 'warning',
    message: 'è®¡åˆ’æ ·æœ¬é‡ä¸Žå®žé™…å…¥ç»„å·®å¼‚è¾ƒå¤§(>30%)',
    action: 'add_note'
  },
  
  {
    id: 'rule_004',
    name: 'åŸºçº¿ä¸å¹³è¡¡éœ€è¦è°ƒæ•?,
    check: (data) => {
      const hasImbalance = data.åŸºçº¿å¯æ¯”æ€?includes('ä¸å¹³è¡?) ||
                          data.åŸºçº¿å¯æ¯”æ€?includes('P<0.05');
      const hasAdjustment = data.ç»“å±€æŒ‡æ ‡.includes('è°ƒæ•´') ||
                           data.ç»“å±€æŒ‡æ ‡.includes('adjusted');
      return !hasImbalance || hasAdjustment;
    },
    severity: 'warning',
    message: 'åŸºçº¿å­˜åœ¨ä¸å¹³è¡¡ä½†æœªè§è°ƒæ•´åˆ†æž',
    action: 'add_note'
  },
  
  {
    id: 'rule_005',
    name: 'ITTåˆ†æžå®Œæ•´æ€?,
    check: (data) => {
      const hasDropout = extractNumber(data.ç»“æžœå®Œæ•´æ€? > 0;
      const hasITT = data.ç»“æžœå®Œæ•´æ€?toLowerCase().includes('itt') ||
                    data.ç»“æžœå®Œæ•´æ€?includes('intention-to-treat');
      return !hasDropout || hasITT;
    },
    severity: 'warning',
    message: 'å­˜åœ¨å¤±è®¿ä½†æœªæ˜Žç¡®ITTåˆ†æž',
    action: 'flag_for_review'
  }
];

// è‡ªåŠ¨éªŒè¯
function validateMedicalLogic(extractedData: ExtractionResult): LogicReport {
  const violations = [];
  
  for (const rule of MEDICAL_LOGIC_RULES) {
    try {
      const passed = rule.check(extractedData);
      if (!passed) {
        violations.push({
          ruleId: rule.id,
          ruleName: rule.name,
          severity: rule.severity,
          message: rule.message,
          action: rule.action
        });
      }
    } catch (error) {
      console.error(`è§„åˆ™${rule.id}æ‰§è¡Œå¤±è´¥:`, error);
    }
  }
  
  return {
    totalRules: MEDICAL_LOGIC_RULES.length,
    passedRules: MEDICAL_LOGIC_RULES.length - violations.length,
    violations,
    overallValidity: violations.filter(v => v.severity === 'error').length === 0
  };
}
```

---

#### 1.4 âœ?å®Œæ•´è¯æ®é“¾ï¼ˆå¢žå¼ºç‰ˆï¼‰

**V1.0è¦æ±‚**ï¼šä¸ä»…æœ‰å¼•ç”¨ï¼Œè¿˜è¦æœ‰å…·ä½“å®šä½å’Œé«˜äº?

```typescript
interface EnhancedEvidence {
  field: string;
  assessment: string;
  
  evidence: {
    // ä¸»è¦è¯æ®
    primaryQuote: {
      text: string;              // åŽŸæ–‡å¼•ç”¨
      location: {
        section: string;         // "Methods"
        subsection?: string;     // "Randomization"
        page: number;            // 3
        paragraph: number;       // 2
        lineRange?: [number, number];  // [45, 52]
      };
      highlightedText: string;   // HTMLé«˜äº®ç‰ˆæœ¬
      keywords: string[];        // å…³é”®è¯åˆ—è¡?
    };
    
    // æ”¯æŒè¯æ®ï¼ˆå¯é€‰ï¼‰
    supportingQuotes?: Array<{
      text: string;
      location: any;
      relation: string;  // "confirms" | "contradicts" | "complements"
    }>;
    
    // è¡¨æ ¼/å›¾ç‰‡è¯æ®
    tableEvidence?: {
      tableName: string;         // "Table 1"
      relevantCells: string[];   // ç›¸å…³å•å…ƒæ ¼å†…å®?
      interpretation: string;    // å¯¹è¡¨æ ¼çš„è§£è¯»
    };
    
    figureEvidence?: {
      figureName: string;        // "Figure 1"
      caption: string;
      relevantInfo: string;
    };
  };
  
  // â­?æ–°å¢žï¼šå®Œæ•´æŽ¨ç†é“¾
  reasoningChain: {
    cochraneCriteria: string[];  // åº”ç”¨çš„Cochraneæ ‡å‡†
    keyFindings: string[];       // å…³é”®å‘çŽ°
    assessment: string;          // æœ€ç»ˆåˆ¤æ–?
    confidence: number;
    uncertainties?: string[];    // ä¸ç¡®å®šå› ç´?
  };
  
  // â­?æ–°å¢žï¼šå¯è¿½æº¯æ€§å…ƒæ•°æ®
  metadata: {
    extractionTimestamp: string;
    modelUsed: string;
    promptVersion: string;
    processingTime: number;
  };
}
```

---

### äºŒã€V1.0æˆæœ¬é¢„ç®—

**åœºæ™¯ï¼?00ç¯‡å…¨æ–‡å¤ç­?*

| çŽ¯èŠ‚ | Tokenæ¶ˆè€?| æ¨¡åž‹ | æˆæœ¬ |
|------|----------|------|------|
| 12å­—æ®µåˆ†æ®µæå–ï¼ˆåŒæ¨¡åž‹ï¼?| 12K | DeepSeek-V3 + Qwen3-Max | Â¥0.06/ç¯?|
| å…¨æ–‡äº¤å‰éªŒè¯ | 3K | DeepSeek-V3 | Â¥0.003/ç¯?|
| å…³é”®å­—æ®µè¡¥å……æå–ï¼?0%ï¼?| 2K | Qwen3-Max | Â¥0.016/ç¯‡ï¼ˆä»?0%æ–‡çŒ®ï¼?|
| **100ç¯‡æ€»æˆæœ?* | - | - | **Â¥7.9** |

**è´¨é‡æå‡**ï¼šå‡†ç¡®çŽ‡ 85% â†?92%  
**æˆæœ¬å¢žåŠ **ï¼šÂ? â†?Â¥8ï¼?33%ï¼Œä½†è´¨é‡æ˜¾è‘—æå‡ï¼?

---

### ä¸‰ã€V1.0éªŒæ”¶æ ‡å‡†

| æŒ‡æ ‡ | ç›®æ ‡ | éªŒè¯æ–¹æ³• |
|------|------|----------|
| å‡†ç¡®çŽ‡ï¼ˆäººå·¥æŠ½æŸ¥ï¼?| â‰?92% | éšæœºæŠ½æŸ¥50ç¯‡ï¼Œä¸“å®¶è¯„ä¼° |
| ä¿¡æ¯å®Œæ•´çŽ?| â‰?95% | 12å­—æ®µå‡æœ‰æœ‰æ•ˆç»“æžœ |
| è¯æ®é“¾å®Œæ•´æ€?| 100% | æ¯ä¸ªå­—æ®µæœ‰è¯¦ç»†è¯æ®å’ŒæŽ¨ç†é“?|
| é—æ¼ä¿¡æ¯æ£€å‡ºçŽ‡ | â‰?80% | äº¤å‰éªŒè¯å‘çŽ°çš„é—æ¼æ¯”ä¾?|
| é€»è¾‘è§„åˆ™è¦†ç›–çŽ?| â‰?80% | è§„åˆ™å¼•æ“Žæ£€æŸ¥é€šè¿‡çŽ?|
| äººå·¥å¤æ ¸é˜Ÿåˆ— | â‰?25% | éœ€è¦äººå·¥ä»‹å…¥çš„æ–‡çŒ®å æ¯” |

---

## ðŸ† V2.0 é˜¶æ®µï¼? å‘¨ï¼‰

### ç›®æ ‡å®šä½

- **å‡†ç¡®çŽ‡ç›®æ ?*ï¼šâ‰¥ 96%ï¼ˆåŒ»å­¦çº§æ ‡å‡†ï¼?
- **äººæœºä¸€è‡´æ€?*ï¼šCohen's Kappa â‰?0.90
- **æˆæœ¬é¢„ç®—**ï¼šæŒ‰éœ€é…ç½®ï¼ˆè´¨é‡ä¼˜å…ˆï¼‰
- **äº¤ä»˜æ ‡å‡†**ï¼šè‡ªåŠ¨åŒ–è´¨é‡å®¡è®¡ï¼Œç¬¦åˆCochraneå‘è¡¨æ ‡å‡†

---

### ä¸€ã€åŒ»å­¦çº§è´¨é‡ä¿éšœ

#### 1.1 âœ?ä¸‰æ¨¡åž‹ä»²è£æœºåˆ?

**å…³é”®å­—æ®µå†²çªæ—¶ï¼Œå¯ç”¨ç¬¬ä¸‰æ–¹ä»²è£?*ï¼?

```typescript
async function threeModelArbitration(
  conflict: FieldConflict,
  relevantContent: string
) {
  
  // ç¬¬ä¸‰æ–¹ä»²è£ï¼šClaude-4.5ï¼ˆé«˜è´¨é‡æ¨¡åž‹ï¼?
  const arbitrationPrompt = `
ä½ æ˜¯Cochraneç³»ç»Ÿè¯„ä»·ä¸“å®¶ï¼ŒçŽ°æœ‰ä¸¤ä¸ªAIæ¨¡åž‹å¯¹åŒä¸€å­—æ®µçš„åˆ¤æ–­å­˜åœ¨å†²çªï¼Œ
è¯·ä½ ä»Žå¾ªè¯åŒ»å­¦çš„è§’åº¦ç»™å‡ºæƒå¨åˆ¤æ–­ã€?

ã€å†²çªå­—æ®µã€‘ï¼š${conflict.field}

ã€æ¨¡åž‹Aåˆ¤æ–­ã€‘ï¼š${conflict.modelA.assessment}
è¯æ®ï¼?{conflict.modelA.evidence.quote}
ç†ç”±ï¼?{conflict.modelA.reasoning}
ç½®ä¿¡åº¦ï¼š${conflict.modelA.confidence}

ã€æ¨¡åž‹Båˆ¤æ–­ã€‘ï¼š${conflict.modelB.assessment}
è¯æ®ï¼?{conflict.modelB.evidence.quote}
ç†ç”±ï¼?{conflict.modelB.reasoning}
ç½®ä¿¡åº¦ï¼š${conflict.modelB.confidence}

ã€åŽŸæ–‡ã€‘ï¼š
${relevantContent}

ã€ä»²è£ä»»åŠ¡ã€‘ï¼š
1. æ ¹æ®Cochrane RoB 2.0æ ‡å‡†ï¼Œç»™å‡ºä½ çš„åˆ¤æ–?
2. åˆ†æžä¸¤ä¸ªæ¨¡åž‹çš„åˆ¤æ–­ï¼ŒæŒ‡å‡ºå“ªä¸ªæ›´å‡†ç¡®ï¼ˆæˆ–éƒ½ä¸å‡†ç¡®ï¼‰
3. å¼•ç”¨Cochraneæ‰‹å†Œç›¸å…³æ¡æ¬¾æ”¯æŒä½ çš„åˆ¤æ–­
4. å¦‚æžœä»ä¸ç¡®å®šï¼Œæ˜Žç¡®æŒ‡å‡ºéœ€è¦äººå·¥å¤æ ¸çš„åŽŸå› 

ã€è¾“å‡ºæ ¼å¼ã€‘ï¼šJSON
  `;
  
  const arbitrationResult = await llmService.chat(
    'claude-4.5',
    arbitrationPrompt
  );
  
  return {
    field: conflict.field,
    arbitrator: 'claude-4.5',
    finalJudgment: arbitrationResult.assessment,
    analysis: {
      modelAAccuracy: arbitrationResult.modelA_correct,
      modelBAccuracy: arbitrationResult.modelB_correct,
      correctModel: arbitrationResult.agree_with,
      cochraneCitation: arbitrationResult.cochrane_reference
    },
    confidence: arbitrationResult.confidence,
    stillNeedsHumanReview: arbitrationResult.confidence < 0.9
  };
}
```

**æˆæœ¬æŽ§åˆ¶**ï¼?
- ä»…åœ¨å…³é”®å­—æ®µå†²çªæ—¶å¯ç”¨ï¼ˆé¢„è®¡10-15%ï¼?
- å•æ¬¡ä»²è£æˆæœ¬ï¼šÂ?.02ï¼ˆClaude-4.5ï¼?
- 100ç¯‡æ€»é¢å¤–æˆæœ¬ï¼šÂ¥2-3

---

#### 1.2 âœ?HITLæ™ºèƒ½åˆ†æµ

**åŸºäºŽè§„åˆ™çš„æ™ºèƒ½ä¼˜å…ˆçº§æŽ’åº**ï¼?

```typescript
function intelligentTriage(
  extractionResult: ExtractionResult,
  validationReport: ValidationReport,
  arbitrationResults?: ArbitrationResult[]
): TriageDecision {
  
  let priority = 0;
  let needReview = false;
  const reasons = [];
  
  // è§„åˆ™1ï¼šä¸‰æ¨¡åž‹ä»ä¸ä¸€è‡?â†?æœ€é«˜ä¼˜å…ˆçº§
  if (arbitrationResults?.some(a => a.stillNeedsHumanReview)) {
    priority = 100;
    needReview = true;
    reasons.push('ä¸‰æ¨¡åž‹ä»²è£åŽä»å­˜åœ¨ä¸ç¡®å®šæ€?);
  }
  
  // è§„åˆ™2ï¼šå…³é”®å­—æ®µè´¨é‡é—®é¢?â†?é«˜ä¼˜å…ˆçº§
  const criticalIssues = validationReport.violations.filter(v =>
    v.severity === 'error' && 
    FIELD_IMPORTANCE.critical.includes(v.field)
  );
  if (criticalIssues.length > 0) {
    priority = Math.max(priority, 90);
    needReview = true;
    reasons.push(`å…³é”®å­—æ®µå­˜åœ¨è´¨é‡é—®é¢˜: ${criticalIssues.map(i => i.field).join(', ')}`);
  }
  
  // è§„åˆ™3ï¼šRCTç ”ç©¶ â†?ä¸­ç­‰ä¼˜å…ˆçº§ï¼ˆè´¨é‡è¦æ±‚é«˜ï¼‰
  if (extractionResult.ç ”ç©¶è®¾è®¡.includes('RCT')) {
    priority = Math.max(priority, 70);
    // RCTå¦‚æžœç½®ä¿¡åº¦ä½Žæ‰éœ€è¦å¤æ ?
    if (extractionResult.overallConfidence < 0.9) {
      needReview = true;
      reasons.push('RCTç ”ç©¶ä½†æ•´ä½“ç½®ä¿¡åº¦ä½ŽäºŽ0.9');
    }
  }
  
  // è§„åˆ™4ï¼šå…³é”®ç»“å±€æŒ‡æ ‡ï¼ˆæ­»äº¡çŽ‡ï¼‰â†’ é«˜ä¼˜å…ˆçº§
  if (extractionResult.ç»“å±€æŒ‡æ ‡.includes('æ­»äº¡') || 
      extractionResult.ç»“å±€æŒ‡æ ‡.includes('mortality')) {
    priority = Math.max(priority, 80);
    if (extractionResult.ç»“æžœå®Œæ•´æ€?!== 'å®Œæ•´') {
      needReview = true;
      reasons.push('å…³é”®ç»“å±€æŒ‡æ ‡ï¼ˆæ­»äº¡çŽ‡ï¼‰ä½†ç»“æžœå®Œæ•´æ€§æœ‰é—®é¢˜');
    }
  }
  
  // è§„åˆ™5ï¼šé«˜ç½®ä¿¡åº?+ æ— å†²çª?â†?è‡ªåŠ¨é€šè¿‡
  if (extractionResult.overallConfidence > 0.95 && 
      validationReport.violations.length === 0 &&
      !arbitrationResults) {
    priority = 10;
    needReview = false;
    reasons.push('é«˜è´¨é‡æå–ï¼Œæ— éœ€äººå·¥å¤æ ¸');
  }
  
  // è§„åˆ™6ï¼šå‘è¡¨åœ¨é¡¶çº§æœŸåˆŠ â†?é™ä½Žå¤æ ¸ä¼˜å…ˆçº?
  const topJournals = ['NEJM', 'Lancet', 'JAMA', 'BMJ'];
  if (topJournals.some(j => extractionResult.metadata.journal?.includes(j))) {
    priority = Math.max(0, priority - 20);
    reasons.push('å‘è¡¨åœ¨é¡¶çº§æœŸåˆŠï¼Œæ–¹æ³•å­¦è´¨é‡é€šå¸¸è¾ƒé«˜');
  }
  
  return {
    priority,
    needReview,
    reasons,
    estimatedReviewTime: estimateReviewTime(extractionResult, needReview),
    reviewDeadline: calculateDeadline(priority)
  };
}
```

---

#### 1.3 âœ?è‡ªåŠ¨è´¨é‡å®¡è®¡

**å®šæœŸæ‰¹é‡æŠ½æŸ¥ï¼?0%ï¼‰ï¼Œè‡ªåŠ¨ç”Ÿæˆè´¨é‡æŠ¥å‘Š**ï¼?

```typescript
// æ¯å‘¨è‡ªåŠ¨å®¡è®¡
async function weeklyQualityAudit(
  startDate: Date,
  endDate: Date
): Promise<QualityAuditReport> {
  
  // 1. èŽ·å–æœ¬å‘¨æ‰€æœ‰æå–ç»“æž?
  const weeklyExtractions = await db.fulltextScreeningResults.findMany({
    where: {
      createdAt: { gte: startDate, lte: endDate }
    }
  });
  
  // 2. éšæœºæŠ½æ ·10%
  const sampleSize = Math.ceil(weeklyExtractions.length * 0.1);
  const sample = randomSample(weeklyExtractions, sampleSize);
  
  // 3. äººå·¥å¤æ ¸æ ·æœ¬
  const humanReviews = await requestHumanReview(sample);
  
  // 4. è®¡ç®—è´¨é‡æŒ‡æ ‡
  const metrics = {
    å‡†ç¡®çŽ? calculateAccuracy(sample, humanReviews),
    äººæœºä¸€è‡´æ€? calculateCohenKappa(sample, humanReviews),
    å‡é˜³æ€§çŽ‡: calculateFalsePositiveRate(sample, humanReviews),
    å‡é˜´æ€§çŽ‡: calculateFalseNegativeRate(sample, humanReviews),
    
    // åˆ†å­—æ®µå‡†ç¡®çŽ‡
    å­—æ®µå‡†ç¡®çŽ? FIELD_LIST.map(field => ({
      field,
      accuracy: calculateFieldAccuracy(field, sample, humanReviews)
    }))
  };
  
  // 5. æ¨¡åž‹æ€§èƒ½å¯¹æ¯”
  const modelPerformance = {
    'deepseek-v3': analyzeModelPerformance('deepseek-v3', sample, humanReviews),
    'qwen-max': analyzeModelPerformance('qwen-max', sample, humanReviews),
    'claude-4.5': analyzeModelPerformance('claude-4.5', sample, humanReviews)
  };
  
  // 6. é—®é¢˜åˆ†æž
  const issues = identifyCommonIssues(sample, humanReviews);
  
  // 7. æ”¹è¿›å»ºè®®
  const recommendations = generateRecommendations(metrics, issues);
  
  return {
    period: { start: startDate, end: endDate },
    totalExtractions: weeklyExtractions.length,
    sampledExtractions: sampleSize,
    metrics,
    modelPerformance,
    issues,
    recommendations,
    generatedAt: new Date()
  };
}

// è‡ªåŠ¨è¯†åˆ«å¸¸è§é—®é¢˜
function identifyCommonIssues(
  sample: Extraction[],
  humanReviews: HumanReview[]
): Issue[] {
  
  const issues = [];
  
  // é—®é¢˜1ï¼šæŸä¸ªå­—æ®µé”™è¯¯çŽ‡é«?
  for (const field of FIELD_LIST) {
    const fieldErrors = countFieldErrors(field, sample, humanReviews);
    if (fieldErrors / sample.length > 0.15) {  // é”™è¯¯çŽ?15%
      issues.push({
        type: 'high_field_error_rate',
        field,
        errorRate: fieldErrors / sample.length,
        examples: getErrorExamples(field, sample, humanReviews, 3),
        recommendation: `ä¼˜åŒ–å­—æ®µ"${field}"çš„Promptæ¨¡æ¿æˆ–Few-shotæ¡ˆä¾‹`
      });
    }
  }
  
  // é—®é¢˜2ï¼šç‰¹å®šç±»åž‹ç ”ç©¶é”™è¯¯çŽ‡é«?
  const studyTypeErrors = analyzeByStudyType(sample, humanReviews);
  for (const [studyType, errorRate] of Object.entries(studyTypeErrors)) {
    if (errorRate > 0.15) {
      issues.push({
        type: 'high_study_type_error_rate',
        studyType,
        errorRate,
        recommendation: `å¢žåŠ "${studyType}"ç±»åž‹ç ”ç©¶çš„Few-shotæ¡ˆä¾‹`
      });
    }
  }
  
  // é—®é¢˜3ï¼šç‰¹å®šæ¨¡åž‹è¡¨çŽ°å·®
  const modelErrors = analyzeByModel(sample, humanReviews);
  for (const [model, errorRate] of Object.entries(modelErrors)) {
    if (errorRate > 0.15) {
      issues.push({
        type: 'model_underperformance',
        model,
        errorRate,
        recommendation: `è€ƒè™‘è°ƒæ•´æ¨¡åž‹"${model}"çš„å‚æ•°æˆ–æ›´æ¢æ¨¡åž‹`
      });
    }
  }
  
  return issues;
}
```

**è´¨é‡æŠ¥è¡¨ç¤ºä¾‹**ï¼?

```markdown
# å…¨æ–‡å¤ç­›è´¨é‡å®¡è®¡æŠ¥å‘Š

**å®¡è®¡å‘¨æœŸ**ï¼?025-11-15 è‡?2025-11-22  
**æ€»æå–æ•°**ï¼?48ç¯? 
**æŠ½æ ·æ•?*ï¼?5ç¯‡ï¼ˆ10.1%ï¼?

## æ•´ä½“è´¨é‡æŒ‡æ ‡

| æŒ‡æ ‡ | æœ¬å‘¨ | ä¸Šå‘¨ | è¶‹åŠ¿ |
|------|------|------|------|
| å‡†ç¡®çŽ?| 94.7% | 93.2% | â†?+1.5% |
| Cohen's Kappa | 0.89 | 0.87 | â†?+0.02 |
| å‡é˜³æ€§çŽ‡ | 3.1% | 4.2% | â†?-1.1% |
| å‡é˜´æ€§çŽ‡ | 2.2% | 2.6% | â†?-0.4% |

## åˆ†å­—æ®µå‡†ç¡®çŽ‡

| å­—æ®µ | å‡†ç¡®çŽ?| çŠ¶æ€?|
|------|--------|------|
| ç ”ç©¶è®¾è®¡ | 100% | âœ?ä¼˜ç§€ |
| éšæœºåŒ–æ–¹æ³?| 93.3% | âœ?è‰¯å¥½ |
| ç›²æ³• | 86.7% | âš ï¸ éœ€æ”¹è¿› |
| åŸºçº¿å¯æ¯”æ€?| 100% | âœ?ä¼˜ç§€ |
| ç»“æžœå®Œæ•´æ€?| 93.3% | âœ?è‰¯å¥½ |
| ... | ... | ... |

## æ¨¡åž‹æ€§èƒ½å¯¹æ¯”

| æ¨¡åž‹ | å‡†ç¡®çŽ?| å¹³å‡ç½®ä¿¡åº?| å¤„ç†æ—¶é—´ |
|------|--------|-----------|----------|
| DeepSeek-V3 | 92.1% | 0.87 | 45s |
| Qwen3-Max | 94.5% | 0.91 | 38s |
| Claude-4.5ï¼ˆä»²è£ï¼‰ | 97.2% | 0.94 | 62s |

## å‘çŽ°çš„é—®é¢?

1. **å­—æ®µ"ç›²æ³•"é”™è¯¯çŽ‡åé«˜ï¼ˆ13.3%ï¼?*
   - å¸¸è§é”™è¯¯ï¼šå°†"å•ç›²"è¯¯åˆ¤ä¸?å®Œæ•´"
   - åŽŸå› åˆ†æžï¼šPromptæœªæ˜Žç¡®åŒºåˆ†å•ç›?åŒç›²çš„è´¨é‡å·®å¼?
   - æ”¹è¿›å»ºè®®ï¼šæ›´æ–°Promptï¼Œå¢žåŠ?å•ç›²é€šå¸¸ä¸è¶³ä»¥é˜²æ­¢æ£€æµ‹åå€?çš„è¯´æ˜?

2. **é˜Ÿåˆ—ç ”ç©¶æå–å‡†ç¡®çŽ‡ä½ŽäºŽRCTï¼?9% vs 96%ï¼?*
   - åŽŸå› åˆ†æžï¼šé˜Ÿåˆ—ç ”ç©¶çš„æ–¹æ³•å­¦æè¿°æ›´çµæ´»ï¼Œæ ‡å‡†åŒ–ç¨‹åº¦ä½?
   - æ”¹è¿›å»ºè®®ï¼šå¢žåŠ?ä¸ªé˜Ÿåˆ—ç ”ç©¶çš„Few-shotæ¡ˆä¾‹

## æ”¹è¿›å»ºè®®

1. âœ?ç«‹å³æ‰§è¡Œï¼šæ›´æ–?ç›²æ³•"å­—æ®µPromptæ¨¡æ¿
2. âš?æœ¬å‘¨å†…ï¼šå¢žåŠ é˜Ÿåˆ—ç ”ç©¶Few-shotæ¡ˆä¾‹åº?
3. ðŸ“… ä¸‹å‘¨ï¼šé‡æ–°è¯„ä¼?ç›²æ³•"å­—æ®µå‡†ç¡®çŽ?

## ä¸‹å‘¨ç›®æ ‡

- å‡†ç¡®çŽ‡ï¼šâ‰?95%
- Cohen's Kappaï¼šâ‰¥ 0.90
- "ç›²æ³•"å­—æ®µå‡†ç¡®çŽ‡ï¼šâ‰?93%
```

---

#### 1.4 âœ?Promptç‰ˆæœ¬ç®¡ç†

**Gitç®¡ç†æç¤ºè¯æ¨¡æ¿ï¼Œæ”¯æŒA/Bæµ‹è¯•**ï¼?

```
backend/prompts/asl/fulltext_screening/
â”œâ”€â”€ changelog.md
â”œâ”€â”€ fields/
â”?  â”œâ”€â”€ éšæœºåŒ–æ–¹æ³?
â”?  â”?  â”œâ”€â”€ v1.0.0-basic.md
â”?  â”?  â”œâ”€â”€ v1.1.0-with-examples.md
â”?  â”?  â”œâ”€â”€ v1.2.0-cot.md
â”?  â”?  â””â”€â”€ v1.3.0-enhanced-cochrane.md  â†?å½“å‰ç‰ˆæœ¬
â”?  â”œâ”€â”€ ç›²æ³•/
â”?  â”?  â”œâ”€â”€ v1.0.0-basic.md
â”?  â”?  â”œâ”€â”€ v1.1.0-clarify-single-double.md  â†?æ”¹è¿›ç‰?
â”?  â”?  â””â”€â”€ ...
â”?  â””â”€â”€ ...
â””â”€â”€ tests/
    â””â”€â”€ benchmark_results.json
```

**æ•°æ®åº“è®°å½?*ï¼?

```prisma
model PromptVersion {
  id              String   @id @default(uuid())
  
  field           String   // "éšæœºåŒ–æ–¹æ³?
  version         String   // "v1.3.0"
  content         String   @db.Text
  changelog       String   // "å¢žå¼ºCochraneæ ‡å‡†æè¿°ï¼Œæ·»åŠ?ä¸ªFew-shotæ¡ˆä¾‹"
  
  // æ€§èƒ½æŒ‡æ ‡ï¼ˆA/Bæµ‹è¯•ç»“æžœï¼?
  accuracy        Float?   // 0.947
  usageCount      Int      @default(0)
  avgConfidence   Float?
  
  // çŠ¶æ€?
  isActive        Boolean  @default(false)
  isExperimental  Boolean  @default(false)
  
  createdAt       DateTime @default(now())
  deactivatedAt   DateTime?
  
  @@map("asl_prompt_versions")
}
```

**A/Bæµ‹è¯•**ï¼?

```typescript
// 20%æµé‡ä½¿ç”¨æ–°ç‰ˆPrompt
async function extractFieldWithABTest(
  field: string,
  content: string
) {
  const isExperimentGroup = Math.random() < 0.2;
  
  const promptVersion = isExperimentGroup
    ? await getPromptVersion(field, 'experimental')
    : await getPromptVersion(field, 'stable');
  
  const result = await llmService.chat(
    'deepseek-v3',
    promptVersion.content,
    content
  );
  
  // è®°å½•ä½¿ç”¨
  await trackPromptUsage({
    field,
    version: promptVersion.version,
    isExperiment: isExperimentGroup,
    result
  });
  
  return result;
}

// æ¯å‘¨åˆ†æžA/Bæµ‹è¯•ç»“æžœ
async function analyzeABTest(field: string): Promise<ABTestReport> {
  const stableResults = await getPromptUsageStats(field, 'stable');
  const experimentResults = await getPromptUsageStats(field, 'experimental');
  
  const improvement = {
    accuracy: experimentResults.accuracy - stableResults.accuracy,
    confidence: experimentResults.avgConfidence - stableResults.avgConfidence,
    processingTime: experimentResults.avgTime - stableResults.avgTime
  };
  
  // ç»Ÿè®¡æ˜¾è‘—æ€§æ£€éª?
  const isSignificant = performTTest(stableResults, experimentResults);
  
  return {
    field,
    stableVersion: stableResults.version,
    experimentVersion: experimentResults.version,
    sampleSize: {
      stable: stableResults.count,
      experiment: experimentResults.count
    },
    improvement,
    isSignificant,
    recommendation: isSignificant && improvement.accuracy > 0.02
      ? 'promote_to_stable'  // æå‡ä¸ºç¨³å®šç‰ˆ
      : 'continue_testing'   // ç»§ç»­æµ‹è¯•
  };
}
```

---

### äºŒã€V2.0æˆæœ¬é¢„ç®—

**åœºæ™¯ï¼?00ç¯‡å…¨æ–‡å¤ç­›ï¼ˆé«˜è´¨é‡é¡¹ç›®ï¼‰**

| çŽ¯èŠ‚ | Tokenæ¶ˆè€?| æ¨¡åž‹ | æˆæœ¬ |
|------|----------|------|------|
| 12å­—æ®µåˆ†æ®µæå–ï¼ˆåŒæ¨¡åž‹ï¼?| 12K | DeepSeek-V3 + Qwen3-Max | Â¥0.06/ç¯?|
| å…¨æ–‡äº¤å‰éªŒè¯ | 3K | DeepSeek-V3 | Â¥0.003/ç¯?|
| å…³é”®å­—æ®µä¸‰æ¨¡åž‹ä»²è£ï¼ˆ15%ï¼?| 3K | Claude-4.5 | Â¥0.03/ç¯‡ï¼ˆä»?5%ï¼?|
| è´¨é‡å®¡è®¡ï¼?0%æŠ½æŸ¥ï¼?| 2K | äººå·¥ | 10åˆ†é’Ÿ/ç¯?|
| **100ç¯‡æ€»æˆæœ?* | - | - | **Â¥10 + äººå·¥æˆæœ¬** |

**è´¨é‡æå‡**ï¼šå‡†ç¡®çŽ‡ 92% â†?96%  
**æˆæœ¬å¢žåŠ **ï¼šÂ? â†?Â¥10ï¼?25%ï¼Œä½†è¾¾åˆ°åŒ»å­¦çº§æ ‡å‡†ï¼‰

---

### ä¸‰ã€V2.0éªŒæ”¶æ ‡å‡†

| æŒ‡æ ‡ | ç›®æ ‡ | éªŒè¯æ–¹æ³• |
|------|------|----------|
| å‡†ç¡®çŽ‡ï¼ˆä¸“å®¶è¯„ä¼°ï¼?| â‰?96% | äººå·¥æŠ½æŸ¥100ç¯?|
| äººæœºä¸€è‡´æ€?| Cohen's Kappa â‰?0.90 | ç»Ÿè®¡åˆ†æž |
| å‡é˜³æ€§çŽ‡ | â‰?3% | ç»Ÿè®¡åˆ†æž |
| å‡é˜´æ€§çŽ‡ | â‰?2% | ç»Ÿè®¡åˆ†æž |
| è¯æ®é“¾å®Œæ•´æ€?| 100% | è‡ªåŠ¨æ£€æŸ?|
| è‡ªåŠ¨åŒ–å®¡è®?| æ¯å‘¨1æ¬?| ç³»ç»ŸæŠ¥è¡¨ |
| Promptç‰ˆæœ¬ç®¡ç† | 100% | GitåŽ†å²è¿½è¸ª |
| ç¬¦åˆCochraneæ ‡å‡† | â‰?95% | ä¸“å®¶è®¤è¯ |

---

## ðŸ“Š ä¸‰é˜¶æ®µå¯¹æ¯”æ€»ç»“

| ç»´åº¦ | MVP | V1.0 | V2.0 |
|------|-----|------|------|
| **å‡†ç¡®çŽ?* | 85% | 92% | 96% |
| **æ ¸å¿ƒç­–ç•¥** | Nougat+åˆ†æ®µæå– | +å…¨æ–‡éªŒè¯+é€»è¾‘è§„åˆ™ | +ä¸‰æ¨¡åž‹ä»²è£?å®¡è®¡ |
| **è¯æ®é“?* | åŸºæœ¬å¼•ç”¨ | å®Œæ•´å®šä½ | å®¡è®¡çº§æ—¥å¿?|
| **è´¨é‡æŽ§åˆ¶** | åŒæ¨¡åž‹éªŒè¯?| åŒ»å­¦é€»è¾‘å¼•æ“Ž | HITL+è‡ªåŠ¨å®¡è®¡ |
| **æˆæœ¬/100ç¯?* | Â¥6 | Â¥8 | Â¥10 |
| **å¼€å‘å‘¨æœ?* | 3å‘?| 5å‘?| 8å‘?|
| **é€‚ç”¨åœºæ™¯** | å¿«é€ŸéªŒè¯?| å¸¸è§„é¡¹ç›® | Cochraneå‘è¡¨ |

---

## ðŸ”„ å®žæ–½è·¯å¾„

### é˜¶æ®µ1ï¼šMVPå¼€å‘ï¼ˆWeek 1-3ï¼?

**Week 1**ï¼šåŸºç¡€æž¶æž„
- [x] PDFå­˜å‚¨æœåŠ¡ï¼ˆå·²å®Œæˆï¼‰âœ…
- [ ] Nougatæå–+ç« èŠ‚è§£æž
- [ ] 12å­—æ®µè·¯ç”±è¡¨è®¾è®?
- [ ] åŸºç¡€Promptæ¨¡æ¿ï¼?2ä¸ªå­—æ®µï¼‰

**Week 2**ï¼šæ ¸å¿ƒåŠŸèƒ?
- [ ] åˆ†æ®µå¹¶è¡Œæå–
- [ ] åŒæ¨¡åž‹è°ƒç”?
- [ ] å­—æ®µçº§å†²çªæ£€æµ?
- [ ] åŸºç¡€è¯æ®é“?

**Week 3**ï¼šå‰ç«?æµ‹è¯•
- [ ] å‰ç«¯å·¥ä½œå?
- [ ] å†²çªå¯¹æ¯”è§†å›¾
- [ ] äººå·¥å¤æ ¸ç•Œé¢
- [ ] åŠŸèƒ½æµ‹è¯•+å‡†ç¡®çŽ‡è¯„ä¼?

### é˜¶æ®µ2ï¼šV1.0å¢žå¼ºï¼ˆWeek 4-8ï¼?

**Week 4-5**ï¼šè´¨é‡æå?
- [ ] Cochraneæ ‡å‡†Promptå¢žå¼º
- [ ] Few-shotåŒ»å­¦æ¡ˆä¾‹åº“ï¼ˆæ¯å­—æ®?-5ä¸ªï¼‰
- [ ] CoTæŽ¨ç†å¢žå¼º

**Week 6-7**ï¼šéªŒè¯æœºåˆ?
- [ ] å…¨æ–‡äº¤å‰éªŒè¯
- [ ] åŒ»å­¦é€»è¾‘è§„åˆ™å¼•æ“Ž
- [ ] å®Œæ•´è¯æ®é“?

**Week 8**ï¼šä¼˜åŒ?æ–‡æ¡£
- [ ] æ€§èƒ½ä¼˜åŒ–
- [ ] A/Bæµ‹è¯•
- [ ] æ–‡æ¡£å®Œå–„

### é˜¶æ®µ3ï¼šV2.0å®Œå–„ï¼ˆWeek 9-16ï¼?

**Week 9-11**ï¼šé«˜çº§åŠŸèƒ?
- [ ] ä¸‰æ¨¡åž‹ä»²è£?
- [ ] HITLæ™ºèƒ½åˆ†æµ
- [ ] Promptç‰ˆæœ¬ç®¡ç†+A/Bæµ‹è¯•

**Week 12-14**ï¼šè´¨é‡å®¡è®?
- [ ] è‡ªåŠ¨å®¡è®¡ç³»ç»Ÿ
- [ ] è´¨é‡æŠ¥è¡¨
- [ ] å¼‚å¸¸æ£€æµ?

**Week 15-16**ï¼šåŒ»å­¦ä¸“å®¶éªŒè¯?
- [ ] Cochraneä¸“å®¶è¯„å®¡
- [ ] å…¨é‡æµ‹è¯•
- [ ] å‘å¸ƒæ–‡æ¡£

---

## ðŸ“š ç›¸å…³æ–‡æ¡£

- [æ ‡é¢˜æ‘˜è¦åˆç­›è´¨é‡ä¿éšœç­–ç•¥](./06-è´¨é‡ä¿éšœä¸Žå¯è¿½æº¯ç­–ç•¥.md)
- [å…¨æ–‡å¤ç­›å¼€å‘è®¡åˆ’](../04-å¼€å‘è®¡åˆ?04-å…¨æ–‡å¤ç­›å¼€å‘è®¡åˆ?md)
- [æ•°æ®åº“è®¾è®¡](./01-æ•°æ®åº“è®¾è®?md)
- [APIè®¾è®¡è§„èŒƒ](./02-APIè®¾è®¡è§„èŒƒ.md)
- [äº‘åŽŸç”Ÿå¼€å‘è§„èŒƒ](../../../04-å¼€å‘è§„èŒ?08-äº‘åŽŸç”Ÿå¼€å‘è§„èŒ?md)

---

**æ›´æ–°æ—¥å¿—**ï¼?
- 2025-11-22: åˆ›å»ºæ–‡æ¡£ï¼Œå®šä¹‰å…¨æ–‡å¤ç­›ä¸‰é˜¶æ®µè´¨é‡ä¿éšœç­–ç•¥
- åŸºäºŽNougatç»“æž„åŒ?åˆ†æ®µæå–+å…¨æ–‡éªŒè¯çš„æŠ€æœ¯æ–¹æ¡?
- å‚è€ƒCochrane RoB 2.0æ ‡å‡†è®¾è®¡ä¸“ä¸šPromptæ¨¡æ¿
- å¼ºè°ƒå®Œæ•´è¯æ®é“¾å’Œå¯è¿½æº¯æ€?