# **æŠ€æœ¯è®¾è®¡æ–‡æ¡£ï¼šå·¥å…· B \- ç—…åŽ†ç»“æž„åŒ–æœºå™¨äºº (The AI Structurer)**

| æ–‡æ¡£ç±»åž‹ | Technical Design Document (TDD) |
| :---- | :---- |
| **å¯¹åº” PRD** | **PRD\_å·¥å…·B\_ç—…åŽ†ç»“æž„åŒ–æœºå™¨äºº\_V2.md** |
| **ç‰ˆæœ¬** | **V2.0** (æž¶æž„å‡çº§ï¼šåŒæ¨¡åž‹äº¤å‰éªŒè¯) |
| **çŠ¶æ€?* | Draft |
| **æ ¸å¿ƒç›®æ ‡** | æž„å»ºä¸€ä¸ªé«˜å¯ä¿¡åº¦çš„åŒ»ç–—æ–‡æœ¬ç»“æž„åŒ–å¼•æ“Žï¼Œé€šè¿‡**åŒæ¨¡åž‹ï¼ˆDeepSeek & Qwenï¼‰å¹¶å‘æå?*ä¸?*è‡ªåŠ¨äº¤å‰éªŒè¯**ï¼Œè§£å†?AI å¹»è§‰é—®é¢˜ã€?|

## **1\. æ€»ä½“æž¶æž„è®¾è®¡ (Architecture Overview)**

ç³»ç»Ÿæž¶æž„ä»Žâ€œå•çº¿æ€§æµæ°´çº¿â€å‡çº§ä¸º **â€œYåž‹å¹¶å‘æµæ°´çº¿â€?*ã€‚æ•°æ®è¿›å…¥åŽï¼Œåˆ†å‘ç»™ä¸¤ä¸ªä¸åŒçš?LLM æ¨¡åž‹å¹¶è¡Œå¤„ç†ï¼Œç»“æžœæ±‡èšåˆ°â€œå†²çªæ£€æµ‹å¼•æ“Žâ€è¿›è¡Œæ¯”å¯¹ï¼Œæœ€åŽè¾“å‡ºåˆ°äººå·¥éªŒè¯ç½‘æ ¼ã€?
### **1.1 ç³»ç»Ÿæž¶æž„å›?*

graph TD  
    Client\[React å‰ç«¯ (Grid & Drawer UI)\]  
      
    subgraph API\_Server \[Fastify API æœåŠ¡\]  
        JobAPI\[ä»»åŠ¡ä¸Žæ¨¡ç‰ˆæŽ¥å£\]  
        VerifyAPI\[å…¨æ™¯ç½‘æ ¼æŽ¥å£\]  
    end  
      
    subgraph Async\_Cluster \[åŽå° Worker é›†ç¾¤\]  
        BullMQ\[BullMQ ä»»åŠ¡é˜Ÿåˆ—\]  
        Orchestrator\[ä»»åŠ¡ç¼–æŽ’å™¨\]  
        PII\_Engine\[éšç§è„±æ•å¼•æ“Ž\]  
          
        subgraph Dual\_LLM\_Engine \[åŒç›²æå–å¼•æ“Ž\]  
            ClientA\[DeepSeek å®¢æˆ·ç«¯\]  
            ClientB\[Qwen å®¢æˆ·ç«¯\]  
        end  
          
        CrossValidator\[äº¤å‰éªŒè¯/å†²çªæ£€æµ‹å™¨\]  
    end  
      
    subgraph Storage \[æ•°æ®å­˜å‚¨\]  
        PG\[(PostgreSQL \- ä¸šåŠ¡æ•°æ®)\]  
        VectorDB\[(pgvector \- å¯é€‰ï¼Œç”¨äºŽè¯­ä¹‰æ¯”å¯¹)\]  
        Redis\[(Redis \- é˜Ÿåˆ—)\]  
    end

    Client \--1.ä¸Šä¼ &ä½“æ£€--\> JobAPI  
    JobAPI \--2.åˆ›å»ºå¹¶å‘ä»»åŠ¡--\> BullMQ  
    BullMQ \--3.æ¶ˆè´¹--\> Orchestrator  
    Orchestrator \--4.è„±æ•--\> PII\_Engine  
    PII\_Engine \--5.å¹¶è¡Œè°ƒç”¨--\> ClientA & ClientB  
    ClientA & ClientB \--6.è¿”å›žJSON--\> CrossValidator  
    CrossValidator \--7.è®¡ç®—ä¸€è‡´æ€?-\> PG  
    Client \--8.æ‹‰å–ç½‘æ ¼æ•°æ®--\> VerifyAPI  
    VerifyAPI \--9.äººå·¥è£å†³--\> PG

## **2\. æŠ€æœ¯é€‰åž‹ (Tech Stack)**

| å±‚çº§ | æŠ€æœ¯ç»„ä»?| é€‰åž‹ç†ç”± |
| :---- | :---- | :---- |
| **åŽç«¯æ¡†æž¶** | **Fastify 5.x** | é«˜æ€§èƒ½å¼‚æ­¥ I/Oï¼Œé€‚åˆå¤„ç†é«˜å¹¶å‘æ¨¡åž‹è°ƒç”¨ã€?|
| **æ¨¡åž‹æŽ¥å…¥** | **LangChain.js** | ç»Ÿä¸€å°è£… DeepSeek å’?Qwen çš„è°ƒç”¨æŽ¥å£ï¼Œä¾¿äºŽåˆ‡æ¢æ¨¡åž‹ã€?|
| **ä»»åŠ¡é˜Ÿåˆ—** | **BullMQ** | æ ¸å¿ƒç»„ä»¶ã€‚V2 éœ€è¦åˆ©ç”?Flow åŠŸèƒ½æˆ–æ‰‹åŠ¨ç¼–æŽ’æ¥å®žçŽ°â€œç­‰å¾…ä¸¤ä¸ªæ¨¡åž‹éƒ½è¿”å›žâ€çš„é€»è¾‘ã€?|
| **å†²çªæ£€æµ?* | **Lodash (åŸºç¡€) \+ Dice Coefficient (è¿›é˜¶)** | ç”¨äºŽæ¯”å¯¹ä¸¤ä¸ª JSON å¯¹è±¡çš„å­—æ®µå·®å¼‚ã€‚æ–‡æœ¬ç›¸ä¼¼åº¦å¯ä½¿ç”¨ç®€å•çš„ Dice ç³»æ•°æˆ?Levenshtein è·ç¦»ï¼Œæš‚ä¸éœ€è¦é‡åž‹å‘é‡åº“ã€?|
| **æ•°æ®åº?* | **PostgreSQL 15** | å­˜å‚¨ JSONB æ ¼å¼çš„åŒæ¨¡åž‹ç»“æžœã€?|
| **å‰ç«¯äº¤äº’** | **React \+ TanStack Table** | V2 æ”¹ä¸ºå…¨æ™¯ç½‘æ ¼ï¼Œæ•°æ®é‡å¤§æ—¶éœ€è¦?TanStack Table (Headless) é…åˆè™šæ‹Ÿæ»šåŠ¨ã€?|

## **3\. æ ¸å¿ƒæµç¨‹è®¾è®¡ (Core Logic)**

### **3.1 æ™ºèƒ½ä½“æ£€ (Health Check Logic)**

* **è§¦å‘æ—¶æœºï¼?* ç”¨æˆ·åœ¨å‰ç«¯é€‰æ‹©â€œæ–‡æœ¬åˆ—â€çš„çž¬é—´ã€? 
* **æ‰§è¡Œé€»è¾‘ï¼?*  
  1. åŽç«¯è¯»å–è¯¥åˆ—çš„å‰ 100 è¡Œï¼ˆä¸è¯»å…¨é‡ï¼‰ã€? 
  2. è®¡ç®—ç»Ÿè®¡æŒ‡æ ‡ï¼? 
     * emptyRate: ç©ºå€?/ æ€»è¡Œæ•°ã€? 
     * avgLength: éžç©ºè¡Œçš„å¹³å‡å­—ç¬¦æ•°ã€? 
  3. **æ‹¦æˆªç­–ç•¥ï¼?* è‹?emptyRate \> 0.8 æˆ?avgLength \< 10ï¼Œè¿”å›?status: 'BAD'ã€? 
  4. **Token é¢„ä¼°ï¼?* totalRows \* avgLength \* 1.5 (ç²—ç•¥ä¼°ç®—)ã€?
### **3.2 åŒç›²æå–ä¸Žäº¤å‰éªŒè¯?(Double-Blind & Validation)**

è¿™æ˜¯ V2 çš„å¿ƒè„ã€?
#### **A. æç¤ºè¯å·¥ç¨?(Prompt Engineering)**

ä¸ºäº†æ–¹ä¾¿æ¯”å¯¹ï¼Œå¿…é¡»å¼ºåˆ¶ä¸¤ä¸ªæ¨¡åž‹è¾“å‡?*å®Œå…¨ä¸€è‡´çš„ JSON ç»“æž„**ã€?
* **System Prompt:** "You are a medical structural extraction assistant..."  
* **Constraint:** "Output strictly in JSON format. Keys must be: \['tumor\_size', 'lymph\_node', ...\]."  
* **Temperature:** è®¾ä¸º 0ï¼Œè¿½æ±‚æœ€å¤§ç¡®å®šæ€§ã€?
#### **B. äº¤å‰éªŒè¯ç®—æ³• (The Judge)**

å½?Model A (DeepSeek) å’?Model B (Qwen) è¿”å›žç»“æžœåŽï¼Œæ‰§è¡Œæ¯”å¯¹ï¼?
function validate(jsonA, jsonB) {  
  const conflicts \= \[\];  
  const keys \= Object.keys(jsonA);  
    
  for (const key of keys) {  
    const valA \= normalize(jsonA\[key\]); // å½’ä¸€åŒ–ï¼šåŽ»é™¤ç©ºæ ¼ã€è½¬å°å†™ã€åŠè§’åŒ–  
    const valB \= normalize(jsonB\[key\]);  
      
    // 1\. ç²¾ç¡®åŒ¹é…  
    if (valA \=== valB) continue;  
      
    // 2\. æ•°å€¼å½’ä¸€åŒ–åŒ¹é…?(å¦?"3cm" vs "3.0cm")  
    if (isNumber(valA) && isNumber(valB) && parse(valA) \=== parse(valB)) continue;  
      
    // 3\. (å¯é€? è¯­ä¹‰ç›¸ä¼¼åº¦åŒ¹é…? 
    // if (similarity(valA, valB) \> 0.95) continue;  
      
    conflicts.push(key);  
  }  
    
  return conflicts.length \=== 0 ? 'CLEAN' : 'CONFLICT';  
}

## **4\. æ•°æ®åº“è®¾è®?(Database Schema)**

V2 éœ€è¦å­˜å‚¨ä¸¤ä»?AI ç»“æžœä»¥åŠç”¨æˆ·çš„è£å†³ç»“æžœã€?
### **Prisma Schema æ›´æ–°**

// ä»»åŠ¡è¡? 
model ExtractionJob {  
  id          String   @id @default(uuid())  
  // ...å…¶ä»–å­—æ®µ  
  diseaseType String   // ç–¾ç—…ç±»åž‹ (è‚ºç™Œ)  
  reportType  String   // æŠ¥å‘Šç±»åž‹ (ç—…ç†)  
  targetFields Json    // ç›®æ ‡å­—æ®µå®šä¹‰ \[{name: "è‚¿ç˜¤å¤§å°", desc: "..."}\]  
}

// å•è¡Œè®°å½•è¡? 
model ExtractionItem {  
  id          String   @id @default(uuid())  
  jobId       String  
  originalText String  @db.Text  
    
  // V2 æ ¸å¿ƒå­—æ®µ  
  resultA     Json?    // DeepSeek ç»“æžœ { "size": "3cm" }  
  resultB     Json?    // Qwen ç»“æžœ { "size": "3.0 cm" }  
    
  // å†²çªæ£€æµ‹ç»“æž? 
  status      ItemStatus // PENDING, CLEAN, CONFLICT, RESOLVED  
  conflictFields String\[\] // \["size"\] è®°å½•å“ªäº›å­—æ®µå†²çªäº? 
    
  // æœ€ç»ˆé‡‡çº³ç»“æž?(ç”¨æˆ·è£å†³åŽå†™å…¥ï¼Œæˆ–è€…ä¸€è‡´æ—¶è‡ªåŠ¨å†™å…¥)  
  finalResult Json?      
}

## **5\. æŽ¥å£è®¾è®¡ (API Endpoints)**

### **5.1 æ¨¡ç‰ˆä¸Žé…ç½?*

* GET /api/templates: èŽ·å–é¢„è®¾çš„ç–¾ç—…å’ŒæŠ¥å‘Šæ¨¡ç‰ˆåˆ—è¡¨ã€? 
* POST /api/jobs: åˆ›å»ºä»»åŠ¡ï¼ŒPayload ä¸­éœ€åŒ…å« diseaseType å’?reportTypeï¼Œä¾¿äºŽåŽç«¯ç»„è£?Promptã€?
### **5.2 ç½‘æ ¼éªŒè¯ (Grid Verification)**

* GET /api/jobs/:id/rows: åˆ†é¡µèŽ·å–éªŒè¯æ•°æ®ã€? 
  * **Response:** è¿”å›ž originalText, resultA, resultB, conflictFieldsã€? 
* POST /api/items/:id/resolve: å•è¡Œè£å†³ã€? 
  * **Payload:** { field: "tumor\_size", chosenValue: "3cm" }ã€? 
  * **Logic:** æ›´æ–° finalResultï¼Œå¦‚æžœè¯¥è¡Œæ‰€æœ‰å†²çªå­—æ®µéƒ½å·²è§£å†³ï¼Œå°?status æ›´æ–°ä¸?RESOLVEDã€?
## **6\. å‰ç«¯è¯¦ç»†è®¾è®¡ (Frontend)**

### **6.1 å…¨æ™¯éªŒè¯ç½‘æ ¼ (Verification Grid)**

* **ç»„ä»¶é€‰åž‹ï¼?* ä¾ç„¶æŽ¨è **TanStack Table** (é€»è¾‘å±? \+ **UI ç»„ä»¶åº?* (æ¸²æŸ“å±?ã€? 
* **å†²çªå•å…ƒæ ¼æ¸²æŸ“ï¼š**  
  * å½?conflictFields.includes(column.id) æ—¶ï¼Œå•å…ƒæ ¼æ¸²æŸ“ä¸º**å¯¹æ¯”æ¨¡å¼**ã€? 
  * æ˜¾ç¤ºä¸¤ä¸ªå°æŒ‰é’®ï¼š\[DS: 3cm\] å’?\[QW: 3.0cm\]ã€? 
  * ç”¨æˆ·ç‚¹å‡»ä»»ä¸€æŒ‰é’®ï¼Œè§¦å?resolve APIï¼Œå‰ç«¯ä¹è§‚æ›´æ–°ï¼ˆOptimistic Updateï¼‰ä¸ºé€‰ä¸­çŠ¶æ€ã€?
### **6.2 ä¾§è¾¹æ åŽŸæ–?(Context Drawer)**

* **è§¦å‘ï¼?* ç‚¹å‡»è¡¨æ ¼è¡Œçš„ç©ºç™½å¤„æˆ–â€œæŸ¥çœ‹åŽŸæ–‡â€å›¾æ ‡ã€? 
* **åŠŸèƒ½ï¼?* å±•ç¤º originalTextã€? 
* **é«˜äº®ä¼˜åŒ–ï¼?* ç®€å•å®žçŽ?String.indexOf æŸ¥æ‰¾å½“å‰å­—æ®µçš„å€¼å¹¶æ ‡é»„ã€?
## **7\. é£Žé™©æŽ§åˆ¶ä¸Žæ€§èƒ½ä¼˜åŒ–**

| æ½œåœ¨é£Žé™© | è§£å†³æ–¹æ¡ˆ |
| :---- | :---- |
| **åŒå€?Token æˆæœ¬** | 1\. é»˜è®¤ä½¿ç”¨ DeepSeek (æžä½Žæˆæœ¬) \+ Qwen (ä½Žæˆæœ? ç»„åˆã€?2\. åœ¨â€œä½“æ£€â€é˜¶æ®µä¸¥æ ¼æ‹¦æˆªæ— æ•ˆæ•°æ®ã€?|
| **å¤„ç†é€Ÿåº¦æ…?* | ä¸¤ä¸ªæ¨¡åž‹å¿…é¡» **å¹¶å‘è°ƒç”¨ (Promise.all)**ï¼Œè€Œä¸æ˜¯ä¸²è¡Œã€‚æ•´ä½“è€—æ—¶å–å†³äºŽæœ€æ…¢çš„é‚£ä¸ªæ¨¡åž‹ã€?|
| **æ¨¡åž‹æ ¼å¼ä¸å¬è¯?* | Prompt ä¸­å¢žåŠ?Few-Shot (å°‘æ ·æœ? ç¤ºä¾‹ï¼Œæ˜Žç¡®å±•ç¤?JSON æ ¼å¼ã€‚å¦‚æž?JSON è§£æžå¤±è´¥ï¼Œè‡ªåŠ¨é‡è¯?1 æ¬¡ã€?|
| **å‰ç«¯ç½‘æ ¼å¡é¡¿** | å¦‚æžœæ•°æ®è¶…è¿‡ 1000 æ¡ï¼Œå¼€å?Virtual Scrolling (è™šæ‹Ÿæ»šåŠ¨)ã€?|