# **æŠ€æœ¯è®¾è®¡æ–‡æ¡£ï¼šå·¥å…· A \- åŒ»ç–—æ•°æ®è¶…çº§åˆå¹¶å™?(The Super Merger)**

| æ–‡æ¡£ç±»åž‹ | Technical Design Document (TDD) |
| :---- | :---- |
| **å¯¹åº” PRD** | **PRD\_å·¥å…·A\_è¶…çº§åˆå¹¶å™¨\_V2.md** |
| **ç‰ˆæœ¬** | **V2.0** (æž¶æž„å‡çº§ï¼šè®¿è§†åŸºå‡?\+ æ—¶é—´çª? |
| **çŠ¶æ€?* | Draft |
| **æ ¸å¿ƒç›®æ ‡** | æž„å»ºä¸€ä¸ªåŸºäº?Web çš?ETL å·¥å…·ï¼Œè§£å†³ä¸´åºŠç§‘ç ”ä¸­â€œä¸€å¯¹å¤šâ€æ•°æ®å¯¹é½éš¾é¢˜ï¼Œå®žçŽ°åŸºäºŽæ—¶é—´çª—çš„ç²¾å‡†åˆå¹¶ã€?|

## **1\. æ€»ä½“æž¶æž„è®¾è®¡ (Architecture Overview)**

é‰´äºŽå¤„ç† Excel æ–‡ä»¶ï¼ˆè§£æžã€åˆå¹¶ã€å†™å…¥ï¼‰æ˜?CPU å¯†é›†åž‹å’Œå†…å­˜æ•æ„Ÿåž‹æ“ä½œï¼Œä¸ºäº†é¿å…é˜»å¡ž Node.js ä¸»çº¿ç¨‹ï¼Œæˆ‘ä»¬é‡‡ç”¨ **â€œå¼‚æ­¥ä»»åŠ¡é˜Ÿåˆ?\+ æµå¼å¤„ç†â€?* çš„æž¶æž„æ¨¡å¼ã€?
### **1.1 ç³»ç»Ÿæž¶æž„å›?*

graph TD  
    Client\[React å‰ç«¯ (Wizard UI)\]  
      
    subgraph API\_Server \[Fastify API æœåŠ¡\]  
        UploadAPI\[ä¸Šä¼ æŽ¥å£\]  
        TaskAPI\[ä»»åŠ¡çŠ¶æ€æŽ¥å£\]  
        ConfigAPI\[é…ç½®æŽ¥å£\]  
    end  
      
    subgraph Async\_Worker \[åŽå°å¤„ç† Worker\]  
        BullMQ\[BullMQ é˜Ÿåˆ—\]  
        Merger\[æ™ºèƒ½åˆå¹¶å¼•æ“Ž (Time-Window Joiner)\]  
        ExcelParser\[ExcelJS è§£æžå™¨\]  
        DateEngine\[æ—¥æœŸå½’ä¸€åŒ–å¼•æ“Ž\]  
    end  
      
    subgraph Storage \[æ•°æ®å­˜å‚¨\]  
        PG\[(PostgreSQL ä¸šåŠ¡åº?\]  
        FileSys\[ä¸´æ—¶æ–‡ä»¶å­˜å‚¨ (Local/S3)\]  
        Redis\[(Redis ç¼“å­˜/é˜Ÿåˆ—)\]  
    end

    Client \--1.ä¸Šä¼ æ–‡ä»¶--\> UploadAPI  
    UploadAPI \--ä¿å­˜ä¸´æ—¶æ–‡ä»¶--\> FileSys  
    Client \--2.æäº¤åŸºå‡†ä¸Žæ—¶é—´çª—é…ç½®--\> ConfigAPI  
    ConfigAPI \--åˆ›å»ºä»»åŠ¡--\> PG  
    ConfigAPI \--æŽ¨å…¥é˜Ÿåˆ—--\> BullMQ  
    BullMQ \--æ¶ˆè´¹ä»»åŠ¡--\> Merger  
    Merger \--è¯»å–è¾…è¡¨(å…¨é‡)--\> FileSys  
    Merger \--è¯»å–ä¸»è¡¨(æµå¼)--\> FileSys  
    Merger \--æµå¼åˆå¹¶ä¸Žå†™å…?-\> FileSys  
    Merger \--æ›´æ–°çŠ¶æ€?-\> PG  
    Client \--3.è½®è¯¢/WS è¿›åº¦--\> TaskAPI  
    Client \--4.ä¸‹è½½ç»“æžœ--\> API\_Server

## **2\. æŠ€æœ¯é€‰åž‹ (Tech Stack)**

åŸºäºŽçŽ°æœ‰æŠ€æœ¯æ ˆçš„é’ˆå¯¹æ€§é€‰æ‹©ï¼?
| å±‚çº§ | æŠ€æœ¯ç»„ä»?| é€‰åž‹ç†ç”± |
| :---- | :---- | :---- |
| **å‰ç«¯** | **React 19 \+ Ant Design 5** | åˆ©ç”¨ AntD çš?Steps, Upload, Tree (æ ‘çŠ¶é€‰æ‹©å™? å¿«é€Ÿæž„å»?UIã€?|
| **åŽç«¯æ¡†æž¶** | **Fastify 5.x** | é«˜æ€§èƒ½ HTTP æ¡†æž¶ï¼Œé€‚åˆé«˜å¹¶å?I/Oã€?|
| **Excel å¤„ç†** | **ExcelJS** | **æ ¸å¿ƒç»„ä»¶**ã€‚æ”¯æŒæµå¼è¯»å†?(Streaming I/O)ï¼Œè¿™æ˜¯å¤„ç†å¤§æ•°æ®é‡ä¸å´©çš„å…³é”®ã€?|
| **æ—¥æœŸå¤„ç†** | **Day.js \+ CustomParseFormat** | **æ–°å¢ž**ã€‚å¤„ç†â€œæ—¶é—´åœ°ç‹±â€çš„æ ¸å¿ƒåº“ï¼Œéœ€è¦æžå¼ºçš„å®¹é”™è§£æžèƒ½åŠ›ã€?|
| **ä»»åŠ¡é˜Ÿåˆ—** | **BullMQ \+ Redis** | å¿…é¡»å¼‚æ­¥å¤„ç†ã€‚åˆå¹¶é€»è¾‘å¤æ‚ï¼Œè€—æ—¶è¾ƒé•¿ï¼Œå¿…é¡»ç”¨é˜Ÿåˆ—ã€?|
| **æ•°æ®åº?* | **PostgreSQL 15 \+ Prisma** | å­˜å‚¨ä»»åŠ¡çŠ¶æ€ã€æ–‡ä»¶å…ƒæ•°æ®ã€?*ä¸å»ºè®®å°†åŽŸå§‹ Excel æ•°æ®å­˜å…¥ PG**ã€?|
| **éªŒè¯åº?* | **Zod** | ç”¨äºŽæ ¡éªŒå‰ç«¯æäº¤çš„å¤æ‚æ˜ å°„é…ç½®ç»“æž„ã€?|

### **2.1 å…³é”®æŠ€æœ¯å†³ç­?(ADR): ä¸ºä»€ä¹ˆä¸ç”?Python (Pandas)?**

è™½ç„¶ Python Pandas åœ¨æ•°æ®åˆå¹¶ä¸Šä»£ç æ›´ç®€æ´ï¼Œä½†é’ˆå¯?*æœ¬å·¥å…?*çš„åœºæ™¯ï¼Œæˆ‘ä»¬å†³å®šåšæŒä½¿ç”¨ **Node.js**ï¼Œç†ç”±å¦‚ä¸‹ï¼š

1. **æµå¼å¤„ç†ä¼˜åŠ¿ï¼?* Pandas å€¾å‘äºŽå…¨é‡åŠ è½½å†…å­˜ï¼Œå®¹æ˜“ OOMã€‚Node.js çš?Stream API å¤©ç„¶æ”¯æŒèƒŒåŽ‹ï¼Œèƒ½ç¨³å®šå¤„ç†â€œæ•°æ®è†¨èƒ€â€é—®é¢˜ã€? 
2. **æž¶æž„ä¸€è‡´æ€§ï¼š** é¿å…å¼•å…¥ Python Runtime å¸¦æ¥çš„è¿ç»´æˆæœ¬å’Œ IPC å¼€é”€ã€? 
3. **ç»“è®ºï¼?* å¯¹äºŽç²¾ç¡®åŒ¹é…å’Œé€»è¾‘æ¸…æ´—ï¼ŒNode.js æ€§èƒ½è¶³å¤Ÿä¸”æ›´å¯æŽ§ã€?
## **3\. æ•°æ®åº“è®¾è®?(Database Schema)**

### **Prisma Schema å®šä¹‰**

// ä»»åŠ¡çŠ¶æ€æžšä¸? 
enum TaskStatus {  
  PENDING  
  PROCESSING  
  COMPLETED  
  FAILED  
}

// åˆå¹¶ä»»åŠ¡è¡? 
model MergeTask {  
  id          String       @id @default(uuid())  
  userId      String         
  status      TaskStatus   @default(PENDING)  
  progress    Int          @default(0)  
    
  // æ ¸å¿ƒé…ç½®å­—æ®µ (V2 æ›´æ–°)  
  // ç»“æž„: {   
  //   anchorFileId: string,   
  //   anchorKeys: { id: "ä½é™¢å?, time: "å…¥é™¢æ—¥æœŸ" },  
  //   window: { daysBefore: 7, daysAfter: 7 },  
  //   files: \[{ id: "f2", timeCol: "æŠ¥å‘Šæ—¶é—´", columns: \["ç™½ç»†èƒ?\] }\]   
  // }  
  config      Json?          
    
  resultUrl   String?        
  report      Json?        // è´¨é‡æŠ¥å‘Š { totalRows: 1000, dropped: 50, matchRate: "95%" }  
  errorMsg    String?        
  createdAt   DateTime     @default(now())  
    
  files       SourceFile\[\]   
}

// æºæ–‡ä»¶è¡¨  
model SourceFile {  
  id          String     @id @default(uuid())  
  taskId      String  
  task        MergeTask  @relation(fields: \[taskId\], references: \[id\])  
  filename    String       
  filepath    String       
  headers     Json       // \["ä½é™¢å?, "å§“å", "å…¥é™¢æ—¥æœŸ"\]  
  rowCount    Int          
  fileSize    Int  
  uploadedAt  DateTime   @default(now())  
}