feat(aia): Complete AIA V2.0 with universal streaming capabilities

Major Changes: - Add StreamingService with OpenAI Compatible format - Upgrade Chat component V2 with Ant Design X integration - Implement AIA module with 12 intelligent agents - Update API routes to unified /api/v1 prefix - Update system documentation Backend (~1300 lines): - common/streaming: OpenAI Compatible adapter - modules/aia: 12 agents, conversation service, streaming integration - Update route versions (RVW, PKB to v1) Frontend (~3500 lines): - modules/aia: AgentHub + ChatWorkspace (100% prototype restoration) - shared/Chat: AIStreamChat, ThinkingBlock, useAIStream Hook - Update API endpoints to v1 Documentation: - AIA module status guide - Universal capabilities catalog - System overview updates - All module documentation sync Tested: Stream response verified, authentication working Status: AIA V2.0 core completed (85%)
2026-01-14 19:15:01 +08:00
parent 3d35e9c58b
commit 1b53ab9d52
386 changed files with 52096 additions and 65238 deletions
--- a/docs/03-业务模块/DC-数据清洗整理/02-技术设计/技术设计文档：工具
+++ b/docs/03-业务模块/DC-数据清洗整理/02-技术设计/技术设计文档：工具
@@ -1,17 +1,16 @@
-# **技术设计文档：工具 A \- 医疗数据超级合并器 (The Super Merger)**
+# **æŠ€æœ¯è®¾è®¡æ–‡æ¡£ï¼šå·¥å…· A \- åŒ»ç–—æ•°æ<C2B0>®è¶…çº§å<C2A7>ˆå¹¶å™?(The Super Merger)**

 | æ–‡æ¡£ç±»åž‹ | Technical Design Document (TDD) |
 | :---- | :---- |
 | **å¯¹åº” PRD** | **PRD\_å·¥å…·A\_è¶…çº§å<C2A7>ˆå¹¶å™¨\_V2.md** |
-| **版本** | **V2.0** (架构升级：访视基准 \+ 时间窗) |
-| **状态** | Draft |
-| **核心目标** | 构建一个基于 Web 的 ETL 工具，解决临床科研中“一对多”数据对齐难题，实现基于时间窗的精准合并。 |
+| **ç‰ˆæœ¬** | **V2.0** (æž¶æž„å<EFBFBD>‡çº§ï¼šè®¿è§†åŸºå‡?\+ æ—¶é—´çª? |
+| **çŠ¶æ€?* | Draft |
+| **æ ¸å¿ƒç›®æ ‡** | æž„å»ºä¸€ä¸ªåŸºäº?Web çš?ETL å·¥å…·ï¼Œè§£å†³ä¸´åºŠç§‘ç ”ä¸â€œä¸€å¯¹å¤šâ€<EFBFBD>æ•°æ<EFBFBD>®å¯¹é½<EFBFBD>éš¾é¢˜ï¼Œå®žçŽ°åŸºäºŽæ—¶é—´çª—çš„ç²¾å‡†å<EFBFBD>ˆå¹¶ã€?|

 ## **1\. æ€»ä½“æž¶æž„è®¾è®¡ (Architecture Overview)**

-鉴于处理 Excel 文件（解析、合并、写入）是 CPU 密集型和内存敏感型操作，为了避免阻塞 Node.js 主线程，我们采用 **“异步任务队列 \+ 流式处理”** 的架构模式。
-
-### **1.1 系统架构图**
+é‰´äºŽå¤„ç<EFBFBD>† Excel æ–‡ä»¶ï¼ˆè§£æž<C3A6>ã€<C3A3>å<EFBFBD>ˆå¹¶ã€<C3A3>å†™å…¥ï¼‰æ˜?CPU å¯†é›†åž‹å’Œå†…å˜æ•<C3A6>æ„Ÿåž‹æ“<C3A6>ä½œï¼Œä¸ºäº†é<E280A0>¿å…<C3A5>é˜»å¡ž Node.js ä¸»çº¿ç¨‹ï¼Œæˆ‘ä»¬é‡‡ç”¨ **â€œå¼‚æ¥ä»»åŠ¡é˜Ÿåˆ?\+ æµ<C3A6>å¼<C3A5>å¤„ç<E2809E>†â€?* çš„æž¶æž„æ¨¡å¼<C3A5>ã€?
+### **1.1 ç³»ç»Ÿæž¶æž„å›?*

 graph TD  
    Client\[React å‰<C3A5>ç«¯ (Wizard UI)\]  
@@ -30,7 +29,7 @@ graph TD
    end  
      
    subgraph Storage \[æ•°æ<C2B0>®å˜å‚¨\]  
-        PG\[(PostgreSQL 业务库)\]  
+        PG\[(PostgreSQL ä¸šåŠ¡åº?\]  
        FileSys\[ä¸´æ—¶æ–‡ä»¶å˜å‚¨ (Local/S3)\]  
        Redis\[(Redis ç¼“å˜/é˜Ÿåˆ—)\]  
    end
@@ -43,38 +42,36 @@ graph TD
    BullMQ \--æ¶ˆè´¹ä»»åŠ¡--\> Merger  
    Merger \--è¯»å<C2BB>–è¾…è¡¨(å…¨é‡<C3A9>)--\> FileSys  
    Merger \--è¯»å<C2BB>–ä¸»è¡¨(æµ<C3A6>å¼<C3A5>)--\> FileSys  
-    Merger \--流式合并与写入--\> FileSys  
-    Merger \--更新状态--\> PG  
+    Merger \--æµ<EFBFBD>å¼<EFBFBD>å<EFBFBD>ˆå¹¶ä¸Žå†™å…?-\> FileSys  
+    Merger \--æ›´æ–°çŠ¶æ€?-\> PG  
    Client \--3.è½®è¯¢/WS è¿›åº¦--\> TaskAPI  
    Client \--4.ä¸‹è½½ç»“æžœ--\> API\_Server

 ## **2\. æŠ€æœ¯é€‰åž‹ (Tech Stack)**

-基于现有技术栈的针对性选择：
-
-| 层级 | 技术组件 | 选型理由 |
+åŸºäºŽçŽ°æœ‰æŠ€æœ¯æ ˆçš„é’ˆå¯¹æ€§é€‰æ‹©ï¼?
+| å±‚çº§ | æŠ€æœ¯ç»„ä»?| é€‰åž‹ç<E280B9>†ç”± |
 | :---- | :---- | :---- |
-| **前端** | **React 19 \+ Ant Design 5** | 利用 AntD 的 Steps, Upload, Tree (树状选择器) 快速构建 UI。 |
-| **后端框架** | **Fastify 5.x** | 高性能 HTTP 框架，适合高并发 I/O。 |
-| **Excel 处理** | **ExcelJS** | **核心组件**。支持流式读写 (Streaming I/O)，这是处理大数据量不崩的关键。 |
-| **日期处理** | **Day.js \+ CustomParseFormat** | **新增**。处理“时间地狱”的核心库，需要极强的容错解析能力。 |
-| **任务队列** | **BullMQ \+ Redis** | 必须异步处理。合并逻辑复杂，耗时较长，必须用队列。 |
-| **数据库** | **PostgreSQL 15 \+ Prisma** | 存储任务状态、文件元数据。**不建议将原始 Excel 数据存入 PG**。 |
-| **验证库** | **Zod** | 用于校验前端提交的复杂映射配置结构。 |
+| **å‰<EFBFBD>ç«¯** | **React 19 \+ Ant Design 5** | åˆ©ç”¨ AntD çš?Steps, Upload, Tree (æ ‘çŠ¶é€‰æ‹©å™? å¿«é€Ÿæž„å»?UIã€?|
+| **å<EFBFBD>Žç«¯æ¡†æž¶** | **Fastify 5.x** | é«˜æ€§èƒ½ HTTP æ¡†æž¶ï¼Œé€‚å<E2809A>ˆé«˜å¹¶å<C2B6>?I/Oã€?|
+| **Excel å¤„ç<EFBFBD>†** | **ExcelJS** | **æ ¸å¿ƒç»„ä»¶**ã€‚æ”¯æŒ<C3A6>æµ<C3A6>å¼<C3A5>è¯»å†?(Streaming I/O)ï¼Œè¿™æ˜¯å¤„ç<E2809E>†å¤§æ•°æ<C2B0>®é‡<C3A9>ä¸<C3A4>å´©çš„å…³é”®ã€?|
+| **æ—¥æœŸå¤„ç<EFBFBD>†** | **Day.js \+ CustomParseFormat** | **æ–°å¢ž**ã€‚å¤„ç<E2809E>†â€œæ—¶é—´åœ°ç‹±â€<C3A2>çš„æ ¸å¿ƒåº“ï¼Œéœ€è¦<C3A8>æž<C3A6>å¼ºçš„å®¹é”™è§£æž<C3A6>èƒ½åŠ›ã€?|
+| **ä»»åŠ¡é˜Ÿåˆ—** | **BullMQ \+ Redis** | å¿…é¡»å¼‚æ¥å¤„ç<EFBFBD>†ã€‚å<EFBFBD>ˆå¹¶é€»è¾‘å¤<EFBFBD>æ<EFBFBD>‚ï¼Œè€—æ—¶è¾ƒé•¿ï¼Œå¿…é¡»ç”¨é˜Ÿåˆ—ã€?|
+| **æ•°æ<EFBFBD>®åº?* | **PostgreSQL 15 \+ Prisma** | å˜å‚¨ä»»åŠ¡çŠ¶æ€<EFBFBD>ã€<EFBFBD>æ–‡ä»¶å…ƒæ•°æ<EFBFBD>®ã€?*ä¸<C3A4>å»ºè®®å°†åŽŸå§‹ Excel æ•°æ<C2B0>®å˜å…¥ PG**ã€?|
+| **éªŒè¯<EFBFBD>åº?* | **Zod** | ç”¨äºŽæ ¡éªŒå‰<EFBFBD>ç«¯æ<EFBFBD><EFBFBD>äº¤çš„å¤<EFBFBD>æ<EFBFBD>‚æ˜ å°„é…<EFBFBD>ç½®ç»“æž„ã€?|

-### **2.1 关键技术决策 (ADR): 为什么不用 Python (Pandas)?**
+### **2.1 å…³é”®æŠ€æœ¯å†³ç?(ADR): ä¸ºä»€ä¹ˆä¸<C3A4>ç”?Python (Pandas)?**

-虽然 Python Pandas 在数据合并上代码更简洁，但针对**本工具**的场景，我们决定坚持使用 **Node.js**，理由如下：
+è™½ç„¶ Python Pandas åœ¨æ•°æ<EFBFBD>®å<EFBFBD>ˆå¹¶ä¸Šä»£ç <EFBFBD>æ›´ç®€æ´<EFBFBD>ï¼Œä½†é’ˆå¯?*æœ¬å·¥å…?*çš„åœºæ™¯ï¼Œæˆ‘ä»¬å†³å®šå<C5A1>šæŒ<C3A6>ä½¿ç”¨ **Node.js**ï¼Œç<C592>†ç”±å¦‚ä¸‹ï¼š

-1. **流式处理优势：** Pandas 倾向于全量加载内存，容易 OOM。Node.js 的 Stream API 天然支持背压，能稳定处理“数据膨胀”问题。  
-2. **架构一致性：** 避免引入 Python Runtime 带来的运维成本和 IPC 开销。  
-3. **结论：** 对于精确匹配和逻辑清洗，Node.js 性能足够且更可控。
-
-## **3\. 数据库设计 (Database Schema)**
+1. **æµ<EFBFBD>å¼<EFBFBD>å¤„ç<EFBFBD>†ä¼˜åŠ¿ï¼?* Pandas å€¾å<C2BE>‘äºŽå…¨é‡<C3A9>åŠ è½½å†…å˜ï¼Œå®¹æ˜“ OOMã€‚Node.js çš?Stream API å¤©ç„¶æ”¯æŒ<EFBFBD>èƒŒåŽ‹ï¼Œèƒ½ç¨³å®šå¤„ç<EFBFBD>†â€œæ•°æ<EFBFBD>®è†¨èƒ€â€<EFBFBD>é—®é¢˜ã€? 
+2. **æž¶æž„ä¸€è‡´æ€§ï¼š** é<>¿å…<C3A5>å¼•å…¥ Python Runtime å¸¦æ<C2A6>¥çš„è¿<C3A8>ç»´æˆ<C3A6>æœ¬å’Œ IPC å¼€é”€ã€? 
+3. **ç»“è®ºï¼?* å¯¹äºŽç²¾ç¡®åŒ¹é…<C3A9>å’Œé€»è¾‘æ¸…æ´—ï¼ŒNode.js æ€§èƒ½è¶³å¤Ÿä¸”æ›´å<C2B4>¯æŽ§ã€?
+## **3\. æ•°æ<C2B0>®åº“è®¾è®?(Database Schema)**

 ### **Prisma Schema å®šä¹‰**

-// 任务状态枚举  
+// ä»»åŠ¡çŠ¶æ€<EFBFBD>æžšä¸? 
 enum TaskStatus {  
  PENDING  
  PROCESSING  
@@ -82,7 +79,7 @@ enum TaskStatus {
  FAILED  
 }

-// 合并任务表  
+// å<EFBFBD>ˆå¹¶ä»»åŠ¡è¡? 
 model MergeTask {  
  id          String       @id @default(uuid())  
  userId      String         
@@ -92,9 +89,9 @@ model MergeTask {
  // æ ¸å¿ƒé…<C3A9>ç½®å—æ®µ (V2 æ›´æ–°)  
  // ç»“æž„: {   
  //   anchorFileId: string,   
-  //   anchorKeys: { id: "住院号", time: "入院日期" },  
+  //   anchorKeys: { id: "ä½<EFBFBD>é™¢å<EFBFBD>?, time: "å…¥é™¢æ—¥æœŸ" },  
  //   window: { daysBefore: 7, daysAfter: 7 },  
-  //   files: \[{ id: "f2", timeCol: "报告时间", columns: \["白细胞"\] }\]   
+  //   files: \[{ id: "f2", timeCol: "æŠ¥å‘Šæ—¶é—´", columns: \["ç™½ç»†èƒ?\] }\]   
  // }  
  config      Json?          
    
@@ -113,7 +110,7 @@ model SourceFile {
  task        MergeTask  @relation(fields: \[taskId\], references: \[id\])  
  filename    String       
  filepath    String       
-  headers     Json       // \["住院号", "姓名", "入院日期"\]  
+  headers     Json       // \["ä½<EFBFBD>é™¢å<EFBFBD>?, "å§“å<E2809C><C3A5>", "å…¥é™¢æ—¥æœŸ"\]  
  rowCount    Int          
  fileSize    Int  
  uploadedAt  DateTime   @default(now())