# PKB - ä¸ªäººçŸ¥è¯†åº“æ¨¡å—ï¼šæ•°æ®åº“è®¾è®?

> **ç‰ˆæœ¬ï¼?* v1.0  
> **æ›´æ–°æ—¶é—´ï¼?* 2025-11-12  
> **æ•°æ®åº“Schemaï¼?* `pkb_schema`  
> **çŠ¶æ€ï¼š** âœ?å·²å®žæ–½å¹¶è¿ç§»  

---

## ðŸ“‹ ç›®å½•

1. [æ¨¡å—æ¦‚è¿°](#æ¨¡å—æ¦‚è¿°)
2. [Schemaä¿¡æ¯](#schemaä¿¡æ¯)
3. [æ•°æ®åº“è¡¨è®¾è®¡](#æ•°æ®åº“è¡¨è®¾è®¡)
4. [è¡¨å…³ç³»å›¾](#è¡¨å…³ç³»å›¾)
5. [ç´¢å¼•è®¾è®¡](#ç´¢å¼•è®¾è®¡)
6. [Phase 3åŠŸèƒ½è¯´æ˜Ž](#phase-3åŠŸèƒ½è¯´æ˜Ž)
7. [å˜æ›´åŽ†å²](#å˜æ›´åŽ†å²)

---

## æ¨¡å—æ¦‚è¿°

### åŠŸèƒ½å®šä½

**PKBï¼ˆPersonal Knowledge Baseï¼? ä¸ªäººçŸ¥è¯†åº“æ¨¡å?*æä¾›æ–‡çŒ®ç®¡ç†å’Œæ™ºèƒ½é—®ç­”èƒ½åŠ›ï¼Œæ ¸å¿ƒåŠŸèƒ½ï¼?

1. **çŸ¥è¯†åº“ç®¡ç?* - åˆ›å»ºå’Œç®¡ç†ä¸ªäººçŸ¥è¯†åº“
2. **æ–‡æ¡£ä¸Šä¼ ** - æ”¯æŒPDF/Word/TXTç­‰æ ¼å¼æ–‡æ¡?
3. **æ™ºèƒ½é—®ç­”** - åŸºäºŽçŸ¥è¯†åº“çš„RAGï¼ˆæ£€ç´¢å¢žå¼ºç”Ÿæˆï¼‰å¯¹è¯
4. **æ‰¹å¤„ç†ä»»åŠ?* - æ‰¹é‡å¤„ç†æ–‡çŒ®æå–ï¼ˆPhase 3ï¼?
5. **ä»»åŠ¡æ¨¡æ¿** - é¢„å®šä¹‰çš„æ‰¹å¤„ç†ä»»åŠ¡æ¨¡æ¿ï¼ˆPhase 3ï¼?

### æ ¸å¿ƒä¸šåŠ¡åœºæ™¯

- ç”¨æˆ·åˆ›å»ºçŸ¥è¯†åº“ï¼ˆå¦?CLLç›¸å…³çŸ¥è¯†åº?ï¼?
- ä¸Šä¼ PDFæ–‡çŒ®åˆ°çŸ¥è¯†åº“
- è‡ªåŠ¨æå–æ–‡æœ¬å¹¶å‘é‡åŒ–
- åŸºäºŽçŸ¥è¯†åº“è¿›è¡Œæ™ºèƒ½é—®ç­?
- æ‰¹é‡æå–æ–‡çŒ®ä¸­çš„ç»“æž„åŒ–ä¿¡æ?

### ä¸ŽDifyå¹³å°é›†æˆ

PKBæ¨¡å—æ·±åº¦é›†æˆDifyå¹³å°ï¼?
- æ¯ä¸ªçŸ¥è¯†åº“å¯¹åº”ä¸€ä¸ªDify Dataset
- æ¯ä¸ªæ–‡æ¡£å¯¹åº”ä¸€ä¸ªDify Document
- ä½¿ç”¨Difyçš„å‘é‡æ£€ç´¢å’ŒRAGèƒ½åŠ›

---

## Schemaä¿¡æ¯

### Schemaåç§°
```sql
pkb_schema
```

### åˆ›å»ºè¯­å¥
```sql
CREATE SCHEMA IF NOT EXISTS pkb_schema;
GRANT ALL ON SCHEMA pkb_schema TO aiclinical_admin;
```

### æ•°æ®è¿ç§»
- **è¿ç§»æ—¶é—´ï¼?* 2025-11-12
- **æºSchemaï¼?* public
- **è¿ç§»è„šæœ¬ï¼?* `docs/09-æž¶æž„å®žæ–½/migration-scripts/004-migrate-pkb.sql`
- **æ•°æ®å®Œæ•´æ€§ï¼š** âœ?100%è¿ç§»æˆåŠŸ

---

## æ•°æ®åº“è¡¨è®¾è®¡

### è¡¨åˆ—è¡?

| è¡¨å | ç”¨é€?| è¡Œæ•°ï¼ˆä¼°è®¡ï¼‰ | çŠ¶æ€?|
|------|------|------------|------|
| `knowledge_bases` | çŸ¥è¯†åº?| 5-50/ç”¨æˆ· | âœ?å·²éƒ¨ç½?|
| `documents` | æ–‡æ¡£ | 10-1000/çŸ¥è¯†åº?| âœ?å·²éƒ¨ç½?|
| `batch_tasks` | æ‰¹å¤„ç†ä»»åŠ?| 1-100/çŸ¥è¯†åº?| âœ?Phase 3 |
| `batch_results` | æ‰¹å¤„ç†ç»“æž?| Næ?ä»»åŠ¡ | âœ?Phase 3 |
| `task_templates` | ä»»åŠ¡æ¨¡æ¿ | 10-50/ç”¨æˆ· | âœ?Phase 3ï¼ˆé¢„ç•™ï¼‰ |

**æ€»è®¡ï¼?* 5ä¸ªè¡¨ï¼?ä¸ªæ ¸å¿ƒè¡¨ + 3ä¸ªPhase 3è¡¨ï¼‰

---

### 1. knowledge_bases - çŸ¥è¯†åº“è¡¨

**ç”¨é€”ï¼š** å­˜å‚¨ç”¨æˆ·åˆ›å»ºçš„ä¸ªäººçŸ¥è¯†åº“

#### è¡¨ç»“æž?

| å­—æ®µå?| æ•°æ®ç±»åž‹ | çº¦æŸ | è¯´æ˜Ž |
|--------|---------|------|------|
| id | TEXT | PRIMARY KEY | çŸ¥è¯†åº“å”¯ä¸€æ ‡è¯†ï¼ˆUUIDï¼?|
| user_id | TEXT | NOT NULL, FK | æ‰€å±žç”¨æˆ·ID |
| name | TEXT | NOT NULL | çŸ¥è¯†åº“åç§?|
| description | TEXT | NULL | çŸ¥è¯†åº“æè¿?|
| dify_dataset_id | TEXT | NOT NULL, UNIQUE | Difyå¹³å°çš„Dataset ID |
| file_count | INTEGER | NOT NULL, DEFAULT 0 | æ–‡ä»¶æ•°é‡ |
| total_size_bytes | BIGINT | NOT NULL, DEFAULT 0 | æ€»æ–‡ä»¶å¤§å°ï¼ˆå­—èŠ‚ï¼?|
| created_at | TIMESTAMPTZ | NOT NULL, DEFAULT now() | åˆ›å»ºæ—¶é—´ |
| updated_at | TIMESTAMPTZ | NOT NULL | æ›´æ–°æ—¶é—´ |

#### Prisma Model

```prisma
model KnowledgeBase {
  id             String   @id @default(uuid())
  userId         String   @map("user_id")
  name           String
  description    String?
  difyDatasetId  String   @map("dify_dataset_id")
  fileCount      Int      @default(0) @map("file_count")
  totalSizeBytes BigInt   @default(0) @map("total_size_bytes")
  
  createdAt      DateTime @default(now()) @map("created_at")
  updatedAt      DateTime @updatedAt @map("updated_at")
  
  user           User     @relation(fields: [userId], references: [id], onDelete: Cascade)
  documents      Document[]
  batchTasks     BatchTask[]
  
  @@index([userId])
  @@index([difyDatasetId])
  @@map("knowledge_bases")
  @@schema("pkb_schema")
}
```

#### ä¸šåŠ¡è§„åˆ™

1. **Difyç»‘å®š** - æ¯ä¸ªçŸ¥è¯†åº“å¯¹åº”å”¯ä¸€çš„Dify Dataset
2. **ç»Ÿè®¡å­—æ®µ** - `file_count`å’Œ`total_size_bytes`éœ€å®žæ—¶æ›´æ–°
3. **ç”¨æˆ·éš”ç¦»** - é€šè¿‡`user_id`å®žçŽ°æ•°æ®éš”ç¦»
4. **çº§è”åˆ é™¤** - åˆ é™¤çŸ¥è¯†åº“æ—¶ï¼Œæ–‡æ¡£å’Œä»»åŠ¡ä¹Ÿè¢«åˆ é™¤

---

### 2. documents - æ–‡æ¡£è¡?

**ç”¨é€”ï¼š** å­˜å‚¨çŸ¥è¯†åº“ä¸­çš„æ–‡æ¡£ä¿¡æ?

#### è¡¨ç»“æž?

| å­—æ®µå?| æ•°æ®ç±»åž‹ | çº¦æŸ | è¯´æ˜Ž |
|--------|---------|------|------|
| id | TEXT | PRIMARY KEY | æ–‡æ¡£å”¯ä¸€æ ‡è¯†ï¼ˆUUIDï¼?|
| kb_id | TEXT | NOT NULL, FK | æ‰€å±žçŸ¥è¯†åº“ID |
| user_id | TEXT | NOT NULL, FK | æ‰€å±žç”¨æˆ·ID |
| filename | TEXT | NOT NULL | æ–‡ä»¶å?|
| file_type | TEXT | NOT NULL | æ–‡ä»¶ç±»åž‹ï¼ˆpdf/doc/txtç­‰ï¼‰ |
| file_size_bytes | BIGINT | NOT NULL | æ–‡ä»¶å¤§å°ï¼ˆå­—èŠ‚ï¼‰ |
| file_url | TEXT | NOT NULL | æ–‡ä»¶å­˜å‚¨URL |
| dify_document_id | TEXT | NOT NULL | Difyå¹³å°çš„Document ID |
| status | TEXT | NOT NULL, DEFAULT 'uploading' | çŠ¶æ€ï¼ˆuploading/processing/completed/failedï¼?|
| progress | INTEGER | NOT NULL, DEFAULT 0 | å¤„ç†è¿›åº¦ï¼?-100ï¼?|
| error_message | TEXT | NULL | é”™è¯¯ä¿¡æ¯ |
| segments_count | INTEGER | NULL | åˆ‡ç‰‡æ•°é‡ |
| tokens_count | INTEGER | NULL | Tokenæ•°é‡ |
| extraction_method | TEXT | NULL | æå–æ–¹æ³•ï¼ˆauto/ocr/parseï¼?|
| **Phase 2å­—æ®µ** | | | **å…¨æ–‡é˜…è¯»åŠŸèƒ½** |
| full_text | TEXT | NULL | å®Œæ•´æ–‡æœ¬å†…å®¹ |
| full_text_length | INTEGER | NULL | æ–‡æœ¬é•¿åº¦ |
| metadata | JSONB | NULL | å…ƒæ•°æ®ï¼ˆä½œè€…ã€æ ‡é¢˜ã€æ‘˜è¦ç­‰ï¼?|
| created_at | TIMESTAMPTZ | NOT NULL, DEFAULT now() | åˆ›å»ºæ—¶é—´ |
| updated_at | TIMESTAMPTZ | NOT NULL | æ›´æ–°æ—¶é—´ |

#### Prisma Model

```prisma
model Document {
  id              String   @id @default(uuid())
  kbId            String   @map("kb_id")
  userId          String   @map("user_id")
  filename        String
  fileType        String   @map("file_type")
  fileSizeBytes   BigInt   @map("file_size_bytes")
  fileUrl         String   @map("file_url")
  difyDocumentId  String   @map("dify_document_id")
  status          String   @default("uploading")
  progress        Int      @default(0)
  errorMessage    String?  @map("error_message")
  segmentsCount   Int?     @map("segments_count")
  tokensCount     Int?     @map("tokens_count")
  extractionMethod String? @map("extraction_method")
  
  // Phase 2: å…¨æ–‡é˜…è¯»åŠŸèƒ½
  fullText        String?  @map("full_text") @db.Text
  fullTextLength  Int?     @map("full_text_length")
  metadata        Json?
  
  createdAt       DateTime @default(now()) @map("created_at")
  updatedAt       DateTime @updatedAt @map("updated_at")
  
  knowledgeBase   KnowledgeBase @relation(fields: [kbId], references: [id], onDelete: Cascade)
  user            User     @relation(fields: [userId], references: [id], onDelete: Cascade)
  batchResults    BatchResult[]
  
  @@index([kbId])
  @@index([userId])
  @@index([status])
  @@index([difyDocumentId])
  @@index([extractionMethod])
  @@map("documents")
  @@schema("pkb_schema")
}
```

#### ä¸šåŠ¡è§„åˆ™

1. **çŠ¶æ€æœº** - `status`å­—æ®µç®¡ç†æ–‡æ¡£å¤„ç†æµç¨‹
   - `uploading` â†?`processing` â†?`completed`
   - å¤±è´¥æ—¶è½¬ä¸º`failed`
2. **DifyåŒæ­¥** - æ¯ä¸ªæ–‡æ¡£å¯¹åº”Difyä¸­çš„ä¸€ä¸ªDocument
3. **æå–æ–¹æ³•** - æ”¯æŒè‡ªåŠ¨è¯†åˆ«ã€OCRã€è§£æžä¸‰ç§æ–¹å¼?
4. **Phase 2æ‰©å±•** - `full_text`å­—æ®µç”¨äºŽå…¨æ–‡é˜…è¯»å’Œæ·±åº¦åˆ†æž?

---

### 3. batch_tasks - æ‰¹å¤„ç†ä»»åŠ¡è¡¨ (Phase 3)

**ç”¨é€”ï¼š** æ‰¹é‡å¤„ç†æ–‡çŒ®ï¼Œæå–ç»“æž„åŒ–ä¿¡æ¯

#### è¡¨ç»“æž?

| å­—æ®µå?| æ•°æ®ç±»åž‹ | çº¦æŸ | è¯´æ˜Ž |
|--------|---------|------|------|
| id | TEXT | PRIMARY KEY | ä»»åŠ¡å”¯ä¸€æ ‡è¯†ï¼ˆUUIDï¼?|
| user_id | TEXT | NOT NULL, FK | æ‰€å±žç”¨æˆ·ID |
| kb_id | TEXT | NOT NULL, FK | æ‰€å±žçŸ¥è¯†åº“ID |
| task_name | TEXT | NOT NULL | ä»»åŠ¡åç§° |
| task_type | TEXT | NOT NULL | ä»»åŠ¡ç±»åž‹ï¼ˆextract_info/summarizeç­‰ï¼‰ |
| prompt_template | TEXT | NOT NULL | Promptæ¨¡æ¿ |
| model_name | TEXT | NOT NULL, DEFAULT 'gpt-4' | ä½¿ç”¨çš„LLMæ¨¡åž‹ |
| status | TEXT | NOT NULL, DEFAULT 'pending' | çŠ¶æ€ï¼ˆpending/running/completed/failedï¼?|
| total_documents | INTEGER | NOT NULL, DEFAULT 0 | æ€»æ–‡æ¡£æ•° |
| processed_count | INTEGER | NOT NULL, DEFAULT 0 | å·²å¤„ç†æ•° |
| success_count | INTEGER | NOT NULL, DEFAULT 0 | æˆåŠŸæ•?|
| failed_count | INTEGER | NOT NULL, DEFAULT 0 | å¤±è´¥æ•?|
| error_message | TEXT | NULL | é”™è¯¯ä¿¡æ¯ |
| created_at | TIMESTAMPTZ | NOT NULL, DEFAULT now() | åˆ›å»ºæ—¶é—´ |
| updated_at | TIMESTAMPTZ | NOT NULL | æ›´æ–°æ—¶é—´ |

#### Prisma Model

```prisma
model BatchTask {
  id              String   @id @default(uuid())
  userId          String   @map("user_id")
  kbId            String   @map("kb_id")
  taskName        String   @map("task_name")
  taskType        String   @map("task_type")
  promptTemplate  String   @map("prompt_template") @db.Text
  modelName       String   @default("gpt-4") @map("model_name")
  status          String   @default("pending")
  totalDocuments  Int      @default(0) @map("total_documents")
  processedCount  Int      @default(0) @map("processed_count")
  successCount    Int      @default(0) @map("success_count")
  failedCount     Int      @default(0) @map("failed_count")
  errorMessage    String?  @map("error_message") @db.Text
  
  user            User     @relation(fields: [userId], references: [id], onDelete: Cascade)
  knowledgeBase   KnowledgeBase @relation(fields: [kbId], references: [id], onDelete: Cascade)
  results         BatchResult[]
  
  createdAt       DateTime @default(now()) @map("created_at")
  updatedAt       DateTime @updatedAt @map("updated_at")
  
  @@index([userId])
  @@index([kbId])
  @@index([status])
  @@index([createdAt])
  @@map("batch_tasks")
  @@schema("pkb_schema")
}
```

#### ä¸šåŠ¡è§„åˆ™

1. **ä»»åŠ¡ç±»åž‹** - æ”¯æŒå¤šç§æ‰¹å¤„ç†ç±»åž?
   - `extract_info` - æå–ç»“æž„åŒ–ä¿¡æ?
   - `summarize` - æ‰¹é‡æ‘˜è¦
   - `classify` - æ–‡çŒ®åˆ†ç±»
2. **çŠ¶æ€æœº** - `status`ç®¡ç†ä»»åŠ¡æ‰§è¡ŒçŠ¶æ€?
3. **è¿›åº¦è·Ÿè¸ª** - å®žæ—¶æ›´æ–°è®¡æ•°å™¨å­—æ®?
4. **æ¨¡åž‹é€‰æ‹©** - æ”¯æŒå¤šç§LLMæ¨¡åž‹

---

### 4. batch_results - æ‰¹å¤„ç†ç»“æžœè¡¨ (Phase 3)

**ç”¨é€”ï¼š** å­˜å‚¨æ‰¹å¤„ç†ä»»åŠ¡çš„æ¯ç¯‡æ–‡çŒ®ç»“æžœ

#### è¡¨ç»“æž?

| å­—æ®µå?| æ•°æ®ç±»åž‹ | çº¦æŸ | è¯´æ˜Ž |
|--------|---------|------|------|
| id | TEXT | PRIMARY KEY | ç»“æžœå”¯ä¸€æ ‡è¯†ï¼ˆUUIDï¼?|
| task_id | TEXT | NOT NULL, FK | æ‰€å±žä»»åŠ¡ID |
| document_id | TEXT | NOT NULL, FK | æ‰€å±žæ–‡æ¡£ID |
| status | TEXT | NOT NULL, DEFAULT 'pending' | çŠ¶æ€ï¼ˆpending/processing/completed/failedï¼?|
| result_data | JSONB | NULL | æå–çš„ç»“æž„åŒ–æ•°æ® |
| raw_output | TEXT | NULL | LLMåŽŸå§‹è¾“å‡º |
| tokens_used | INTEGER | NULL | ä½¿ç”¨çš„Tokenæ•?|
| error_message | TEXT | NULL | é”™è¯¯ä¿¡æ¯ |
| created_at | TIMESTAMPTZ | NOT NULL, DEFAULT now() | åˆ›å»ºæ—¶é—´ |

#### Prisma Model

```prisma
model BatchResult {
  id              String   @id @default(uuid())
  taskId          String   @map("task_id")
  documentId      String   @map("document_id")
  status          String   @default("pending")
  resultData      Json?    @map("result_data")
  rawOutput       String?  @map("raw_output") @db.Text
  tokensUsed      Int?     @map("tokens_used")
  errorMessage    String?  @map("error_message") @db.Text
  
  task            BatchTask @relation(fields: [taskId], references: [id], onDelete: Cascade)
  document        Document @relation(fields: [documentId], references: [id], onDelete: Cascade)
  
  createdAt       DateTime @default(now()) @map("created_at")
  
  @@index([taskId])
  @@index([documentId])
  @@index([status])
  @@map("batch_results")
  @@schema("pkb_schema")
}
```

#### ä¸šåŠ¡è§„åˆ™

1. **ç»“æžœå­˜å‚¨** - `result_data`å­˜å‚¨JSONæ ¼å¼çš„ç»“æž„åŒ–æ•°æ®
2. **åŽŸå§‹è¾“å‡º** - `raw_output`ä¿ç•™LLMåŽŸå§‹è¾“å‡ºï¼Œä¾¿äºŽè°ƒè¯?
3. **Tokenç»Ÿè®¡** - è®°å½•æ¯ç¯‡æ–‡çŒ®çš„Tokenæ¶ˆè€?

---

### 5. task_templates - ä»»åŠ¡æ¨¡æ¿è¡?(Phase 3, æš‚ä¸å®žçŽ°)

**ç”¨é€”ï¼š** å­˜å‚¨é¢„å®šä¹‰çš„æ‰¹å¤„ç†ä»»åŠ¡æ¨¡æ?

#### è¡¨ç»“æž?

| å­—æ®µå?| æ•°æ®ç±»åž‹ | çº¦æŸ | è¯´æ˜Ž |
|--------|---------|------|------|
| id | TEXT | PRIMARY KEY | æ¨¡æ¿å”¯ä¸€æ ‡è¯†ï¼ˆUUIDï¼?|
| user_id | TEXT | NOT NULL, FK | æ‰€å±žç”¨æˆ·ID |
| template_name | TEXT | NOT NULL | æ¨¡æ¿åç§° |
| task_type | TEXT | NOT NULL | ä»»åŠ¡ç±»åž‹ |
| prompt_template | TEXT | NOT NULL | Promptæ¨¡æ¿ |
| output_fields | JSONB | NOT NULL, DEFAULT '{}' | è¾“å‡ºå­—æ®µå®šä¹‰ |
| model_name | TEXT | NOT NULL, DEFAULT 'gpt-4' | é»˜è®¤æ¨¡åž‹ |
| created_at | TIMESTAMPTZ | NOT NULL, DEFAULT now() | åˆ›å»ºæ—¶é—´ |
| updated_at | TIMESTAMPTZ | NOT NULL | æ›´æ–°æ—¶é—´ |

#### Prisma Model

```prisma
model TaskTemplate {
  id              String   @id @default(uuid())
  userId          String   @map("user_id")
  templateName    String   @map("template_name")
  taskType        String   @map("task_type")
  promptTemplate  String   @map("prompt_template") @db.Text
  outputFields    Json     @default("{}") @map("output_fields")
  modelName       String   @default("gpt-4") @map("model_name")
  
  user            User @relation(fields: [userId], references: [id], onDelete: Cascade)
  
  createdAt       DateTime @default(now()) @map("created_at")
  updatedAt       DateTime @updatedAt @map("updated_at")
  
  @@index([userId])
  @@map("task_templates")
  @@schema("pkb_schema")
}
```

#### ä¸šåŠ¡è§„åˆ™

1. **æ¨¡æ¿å¤ç”¨** - ç”¨æˆ·å¯ä¿å­˜å¸¸ç”¨çš„ä»»åŠ¡é…ç½®
2. **å­—æ®µå®šä¹‰** - `output_fields`å®šä¹‰æœŸæœ›çš„è¾“å‡ºç»“æž?
3. **æš‚ä¸å®žçŽ°** - Phase 3é¢„ç•™ï¼ŒåŽç»­å¼€å?

---

## è¡¨å…³ç³»å›¾

```mermaid
erDiagram
    PLATFORM_USERS ||--o{ KNOWLEDGE_BASES : "owns"
    PLATFORM_USERS ||--o{ DOCUMENTS : "uploads"
    PLATFORM_USERS ||--o{ BATCH_TASKS : "creates"
    PLATFORM_USERS ||--o{ TASK_TEMPLATES : "defines"
    
    KNOWLEDGE_BASES ||--o{ DOCUMENTS : "contains"
    KNOWLEDGE_BASES ||--o{ BATCH_TASKS : "processes"
    
    BATCH_TASKS ||--o{ BATCH_RESULTS : "generates"
    DOCUMENTS ||--o{ BATCH_RESULTS : "analyzed_by"

    PLATFORM_USERS {
        text id PK
        text email
        text password
    }

    KNOWLEDGE_BASES {
        text id PK
        text user_id FK
        text name
        text dify_dataset_id
        int file_count
        bigint total_size_bytes
    }

    DOCUMENTS {
        text id PK
        text kb_id FK
        text user_id FK
        text filename
        text file_type
        text dify_document_id
        text status
        text full_text
        jsonb metadata
    }

    BATCH_TASKS {
        text id PK
        text user_id FK
        text kb_id FK
        text task_name
        text task_type
        text status
        int total_documents
        int processed_count
    }

    BATCH_RESULTS {
        text id PK
        text task_id FK
        text document_id FK
        text status
        jsonb result_data
        text raw_output
    }

    TASK_TEMPLATES {
        text id PK
        text user_id FK
        text template_name
        text task_type
        jsonb output_fields
    }
```

### è·¨Schemaå¼•ç”¨

**å¤–é”®å…³ç³»ï¼?*
- `knowledge_bases.user_id` â†?`platform_schema.users.id`
- `documents.user_id` â†?`platform_schema.users.id`
- `batch_tasks.user_id` â†?`platform_schema.users.id`
- `task_templates.user_id` â†?`platform_schema.users.id`

**è¯´æ˜Žï¼?* Prismaè‡ªåŠ¨å¤„ç†è·¨Schemaå¤–é”®ï¼Œåº”ç”¨ä»£ç æ— éœ€å…³å¿ƒSchemaå‰ç¼€

---

## ç´¢å¼•è®¾è®¡

### ä¸»é”®ç´¢å¼•
æ‰€æœ‰è¡¨çš„`id`å­—æ®µè‡ªåŠ¨åˆ›å»ºB-treeä¸»é”®ç´¢å¼•ã€?

### å¤–é”®ç´¢å¼•

| è¡¨å | ç´¢å¼•å­—æ®µ | ç”¨é€?|
|------|---------|------|
| knowledge_bases | user_id | æŸ¥è¯¢ç”¨æˆ·çš„æ‰€æœ‰çŸ¥è¯†åº“ |
| knowledge_bases | dify_dataset_id | Difyæ•°æ®åŒæ­¥ |
| documents | kb_id | æŸ¥è¯¢çŸ¥è¯†åº“çš„æ‰€æœ‰æ–‡æ¡?|
| documents | user_id | æŸ¥è¯¢ç”¨æˆ·çš„æ‰€æœ‰æ–‡æ¡?|
| documents | status | è¿‡æ»¤æ–‡æ¡£çŠ¶æ€?|
| documents | dify_document_id | Difyæ•°æ®åŒæ­¥ |
| documents | extraction_method | æŒ‰æå–æ–¹æ³•è¿‡æ»?|
| batch_tasks | user_id | æŸ¥è¯¢ç”¨æˆ·çš„ä»»åŠ?|
| batch_tasks | kb_id | æŸ¥è¯¢çŸ¥è¯†åº“çš„ä»»åŠ¡ |
| batch_tasks | status | è¿‡æ»¤ä»»åŠ¡çŠ¶æ€?|
| batch_results | task_id | æŸ¥è¯¢ä»»åŠ¡çš„æ‰€æœ‰ç»“æž?|
| batch_results | document_id | æŸ¥è¯¢æ–‡æ¡£çš„å¤„ç†ç»“æž?|
| batch_results | status | è¿‡æ»¤ç»“æžœçŠ¶æ€?|
| task_templates | user_id | æŸ¥è¯¢ç”¨æˆ·çš„æ¨¡æ?|

### æ—¶é—´ç´¢å¼•

| è¡¨å | ç´¢å¼•å­—æ®µ | ç”¨é€?|
|------|---------|------|
| batch_tasks | created_at | æŒ‰æ—¶é—´æŽ’åºä»»åŠ?|

---

## Phase 3åŠŸèƒ½è¯´æ˜Ž

### æ‰¹å¤„ç†å·¥ä½œæµç¨?

```mermaid
sequenceDiagram
    participant User
    participant API
    participant BatchTask
    participant Document
    participant LLM
    participant BatchResult

    User->>API: åˆ›å»ºæ‰¹å¤„ç†ä»»åŠ?
    API->>BatchTask: åˆ›å»ºä»»åŠ¡è®°å½•
    API->>Document: æŸ¥è¯¢çŸ¥è¯†åº“æ–‡æ¡£åˆ—è¡?
    
    loop æ¯ç¯‡æ–‡æ¡£
        BatchTask->>Document: è¯»å–æ–‡æ¡£å…¨æ–‡
        BatchTask->>LLM: è°ƒç”¨LLMæå–ä¿¡æ¯
        LLM-->>BatchTask: è¿”å›žç»“æž„åŒ–æ•°æ?
        BatchTask->>BatchResult: ä¿å­˜ç»“æžœ
        BatchTask->>BatchTask: æ›´æ–°è¿›åº¦
    end
    
    BatchTask->>API: ä»»åŠ¡å®Œæˆ
    API-->>User: è¿”å›žç»“æžœæ±‡æ€?
```

### æ‰¹å¤„ç†ä»»åŠ¡ç±»åž‹ç¤ºä¾?

1. **ä¿¡æ¯æå–** (`extract_info`)
   - æå–ç ”ç©¶æ–¹æ³•ã€æ ·æœ¬é‡ã€På€¼ç­‰
   - è¾“å‡ºJSONæ ¼å¼çš„ç»“æž„åŒ–æ•°æ®

2. **æ–‡çŒ®æ‘˜è¦** (`summarize`)
   - æ‰¹é‡ç”Ÿæˆæ–‡çŒ®æ‘˜è¦
   - ç»Ÿä¸€æ ¼å¼å’Œé•¿åº?

3. **æ–‡çŒ®åˆ†ç±»** (`classify`)
   - æ ¹æ®ç ”ç©¶ç±»åž‹åˆ†ç±»
   - æ ‡ç­¾åŒ–ç®¡ç?

---

## å˜æ›´åŽ†å²

### v1.0 - 2025-11-12 - åˆå§‹ç‰ˆæœ¬ âœ?

**å˜æ›´å†…å®¹ï¼?*
1. ä»Ž`public` schemaè¿ç§»åˆ°`pkb_schema`
2. 5ä¸ªè¡¨å…¨éƒ¨è¿ç§»ï¼?
   - knowledge_bases
   - documents
   - batch_tasks
   - batch_results
   - task_templates
3. åœ¨Prismaä¸­æ·»åŠ `@@schema("pkb_schema")`æ ‡ç­¾
4. æ‰€æœ‰æ•°æ?00%å®Œæ•´è¿ç§»

**è¿ç§»è„šæœ¬ï¼?* `docs/09-æž¶æž„å®žæ–½/migration-scripts/004-migrate-pkb.sql`

**éªŒè¯çŠ¶æ€ï¼š** âœ?å·²éªŒè¯ï¼ŒåŠŸèƒ½æ­£å¸¸

**ç‰¹æ®Šå¤„ç†ï¼?*
- `batch_results.rawOutput` â†?`raw_output`ï¼ˆåˆ—åæ˜ å°„ä¿®æ­£ï¼‰
- `task_templates.outputFields` â†?`output_fields`ï¼ˆåˆ—åæ˜ å°„ä¿®æ­£ï¼‰

---

## ðŸ“š ç›¸å…³æ–‡æ¡£

- [Schemaéš”ç¦»æž¶æž„è®¾è®¡](../../../09-æž¶æž„å®žæ–½/01-Schemaéš”ç¦»æž¶æž„è®¾è®¡ï¼?0ä¸ªï¼‰.md)
- [Schemaè¿ç§»å®ŒæˆæŠ¥å‘Š](../../../09-æž¶æž„å®žæ–½/Schemaè¿ç§»å®ŒæˆæŠ¥å‘Š.md)
- [Prismaé…ç½®å®ŒæˆæŠ¥å‘Š](../../../09-æž¶æž„å®žæ–½/Prismaé…ç½®å®ŒæˆæŠ¥å‘Š.md)
- [å¿«é€ŸåŠŸèƒ½æµ‹è¯•æŠ¥å‘Š](../../../09-æž¶æž„å®žæ–½/å¿«é€ŸåŠŸèƒ½æµ‹è¯•æŠ¥å‘?md)
- [AIAæ•°æ®åº“è®¾è®¡æ–‡æ¡£](../../AIA-AIæ™ºèƒ½é—®ç­”/02-æŠ€æœ¯è®¾è®?01-æ•°æ®åº“è®¾è®?md)

---

**æ–‡æ¡£ç»´æŠ¤è€…ï¼š** AIåŠ©æ‰‹  
**æœ€åŽæ›´æ–°ï¼š** 2025-11-12  
**æ–‡æ¡£çŠ¶æ€ï¼š** âœ?å·²å®Œæˆå¹¶éªŒè¯