feat(admin): Add user management and upgrade to module permission system

Features - User Management (Phase 4.1): - Database: Add user_modules table for fine-grained module permissions - Database: Add 4 user permissions (view/create/edit/delete) to role_permissions - Backend: UserService (780 lines) - CRUD with tenant isolation - Backend: UserController + UserRoutes (648 lines) - 13 API endpoints - Backend: Batch import users from Excel - Frontend: UserListPage (412 lines) - list/filter/search/pagination - Frontend: UserFormPage (341 lines) - create/edit with module config - Frontend: UserDetailPage (393 lines) - details/tenant/module management - Frontend: 3 modal components (592 lines) - import/assign/configure - API: GET/POST/PUT/DELETE /api/admin/users/* endpoints Architecture Upgrade - Module Permission System: - Backend: Add getUserModules() method in auth.service - Backend: Login API returns modules array in user object - Frontend: AuthContext adds hasModule() method - Frontend: Navigation filters modules based on user.modules - Frontend: RouteGuard checks requiredModule instead of requiredVersion - Frontend: Remove deprecated version-based permission system - UX: Only show accessible modules in navigation (clean UI) - UX: Smart redirect after login (avoid 403 for regular users) Fixes: - Fix UTF-8 encoding corruption in ~100 docs files - Fix pageSize type conversion in userService (String to Number) - Fix authUser undefined error in TopNavigation - Fix login redirect logic with role-based access check - Update Git commit guidelines v1.2 with UTF-8 safety rules Database Changes: - CREATE TABLE user_modules (user_id, tenant_id, module_code, is_enabled) - ADD UNIQUE CONSTRAINT (user_id, tenant_id, module_code) - INSERT 4 permissions + role assignments - UPDATE PUBLIC tenant with 8 module subscriptions Technical: - Backend: 5 new files (~2400 lines) - Frontend: 10 new files (~2500 lines) - Docs: 1 development record + 2 status updates + 1 guideline update - Total: ~4900 lines of code Status: User management 100% complete, module permission system operational
2026-01-16 13:42:10 +08:00
parent 98d862dbd4
commit 66255368b7
560 changed files with 70424 additions and 52353 deletions
--- a/docs/08-项目管理/PKB功能审查报告-阶段0.md
+++ b/docs/08-项目管理/PKB功能审查报告-阶段0.md
@@ -1,9 +1,9 @@
-# PKB涓<EFBFBD>汉鐭ヨ瘑搴撳姛鑳藉<EFBFBD>鏌ユ姤鍛?- 闃舵<E99783>0
+# PKB个人知识库功能审查报告 - 阶段0

-> **瀹℃煡鏃ユ湡锛?* 2026-01-06  
-> **瀹℃煡浜哄憳锛?* AI鍔╂墜  
-> **瀹℃煡鐩<EFBFBD>爣锛?* 娣卞叆鐞嗚ВPKB鐜版湁鍔熻兘锛屼负瀹夊叏杩佺Щ鍋氬噯澶? 
-> **鐘舵€侊細** 鉁?杩涜<E69DA9>涓?
+> **审查日期：** 2026-01-06  
+> **审查人员：** AI助手  
+> **审查目标：** 深入理解PKB现有功能，为安全迁移做准备  
+> **状态：** ✅ 进行中

 ---

@@ -14,35 +14,35 @@
 **🎯 PKB系统实际上是两个紧密关联的功能模块：**

 ```
-Part 1: PKB鐭ヨ瘑搴撶<EFBFBD>鐞嗘ā鍧?
+Part 1: PKB知识库管理模块
 ├─ 位置：backend/src/legacy/controllers/knowledgeBaseController.ts
-鈹溾攢 鍔熻兘锛氬垱寤恒€佺紪杈戙€佸垹闄ょ煡璇嗗簱锛涗笂浼犮€佺<E282AC>鐞嗘枃妗?
-鈹斺攢 鏁版嵁搴擄細pkb_schema锛堢嫭绔婼chema锛屾棤闇€杩佺Щ锛?
+├─ 功能：创建、编辑、删除知识库；上传、管理文档
+└─ 数据库：pkb_schema（独立Schema，无需迁移）

 Part 2: AIA智能问答模块中的PKB应用
 ├─ 位置：backend/src/legacy/controllers/chatController.ts
-鈹溾攢 鍔熻兘锛氫娇鐢ㄧ煡璇嗗簱杩涜<E69DA9>鏅鸿兘闂<E58598>瓟锛?绉嶅伐浣滄ā寮忥級
-鈹斺攢 宸ヤ綔妯″紡锛?
-    鈹溾攢 鍏ㄦ枃闃呰<E99783>妯″紡锛?5-50绡囨枃鐚<E69E83>患鍚堝垎鏋愶級
-    鈹溾攢 閫愮瘒绮捐<E7BBAE>妯″紡锛?-5绡囨枃鐚<E69E83>繁搴﹀垎鏋愶級
+├─ 功能：使用知识库进行智能问答（3种工作模式）
+└─ 工作模式：
+    ├─ 全文阅读模式（35-50篇文献综合分析）
+    ├─ 逐篇精读模式（1-5篇文献深度分析）
    └─ 批处理模式（3-50篇文献批量提取）
 ```

 ---

-## 馃搳 Part 1: PKB鐭ヨ瘑搴撶<EFBFBD>鐞嗘ā鍧?
+## 📊 Part 1: PKB知识库管理模块

 ### 1.1 文件结构

 ```
 backend/src/legacy/
 ├─ controllers/
-鈹? 鈹溾攢 knowledgeBaseController.ts    # API鎺у埗鍣<EFBFBD>紙342琛岋級
-鈹? 鈹斺攢 documentController.ts         # 鏂囨。涓婁紶鎺у埗鍣?
+│  ├─ knowledgeBaseController.ts    # API控制器（342行）
+│  └─ documentController.ts         # 文档上传控制器
 ├─ services/
-鈹? 鈹溾攢 knowledgeBaseService.ts       # 涓氬姟閫昏緫锛?65琛岋級
-鈹? 鈹溾攢 documentService.ts            # 鏂囨。澶勭悊鏈嶅姟
-鈹? 鈹斺攢 tokenService.ts               # Token璁＄畻鍜屾枃妗ｉ€夋嫨
+│  ├─ knowledgeBaseService.ts       # 业务逻辑（365行）
+│  ├─ documentService.ts            # 文档处理服务
+│  └─ tokenService.ts               # Token计算和文档选择
 └─ routes/
   └─ knowledgeBases.ts             # 路由定义
 ```
@@ -51,48 +51,48 @@ backend/src/legacy/

 #### 知识库管理API
 ```typescript
-// 1. 鍒涘缓鐭ヨ瘑搴?
+// 1. 创建知识库
 POST /api/v1/knowledge/create
 Body: { name: string, description?: string }
-閫昏緫锛?
-  鈹溾攢 妫€鏌ョ敤鎴烽厤棰濓紙kbQuota vs kbUsed锛?
+逻辑：
+  ├─ 检查用户配额（kbQuota vs kbUsed）
  ├─ 在Dify创建Dataset
  ├─ 在数据库创建记录
  └─ 更新用户配额计数

-// 2. 鑾峰彇鐭ヨ瘑搴撳垪琛?
+// 2. 获取知识库列表
 GET /api/v1/knowledge/list
 返回：用户所有知识库 + 文档数量统计

-// 3. 鑾峰彇鐭ヨ瘑搴撹<EFBFBD>鎯?
+// 3. 获取知识库详情
 GET /api/v1/knowledge/:id
-杩斿洖锛氱煡璇嗗簱淇℃伅 + 鎵€鏈夋枃妗ｅ垪琛?
+返回：知识库信息 + 所有文档列表

-// 4. 鏇存柊鐭ヨ瘑搴?
+// 4. 更新知识库
 PUT /api/v1/knowledge/:id
 Body: { name?: string, description?: string }

-// 5. 鍒犻櫎鐭ヨ瘑搴?
+// 5. 删除知识库
 DELETE /api/v1/knowledge/:id
-閫昏緫锛?
+逻辑：
  ├─ 删除Dify Dataset
-  鈹溾攢 绾ц仈鍒犻櫎鏁版嵁搴撹<EFBFBD>褰曪紙documents鑷<EFBFBD>姩鍒犻櫎锛?
+  ├─ 级联删除数据库记录（documents自动删除）
  └─ 减少用户配额计数

-// 6. 妫€绱㈢煡璇嗗簱锛圧AG锛?
+// 6. 检索知识库（RAG）
 GET /api/v1/knowledge/:id/search?query=xxx&top_k=15
-閫昏緫锛?
+逻辑：
  ├─ 验证权限
  ├─ 调用Dify retrieveKnowledge API
  └─ 返回检索结果（默认15个片段）

-// 7. 鑾峰彇鐭ヨ瘑搴撶粺璁?
+// 7. 获取知识库统计
 GET /api/v1/knowledge/:id/stats
-杩斿洖锛氭枃妗ｆ暟銆佸畬鎴愭暟銆佸<EFBFBD>鐞嗕腑銆侀敊璇<EFBFBD>暟銆佹€籘oken鏁?
+返回：文档数、完成数、处理中、错误数、总Token数

 // 8. 获取文档选择（全文阅读模式）
 GET /api/v1/knowledge/:id/document-selection?max_files=7&max_tokens=750000
-杩斿洖锛氭櫤鑳介€夋嫨鐨勬枃妗ｅ垪琛<EFBFBD>紙鍩轰簬Token闄愬埗锛?
+返回：智能选择的文档列表（基于Token限制）
 ```

 #### 文档管理API
@@ -100,21 +100,21 @@ GET /api/v1/knowledge/:id/document-selection?max_files=7&max_tokens=750000
 // 9. 上传文档
 POST /api/v1/documents/upload
 Multipart: { file, kbId }
-閫昏緫锛?
+逻辑：
  ├─ 上传文件到OSS
-  鈹溾攢 鎻愬彇鏂囨湰锛圥DF/Word/TXT/Markdown锛?
+  ├─ 提取文本（PDF/Word/TXT/Markdown）
  ├─ 上传到Dify进行索引
-  鈹斺攢 鍒涘缓鏁版嵁搴撹<EFBFBD>褰曪紙鐘舵€侊細uploading鈫抪arsing鈫抜ndexing鈫抍ompleted锛?
+  └─ 创建数据库记录（状态：uploading→parsing→indexing→completed）

 // 10. 获取文档详情
 GET /api/v1/documents/:id

 // 11. 删除文档
 DELETE /api/v1/documents/:id
-閫昏緫锛?
+逻辑：
  ├─ 从Dify删除Document
  ├─ 从OSS删除文件
-  鈹斺攢 鍒犻櫎鏁版嵁搴撹<EFBFBD>褰?
+  └─ 删除数据库记录
 ```

 ### 1.3 数据库Schema
@@ -134,10 +134,10 @@ knowledge_bases
 ├─ createdAt (DateTime)
 └─ updatedAt (DateTime)

-- 鏂囨。琛?
+-- 文档表
 documents
 ├─ id (UUID, PK)
-鈹溾攢 kbId (String, FK 鈫?knowledge_bases.id)
+├─ kbId (String, FK → knowledge_bases.id)
 ├─ userId (String)
 ├─ filename (String)
 ├─ fileType (String) -- pdf/docx/txt/md
@@ -148,10 +148,10 @@ documents
 ├─ progress (Int, 0-100)
 ├─ errorMessage (String?)
 ├─ segmentsCount (Int?) -- Dify索引的片段数
-鈹溾攢 tokensCount (Int?) -- 鎬籘oken鏁?
-鈹溾攢 charCount (Int?) -- 瀛楃<EFBFBD>鏁?
+├─ tokensCount (Int?) -- 总Token数
+├─ charCount (Int?) -- 字符数
 ├─ language (String?)
-鈹溾攢 extractedText (String?) -- 鎻愬彇鐨勫叏鏂囷紙鐢ㄤ簬鍏ㄦ枃闃呰<EFBFBD>妯″紡锛?
+├─ extractedText (String?) -- 提取的全文（用于全文阅读模式）
 ├─ extractionMethod (String?) -- marker/pymupdf/docx
 ├─ extractionQuality (Float?)
 ├─ uploadedAt (DateTime)
@@ -161,7 +161,7 @@ documents
 batch_tasks
 ├─ id (UUID, PK)
 ├─ userId (String)
-鈹溾攢 kbId (String, FK 鈫?knowledge_bases.id)
+├─ kbId (String, FK → knowledge_bases.id)
 ├─ name (String)
 ├─ templateType (String)
 ├─ templateId (String?)
@@ -181,8 +181,8 @@ batch_tasks
 -- 批处理结果表
 batch_results
 ├─ id (UUID, PK)
-鈹溾攢 taskId (String, FK 鈫?batch_tasks.id)
-鈹溾攢 documentId (String, FK 鈫?documents.id)
+├─ taskId (String, FK → batch_tasks.id)
+├─ documentId (String, FK → documents.id)
 ├─ status (String) -- success/failed
 ├─ data (Json?) -- 提取的结构化数据
 ├─ rawOutput (String?) -- LLM原始输出
@@ -191,7 +191,7 @@ batch_results
 ├─ tokensUsed (Int?)
 └─ createdAt (DateTime)

-- 浠诲姟妯℃澘琛?
+-- 任务模板表
 task_templates
 ├─ id (UUID, PK)
 ├─ userId (String)
@@ -199,7 +199,7 @@ task_templates
 ├─ description (String?)
 ├─ prompt (String)
 ├─ isPublic (Boolean, default: false)
-鈹溾攢 outputFields (Json) -- 鏈熸湜鐨勮緭鍑哄瓧娈?
+├─ outputFields (Json) -- 期望的输出字段
 ├─ createdAt (DateTime)
 └─ updatedAt (DateTime)
 ```
@@ -233,16 +233,16 @@ idx_pkb_batch_results_status (status)

 #### 配额管理
 ```typescript
-// 鐢ㄦ埛琛<EFBFBD>紙鍦╬latform_schema.users锛変腑鐨勫瓧娈?
-kbQuota: Int @default(3)   // 鐭ヨ瘑搴撻厤棰?
-kbUsed: Int @default(0)    // 宸蹭娇鐢ㄦ暟閲?
+// 用户表（在platform_schema.users）中的字段
+kbQuota: Int @default(3)   // 知识库配额
+kbUsed: Int @default(0)    // 已使用数量

-// 鍒涘缓鐭ヨ瘑搴撴椂妫€鏌?
+// 创建知识库时检查
 if (user.kbUsed >= user.kbQuota) {
  throw new Error('配额已满');
 }

-// 鍒涘缓鎴愬姛鍚庡<EFBFBD>鍔犺<EFBFBD>鏁?
+// 创建成功后增加计数
 await prisma.user.update({
  data: { kbUsed: { increment: 1 } }
 });
@@ -255,14 +255,14 @@ await prisma.user.update({

 #### Dify集成
 ```typescript
-// 鍒涘缓鐭ヨ瘑搴?鈫?鍒涘缓Dify Dataset
+// 创建知识库 → 创建Dify Dataset
 const difyDataset = await difyClient.createDataset({
  name: `${userId}_${name}_${Date.now()}`,
  description,
  indexing_technique: 'high_quality',
 });

-// 妫€绱㈢煡璇嗗簱 鈫?璋冪敤Dify RAG
+// 检索知识库 → 调用Dify RAG
 const results = await difyClient.retrieveKnowledge(
  difyDatasetId,
  query,
@@ -275,13 +275,13 @@ const results = await difyClient.retrieveKnowledge(
 );
 ```

-#### 鏂囨。Token璁＄畻锛坱okenService.ts锛?
+#### 文档Token计算（tokenService.ts）
 ```typescript
 // Token计算规则
 const TOKEN_LIMITS = {
-  MAX_FILES: 7,           // 鏈€澶?绡囨枃鐚?
-  MAX_TOTAL_TOKENS: 750000, // 鎬籘oken闄愬埗锛圦wen-Long: 1M涓婁笅鏂?- 250K瀵硅瘽绌洪棿锛?
-  MAX_SINGLE_DOC_TOKENS: 200000, // 鍗曠瘒鏂囩尞鏈€澶<EFBFBD>oken鏁?
+  MAX_FILES: 7,           // 最多7篇文献
+  MAX_TOTAL_TOKENS: 750000, // 总Token限制（Qwen-Long: 1M上下文 - 250K对话空间）
+  MAX_SINGLE_DOC_TOKENS: 200000, // 单篇文献最大Token数
 };

 // 智能选择算法
@@ -290,7 +290,7 @@ function selectDocumentsForFullText(
  maxFiles,
  maxTokens
 ) {
-  // 鎸塗oken鏁板崌搴忔帓搴?
+  // 按Token数升序排序
  const sorted = documentTokens.sort((a, b) => a.tokens - b.tokens);
  
  // 贪心算法选择
@@ -323,29 +323,29 @@ backend/src/legacy/controllers/
 └─ chatController.ts    # 通用对话控制器（包含3种模式）

 frontend/src/
-鈹溾攢 pages/ChatPage.tsx   # 涓诲<EFBFBD>璇濋〉闈?
+├─ pages/ChatPage.tsx   # 主对话页面
 └─ components/
   ├─ FullTextMode.tsx    # 全文阅读模式组件
   ├─ DeepReadMode.tsx    # 逐篇精读模式组件
-   鈹斺攢 BatchMode.tsx       # 鎵瑰<EFBFBD>鐞嗘ā寮忕粍浠?
+   └─ BatchMode.tsx       # 批处理模式组件
 ```

 ### 2.2 三种工作模式详解

-#### 妯″紡1锛氬叏鏂囬槄璇绘ā寮忥紙Full Text Mode锛?
+#### 模式1：全文阅读模式（Full Text Mode）

-**鐢ㄩ€?*锛?5-50绡囨枃鐚<E69E83>殑缁煎悎鍒嗘瀽
+**用途**：35-50篇文献的综合分析

-**瀹炵幇鍘熺悊锛?*
+**实现原理：**
 ```typescript
-// 1. 鍓嶇<EFBFBD>锛氱敤鎴疯繘鍏ョ煡璇嗗簱妯″紡 鈫?閫夋嫨"鍏ㄦ枃闃呰<E99783>"
+// 1. 前端：用户进入知识库模式 → 选择"全文阅读"
 const modeState = {
  baseMode: 'knowledge_base',
  kbMode: 'full_text',
  selectedKbId: 'xxx',
 };

-// 2. 鍓嶇<EFBFBD>锛氭櫤鑳藉姞杞芥枃鐚?
+// 2. 前端：智能加载文献
 const selection = await knowledgeBaseApi.getDocumentSelection(kbId, {
  max_files: 7,
  max_tokens: 750000,
@@ -354,26 +354,26 @@ const selection = await knowledgeBaseApi.getDocumentSelection(kbId, {

 // 3. 前端：自动切换到Qwen-Long模型
 if (modeState.kbMode === 'full_text') {
-  setSelectedModel('qwen-long'); // 1M涓婁笅鏂?
-  showToast('宸茶嚜鍔ㄥ垏鎹㈠埌Qwen-Long妯″瀷锛堟敮鎸?M涓婁笅鏂囷級');
+  setSelectedModel('qwen-long'); // 1M上下文
+  showToast('已自动切换到Qwen-Long模型（支持1M上下文）');
 }

 // 4. 前端：发送消息时传递文档ID列表
 await chatApi.sendMessageStream({
  content: userQuestion,
  modelType: 'qwen-long',
-  fullTextDocumentIds: loadedDocs.map(d => d.id), // 鉁?鍏抽敭鍙傛暟
+  fullTextDocumentIds: loadedDocs.map(d => d.id), // ✅ 关键参数
  conversationId,
 });

-// 5. 鍚庣<EFBFBD>锛氬姞杞藉畬鏁村叏鏂?
+// 5. 后端：加载完整全文
 if (fullTextDocumentIds && fullTextDocumentIds.length > 0) {
  const documents = await prisma.document.findMany({
    where: { id: { in: fullTextDocumentIds } },
    select: { id, filename, extractedText, tokensCount },
  });
  
-  // 6. 缁勮<EFBFBD>鍏ㄦ枃涓婁笅鏂?
+  // 6. 组装全文上下文
  const fullTextParts = [];
  for (let i = 0; i < documents.length; i++) {
    const doc = documents[i];
@@ -381,14 +381,14 @@ if (fullTextDocumentIds && fullTextDocumentIds.length > 0) {
    
    // 格式：【文献N：文件名】\n全文内容
    fullTextParts.push(
-      `銆愭枃鐚?{docNumber}锛?{doc.filename}銆慭n\n${doc.extractedText}`
+      `【文献${docNumber}：${doc.filename}】\n\n${doc.extractedText}`
    );
    
    // 添加引用信息
    allCitations.push({
      id: docNumber,
      fileName: doc.filename,
-      score: 1.0, // 鍏ㄦ枃鐩稿叧搴?00%
+      score: 1.0, // 全文相关度100%
      content: doc.extractedText.substring(0, 200),
    });
  }
@@ -397,7 +397,7 @@ if (fullTextDocumentIds && fullTextDocumentIds.length > 0) {
 }

 // 7. 传递给LLM
-const systemPrompt = '浣犳槸涓撲笟鐨勫<EFBFBD>鏈<EFBFBD>枃鐚<EFBFBD>垎鏋愬姪鎵嬨€傛瘡绡囨枃鐚<EFBFBD>敤銆愭枃鐚甆锛氭枃浠跺悕銆戞爣璁般€傝<EFBFBD>璁ょ湡闃呰<EFBFBD>鎵€鏈夋枃鐚<EFBFBD>紝杩涜<EFBFBD>娣卞叆鐨勭患鍚堝垎鏋愩€傚湪鍥炵瓟鏃惰<EFBFBD>寮曠敤鍏蜂綋鏂囩尞锛屼娇鐢ㄣ€愭枃鐚甆銆戞牸寮忋€?;
+const systemPrompt = '你是专业的学术文献分析助手。每篇文献用【文献N：文件名】标记。请认真阅读所有文献，进行深入的综合分析。在回答时请引用具体文献，使用【文献N】格式。';

 const userContent = `${userQuestion}\n\n## 参考资料（文献全文）\n\n${knowledgeBaseContext}`;

@@ -414,28 +414,28 @@ const response = await LLMFactory.getAdapter('qwen-long').chatStream(messages, {
 });
 ```

-**鍏抽敭鐗圭偣锛?*
- 鉁?浼犻€掑畬鏁村叏鏂囷紙涓嶆槸RAG鐗囨<E99097>锛?
- 鉁?鏅鸿兘閫夋嫨鏂囩尞锛堝熀浜嶵oken闄愬埗锛?
- 鉁?鏂囩尞鏉ユ簮鏍囪<E98F8D>锛氥€愭枃鐚甆锛氭枃浠跺悕銆?
- 鉁?鑷<>姩鍒囨崲鍒癚wen-Long妯″瀷锛?M涓婁笅鏂囷級
- 鉁?100%鐩稿叧搴︼紙鍥犱负鏄<EFBFBD>叏鏂囷級
- 鉁?閫傚悎璺ㄦ枃鐚<E69E83>瘮杈冦€佽秼鍔垮垎鏋愩€佺爺绌舵柟娉曞綊绾?
+**关键特点：**
+- ✅ 传递完整全文（不是RAG片段）
+- ✅ 智能选择文献（基于Token限制）
+- ✅ 文献来源标记：【文献N：文件名】
+- ✅ 自动切换到Qwen-Long模型（1M上下文）
+- ✅ 100%相关度（因为是全文）
+- ✅ 适合跨文献比较、趋势分析、研究方法归纳

-**Token浣跨敤锛?*
+**Token使用：**
 ```
-涓婁笅鏂囷細~750K tokens锛?绡囨枃鐚<E69E83>叏鏂囷級
+上下文：~750K tokens（7篇文献全文）
 对话空间：~250K tokens
-杈撳嚭闀垮害锛?000 tokens锛堢患鍚堝垎鏋愰渶瑕佹洿闀垮洖绛旓級
+输出长度：6000 tokens（综合分析需要更长回答）
 ```

 ---

-#### 妯″紡2锛氶€愮瘒绮捐<EFBFBD>妯″紡锛圖eep Read Mode锛?
+#### 模式2：逐篇精读模式（Deep Read Mode）

-**鐢ㄩ€?*锛?-5绡囨枃鐚<E69E83>殑娣卞害鍒嗘瀽
+**用途**：1-5篇文献的深度分析

-**瀹炵幇鍘熺悊锛?*
+**实现原理：**
 ```typescript
 // 1. 前端：用户选择"逐篇精读"
 const modeState = {
@@ -450,12 +450,12 @@ const selectedDocs = [doc1, doc2, doc3]; // 用户手动选择
 // 3. 前端：切换到某个文档
 const currentDoc = selectedDocs[0];

-// 4. 鍓嶇<EFBFBD>锛氬彂閫佹秷鎭<EFBFBD>椂浼犻€掑綋鍓嶆枃妗<EFBFBD>D锛堢敤浜嶳AG杩囨护锛?
+// 4. 前端：发送消息时传递当前文档ID（用于RAG过滤）
 await chatApi.sendMessageStream({
  content: userQuestion,
  modelType: selectedModel,
  knowledgeBaseIds: [kbId], // 知识库ID
-  documentIds: [currentDoc.id], // 鉁?鍏抽敭锛氬彧妫€绱㈠綋鍓嶆枃妗?
+  documentIds: [currentDoc.id], // ✅ 关键：只检索当前文档
  conversationId: currentDocConversationId, // 每个文档独立对话
 });

@@ -469,40 +469,40 @@ if (documentIds && documentIds.length > 0) {
      retrieval_model: {
        search_method: 'semantic_search',
        top_k: 15,
-        document_ids: documentIds, // 鉁?Dify浼氬彧妫€绱㈣繖浜涙枃妗?
+        document_ids: documentIds, // ✅ Dify会只检索这些文档
      },
    }
  );
 }
 ```

-**鍏抽敭鐗圭偣锛?*
- 鉁?鍩轰簬RAG妫€绱<E282AC>紙涓嶆槸鍏ㄦ枃锛?
- 鉁?闄愬畾鍦ㄥ綋鍓嶆枃妗ｈ寖鍥?
- 鉁?姣忎釜鏂囨。鏈夌嫭绔嬬殑瀵硅瘽鍘嗗彶
- 鉁?鐢ㄦ埛鍙<E59F9B>互鍦ㄦ枃妗ｉ棿鍒囨崲
- 鉁?閫傚悎娣卞害鐞嗚В鍗曠瘒鏂囩尞
+**关键特点：**
+- ✅ 基于RAG检索（不是全文）
+- ✅ 限定在当前文档范围
+- ✅ 每个文档有独立的对话历史
+- ✅ 用户可以在文档间切换
+- ✅ 适合深度理解单篇文献

 ---

-#### 妯″紡3锛氭壒澶勭悊妯″紡锛圔atch Mode锛?
+#### 模式3：批处理模式（Batch Mode）

-**鐢ㄩ€?*锛?-50绡囨枃鐚<E69E83>殑鎵归噺淇℃伅鎻愬彇
+**用途**：3-50篇文献的批量信息提取

-**瀹炵幇鍘熺悊锛?*
+**实现原理：**
 ```typescript
-// 1. 鐢ㄦ埛鍒涘缓鎵瑰<EFBFBD>鐞嗕换鍔?
+// 1. 用户创建批处理任务
 POST /api/v1/batch-tasks/create
 Body: {
  kbId: 'xxx',
  name: '提取研究方法',
-  prompt: '璇蜂粠杩欑瘒鏂囩尞涓<EFBFBD>彁鍙栵細鐮旂┒璁捐<EFBFBD>銆佹牱鏈<EFBFBD>噺銆佺粺璁℃柟娉?,
+  prompt: '请从这篇文献中提取：研究设计、样本量、统计方法',
  templateType: 'custom' | 'preset',
  modelType: 'deepseek-v3',
-  concurrency: 3, // 骞跺彂鏁?
+  concurrency: 3, // 并发数
 }

-// 2. 鍚庣<EFBFBD>锛氬垱寤轰换鍔?
+// 2. 后端：创建任务
 const task = await prisma.batchTask.create({
  data: {
    userId,
@@ -519,7 +519,7 @@ const task = await prisma.batchTask.create({

 // 3. 后端：启动批处理Worker
 async function processBatchTask(taskId) {
-  // 3.1 鑾峰彇浠诲姟鍜屾枃妗ｅ垪琛?
+  // 3.1 获取任务和文档列表
  const task = await prisma.batchTask.findUnique({
    where: { id: taskId },
    include: { knowledgeBase: { include: { documents: true } } },
@@ -527,7 +527,7 @@ async function processBatchTask(taskId) {
  
  const documents = task.knowledgeBase.documents.filter(d => d.status === 'completed');
  
-  // 3.2 鏇存柊浠诲姟鐘舵€?
+  // 3.2 更新任务状态
  await prisma.batchTask.update({
    where: { id: taskId },
    data: { status: 'running', startedAt: new Date() },
@@ -547,7 +547,7 @@ async function processBatchTask(taskId) {
          { role: 'user', content: llmPrompt },
        ]);
        
-        // 3.3.2 瑙ｆ瀽LLM杈撳嚭锛堟湡鏈汮SON鏍煎紡锛?
+        // 3.3.2 解析LLM输出（期望JSON格式）
        const data = parseJSONResponse(response.content);
        
        // 3.3.3 保存结果
@@ -601,7 +601,7 @@ async function processBatchTask(taskId) {

 // 4. 前端：查看批处理结果
 GET /api/v1/batch-tasks/:id/results
-杩斿洖锛?
+返回：
 {
  task: { /* 任务信息 */ },
  results: [
@@ -611,40 +611,40 @@ GET /api/v1/batch-tasks/:id/results
      status: 'success',
      data: {
        研究设计: '随机对照试验',
-        鏍锋湰閲? '300浜?,
-        缁熻<EFBFBD>鏂规硶: 't妫€楠屻€佸崱鏂规<EFBFBD>楠?,
+        样本量: '300人',
+        统计方法: 't检验、卡方检验',
      },
    },
    // ...
  ],
 }

-// 5. 鍓嶇<EFBFBD>锛氬<EFBFBD>鍑虹粨鏋滐紙Excel/CSV锛?
+// 5. 前端：导出结果（Excel/CSV）
 ```

-**鍏抽敭鐗圭偣锛?*
- 鉁?鎵归噺澶勭悊澶氫釜鏂囨。
- 鉁?骞跺彂鎺у埗锛堥粯璁?涓<>苟鍙戯級
- 鉁?缁撴瀯鍖栦俊鎭<E4BF8A>彁鍙?
- 鉁?杩涘害瀹炴椂鏇存柊
- 鉁?鏀<>寔鑷<E5AF94>畾涔夋ā鏉?
- 鉁?缁撴灉鍙<E78189><E98D99>鍑猴紙Excel/CSV锛?
- 鉁?閿欒<E996BF>澶勭悊鍜岄噸璇?
+**关键特点：**
+- ✅ 批量处理多个文档
+- ✅ 并发控制（默认3个并发）
+- ✅ 结构化信息提取
+- ✅ 进度实时更新
+- ✅ 支持自定义模板
+- ✅ 结果可导出（Excel/CSV）
+- ✅ 错误处理和重试

 ---

-### 2.3 涓夌<EFBFBD>妯″紡鐨勫<EFBFBD>姣?
+### 2.3 三种模式的对比

-| 缁村害 | 鍏ㄦ枃闃呰<E99783> | 閫愮瘒绮捐<E7BBAE> | 鎵瑰<E98EB5>鐞?|
+| 维度 | 全文阅读 | 逐篇精读 | 批处理 |
 |------|---------|---------|--------|
-| **鏂囨。鏁伴噺** | 7绡囧乏鍙?| 1-5绡?| 3-50绡?|
-| **鏁版嵁鏉ユ簮** | 瀹屾暣鍏ㄦ枃 | RAG妫€绱㈢墖娈?| 瀹屾暣鍏ㄦ枃 |
-| **LLM璋冪敤** | 瀵硅瘽寮忥紙澶氳疆锛?| 瀵硅瘽寮忥紙澶氳疆锛?| 鎵归噺锛堝崟娆★級 |
-| **涓婁笅鏂?* | ~750K tokens | ~15K tokens | 鍗曠瘒鍏ㄦ枃 |
-| **杈撳嚭鏂瑰紡** | 娴佸紡锛圫SE锛?| 娴佸紡锛圫SE锛?| 鎵归噺淇濆瓨 |
-| **閫傜敤鍦烘櫙** | 缁煎悎鍒嗘瀽銆佽法鏂囩尞姣旇緝 | 娣卞害鐞嗚В鍗曠瘒 | 淇℃伅鎻愬彇銆佹暟鎹<E69A9F>〃鏍?|
+| **文档数量** | 7篇左右 | 1-5篇 | 3-50篇 |
+| **数据来源** | 完整全文 | RAG检索片段 | 完整全文 |
+| **LLM调用** | 对话式（多轮） | 对话式（多轮） | 批量（单次） |
+| **上下文** | ~750K tokens | ~15K tokens | 单篇全文 |
+| **输出方式** | 流式（SSE） | 流式（SSE） | 批量保存 |
+| **适用场景** | 综合分析、跨文献比较 | 深度理解单篇 | 信息提取、数据表格 |
 | **用户交互** | 实时问答 | 实时问答 | 后台处理 |
-| **瀵硅瘽鍘嗗彶** | 鍏ㄥ眬鍏变韩 | 姣忕瘒鐙<E79892>珛 | 鏃犲<E98F83>璇?|
+| **对话历史** | 全局共享 | 每篇独立 | 无对话 |

 ---

@@ -653,12 +653,12 @@ GET /api/v1/batch-tasks/:id/results
 ### PKB管理模块API

 ```
-POST   /api/v1/knowledge/create              # 鍒涘缓鐭ヨ瘑搴?
-GET    /api/v1/knowledge/list                # 鑾峰彇鐭ヨ瘑搴撳垪琛?
-GET    /api/v1/knowledge/:id                 # 鑾峰彇鐭ヨ瘑搴撹<EFBFBD>鎯?
-PUT    /api/v1/knowledge/:id                 # 鏇存柊鐭ヨ瘑搴?
-DELETE /api/v1/knowledge/:id                 # 鍒犻櫎鐭ヨ瘑搴?
-GET    /api/v1/knowledge/:id/search          # RAG妫€绱?
+POST   /api/v1/knowledge/create              # 创建知识库
+GET    /api/v1/knowledge/list                # 获取知识库列表
+GET    /api/v1/knowledge/:id                 # 获取知识库详情
+PUT    /api/v1/knowledge/:id                 # 更新知识库
+DELETE /api/v1/knowledge/:id                 # 删除知识库
+GET    /api/v1/knowledge/:id/search          # RAG检索
 GET    /api/v1/knowledge/:id/stats           # 统计信息
 GET    /api/v1/knowledge/:id/document-selection  # 文档选择（全文模式）

@@ -667,8 +667,8 @@ GET    /api/v1/documents/:id                 # 获取文档详情
 DELETE /api/v1/documents/:id                 # 删除文档
 GET    /api/v1/documents/:id/content         # 获取文档内容（全文）

-POST   /api/v1/batch-tasks/create            # 鍒涘缓鎵瑰<EFBFBD>鐞嗕换鍔?
-GET    /api/v1/batch-tasks/list              # 鑾峰彇鎵瑰<EFBFBD>鐞嗕换鍔″垪琛?
+POST   /api/v1/batch-tasks/create            # 创建批处理任务
+GET    /api/v1/batch-tasks/list              # 获取批处理任务列表
 GET    /api/v1/batch-tasks/:id               # 获取任务详情
 GET    /api/v1/batch-tasks/:id/results       # 获取任务结果
 DELETE /api/v1/batch-tasks/:id               # 删除任务
@@ -678,11 +678,11 @@ POST   /api/v1/task-templates/create         # 创建模板
 DELETE /api/v1/task-templates/:id            # 删除模板
 ```

-### AIA瀵硅瘽妯″潡API锛堝惈PKB闆嗘垚锛?
+### AIA对话模块API（含PKB集成）

 ```
-POST   /api/v1/chat/send-message-stream      # 鍙戦€佹秷鎭<EFBFBD>紙娴佸紡锛?
-鍙傛暟锛?
+POST   /api/v1/chat/send-message-stream      # 发送消息（流式）
+参数：
  - content: string
  - modelType: 'deepseek-v3' | 'qwen3-72b' | 'qwen-long'
  - knowledgeBaseIds?: string[]          # RAG模式
@@ -697,79 +697,79 @@ DELETE /api/v1/chat/conversations/:id        # 删除对话

 ---

-## 馃敆 妯″潡闂翠緷璧栧叧绯?
+## 🔗 模块间依赖关系

 ```
 AIA智能问答模块
-鈹?
-鈹溾攢 渚濊禆 PKB鐭ヨ瘑搴撶<E690B4>鐞嗘ā鍧?
-鈹? 鈹溾攢 鑾峰彇鐭ヨ瘑搴撳垪琛<E59EAA>紙閫夋嫨鐭ヨ瘑搴擄級
-鈹? 鈹溾攢 鑾峰彇鏂囨。鍒楄〃锛堥€夋嫨鏂囨。锛?
-鈹? 鈹溾攢 鑾峰彇鏂囨。鍏ㄦ枃锛堝叏鏂囬槄璇伙級
-鈹? 鈹溾攢 RAG妫€绱<E282AC>紙閫愮瘒绮捐<E7BBAE>锛?
-鈹? 鈹斺攢 鏂囨。鏅鸿兘閫夋嫨锛堝叏鏂囬槄璇伙級
-鈹?
+│
+├─ 依赖 PKB知识库管理模块
+│  ├─ 获取知识库列表（选择知识库）
+│  ├─ 获取文档列表（选择文档）
+│  ├─ 获取文档全文（全文阅读）
+│  ├─ RAG检索（逐篇精读）
+│  └─ 文档智能选择（全文阅读）
+│
 ├─ 依赖 LLM网关
-鈹? 鈹溾攢 DeepSeek V3
-鈹? 鈹溾攢 Qwen3-72B
-鈹? 鈹斺攢 Qwen-Long
-鈹?
+│  ├─ DeepSeek V3
+│  ├─ Qwen3-72B
+│  └─ Qwen-Long
+│
 └─ 依赖 Dify RAG引擎
   └─ retrieveKnowledge API
 ```

 ---

-## 馃幆 杩佺Щ鍏抽敭鐐?
+## 🎯 迁移关键点

 ### 1. PKB模块迁移
 ```
-鉁?绠€鍗曪細
+✅ 简单：
  - 数据库已在pkb_schema，无需迁移
-  - API绔<EFBFBD>偣娓呮櫚锛屾槗浜庡<EFBFBD>鍒?
+  - API端点清晰，易于复制
  - 业务逻辑独立

-鈿狅笍 娉ㄦ剰锛?
-  - Dify闆嗘垚闇€瑕佷繚鎸?
-  - OSS鏂囦欢涓婁紶闇€瑕佷繚鎸?
-  - 閰嶉<EFBFBD>绠＄悊闇€瑕佷繚鎸?
+⚠️ 注意：
+  - Dify集成需要保持
+  - OSS文件上传需要保持
+  - 配额管理需要保持
 ```

 ### 2. AIA模块中的PKB集成迁移
 ```
-鉁?绠€鍗曪細
-  - 鎺ュ彛娓呮櫚锛坒ullTextDocumentIds/documentIds锛?
+✅ 简单：
+  - 接口清晰（fullTextDocumentIds/documentIds）
  - 三种模式逻辑独立

-鈿狅笍 娉ㄦ剰锛?
-  - chatController.ts闇€瑕佸悓鏃惰縼绉?
-  - 鍓嶇<EFBFBD>3涓<EFBFBD>ā寮忕粍浠堕渶瑕佽縼绉?
-  - 瀵硅瘽鍘嗗彶绠＄悊闇€瑕佷繚鎸?
+⚠️ 注意：
+  - chatController.ts需要同时迁移
+  - 前端3个模式组件需要迁移
+  - 对话历史管理需要保持
 ```

 ### 3. 测试要点
 ```
-蹇呴』娴嬭瘯锛?
-  鉁?PKB CRUD鍔熻兘
-  鉁?鏂囨。涓婁紶鍜屾彁鍙?
-  鉁?RAG妫€绱㈠姛鑳?
-  鉁?鍏ㄦ枃闃呰<E99783>妯″紡锛?绡囨枃鐚<E69E83>級
-  鉁?閫愮瘒绮捐<E7BBAE>妯″紡锛堟枃妗ｅ垏鎹<E59E8F>級
-  鉁?鎵瑰<E98EB5>鐞嗘ā寮忥紙骞跺彂澶勭悊锛?
-  鉁?閰嶉<E996B0>绠＄悊
-  鉁?瀵硅瘽鍘嗗彶绠＄悊
-  鉁?妯″瀷鍒囨崲
+必须测试：
+  ✅ PKB CRUD功能
+  ✅ 文档上传和提取
+  ✅ RAG检索功能
+  ✅ 全文阅读模式（7篇文献）
+  ✅ 逐篇精读模式（文档切换）
+  ✅ 批处理模式（并发处理）
+  ✅ 配额管理
+  ✅ 对话历史管理
+  ✅ 模型切换
 ```

 ---

-## 鉁?闃舵<E99783>0瀹屾垚鏍囧噯
+## ✅ 阶段0完成标准

- [x] 娣卞叆鐞嗚ВPKB鐨勪袱涓<EFBFBD>儴鍒?
+- [x] 深入理解PKB的两个部分
 - [x] 列出所有API端点
 - [x] 理解数据库Schema
 - [x] 理解三种工作模式
- [x] 鐞嗚В妯″潡闂翠緷璧?
+- [x] 理解模块间依赖
 - [ ] 创建测试用例清单
 - [ ] 准备测试数据

@@ -781,9 +781,8 @@ AIA智能问答模块

 ---

-**瀹℃煡鐘舵€侊細** 馃煛 杩涜<E69DA9>涓<EFBFBD>紙90%瀹屾垚锛? 
-**涓嬩竴姝ワ細** 鍒涘缓娴嬭瘯鐢ㄤ緥娓呭崟鍜屾祴璇曟暟鎹<E69A9F>噯澶囨柟妗?
-
+**审查状态：** 🟡 进行中（90%完成）  
+**下一步：** 创建测试用例清单和测试数据准备方案