feat(admin): Add user management and upgrade to module permission system

Features - User Management (Phase 4.1):
- Database: Add user_modules table for fine-grained module permissions
- Database: Add 4 user permissions (view/create/edit/delete) to role_permissions
- Backend: UserService (780 lines) - CRUD with tenant isolation
- Backend: UserController + UserRoutes (648 lines) - 13 API endpoints
- Backend: Batch import users from Excel
- Frontend: UserListPage (412 lines) - list/filter/search/pagination
- Frontend: UserFormPage (341 lines) - create/edit with module config
- Frontend: UserDetailPage (393 lines) - details/tenant/module management
- Frontend: 3 modal components (592 lines) - import/assign/configure
- API: GET/POST/PUT/DELETE /api/admin/users/* endpoints

Architecture Upgrade - Module Permission System:
- Backend: Add getUserModules() method in auth.service
- Backend: Login API returns modules array in user object
- Frontend: AuthContext adds hasModule() method
- Frontend: Navigation filters modules based on user.modules
- Frontend: RouteGuard checks requiredModule instead of requiredVersion
- Frontend: Remove deprecated version-based permission system
- UX: Only show accessible modules in navigation (clean UI)
- UX: Smart redirect after login (avoid 403 for regular users)

Fixes:
- Fix UTF-8 encoding corruption in ~100 docs files
- Fix pageSize type conversion in userService (String to Number)
- Fix authUser undefined error in TopNavigation
- Fix login redirect logic with role-based access check
- Update Git commit guidelines v1.2 with UTF-8 safety rules

Database Changes:
- CREATE TABLE user_modules (user_id, tenant_id, module_code, is_enabled)
- ADD UNIQUE CONSTRAINT (user_id, tenant_id, module_code)
- INSERT 4 permissions + role assignments
- UPDATE PUBLIC tenant with 8 module subscriptions

Technical:
- Backend: 5 new files (~2400 lines)
- Frontend: 10 new files (~2500 lines)
- Docs: 1 development record + 2 status updates + 1 guideline update
- Total: ~4900 lines of code

Status: User management 100% complete, module permission system operational
This commit is contained in:
2026-01-16 13:42:10 +08:00
parent 98d862dbd4
commit 66255368b7
560 changed files with 70424 additions and 52353 deletions

View File

@@ -1,9 +1,9 @@
# PKB<EFBFBD>汉鐭ヨ瘑搴撳姛鑳藉<EFBFBD>鏌ユ姤鍛?- 闃舵<E99783>0
# PKB个人知识库功能审查报告 - 阶段0
> **瀹℃煡鏃ユ湡锛?* 2026-01-06
> **瀹℃煡浜哄憳锛?* AI鍔╂墜
> **瀹℃煡鐩<EFBFBD>爣锛?* 娣卞叆鐞嗚ВPKB鐜版湁鍔熻兘锛屼负瀹夊叏杩佺Щ鍋氬噯澶?
> **鐘舵€侊細** 鉁?杩涜<E69DA9>涓?
> **审查日期:** 2026-01-06
> **审查人员:** AI助手
> **审查目标:** 深入理解PKB现有功能为安全迁移做准备
> **状态:** ✅ 进行中
---
@@ -14,35 +14,35 @@
**🎯 PKB系统实际上是两个紧密关联的功能模块**
```
Part 1: PKB鐭ヨ瘑搴撶<EFBFBD>鐞嗘ā鍧?
Part 1: PKB知识库管理模块
├─ 位置backend/src/legacy/controllers/knowledgeBaseController.ts
鈹溾攢 鍔熻兘锛氬垱寤恒€佺紪杈戙€佸垹闄ょ煡璇嗗簱锛涗笂浼犮€佺<E282AC>鐞嗘枃妗?
鈹斺攢 鏁版嵁搴擄細pkb_schema锛堢嫭绔婼chema锛屾棤闇€杩佺Щ锛?
├─ 功能:创建、编辑、删除知识库;上传、管理文档
└─ 数据库pkb_schema独立Schema无需迁移
Part 2: AIA智能问答模块中的PKB应用
├─ 位置backend/src/legacy/controllers/chatController.ts
鈹溾攢 鍔熻兘锛氫娇鐢ㄧ煡璇嗗簱杩涜<E69DA9>鏅鸿兘闂<E58598>瓟锛?绉嶅伐浣滄ā寮忥級
鈹斺攢 宸ヤ綔妯″紡锛?
鈹溾攢 鍏ㄦ枃闃呰<E99783>妯″紡锛?5-50绡囨枃鐚<E69E83>患鍚堝垎鏋愶級
鈹溾攢 閫愮瘒绮捐<E7BBAE>妯″紡锛?-5绡囨枃鐚<E69E83>繁搴﹀垎鏋愶級
├─ 功能使用知识库进行智能问答3种工作模式
└─ 工作模式:
├─ 全文阅读模式35-50篇文献综合分析
├─ 逐篇精读模式1-5篇文献深度分析
└─ 批处理模式3-50篇文献批量提取
```
---
## 馃搳 Part 1: PKB鐭ヨ瘑搴撶<EFBFBD>鐞嗘ā鍧?
## 📊 Part 1: PKB知识库管理模块
### 1.1 文件结构
```
backend/src/legacy/
├─ controllers/
鈹? 鈹溾攢 knowledgeBaseController.ts # APIу埗鍣<EFBFBD>紙342琛岋級
鈹? 鈹斺攢 documentController.ts # 鏂囨。涓婁紶鎺у埗鍣?
│ ├─ knowledgeBaseController.ts # API控制器342行
│ └─ documentController.ts # 文档上传控制器
├─ services/
鈹? 鈹溾攢 knowledgeBaseService.ts # 涓氬姟閫昏緫锛?65琛岋級
鈹? 鈹溾攢 documentService.ts # 鏂囨。澶勭悊鏈嶅姟
鈹? 鈹斺攢 tokenService.ts # Token璁$畻鍜屾枃妗i€夋嫨
│ ├─ knowledgeBaseService.ts # 业务逻辑365行
│ ├─ documentService.ts # 文档处理服务
│ └─ tokenService.ts # Token计算和文档选择
└─ routes/
└─ knowledgeBases.ts # 路由定义
```
@@ -51,48 +51,48 @@ backend/src/legacy/
#### 知识库管理API
```typescript
// 1. 鍒涘缓鐭ヨ瘑搴?
// 1. 创建知识库
POST /api/v1/knowledge/create
Body: { name: string, description?: string }
?
kbQuota vs kbUsed?
kbQuota vs kbUsed
Dify创建Dataset
// 2. 鑾峰彇鐭ヨ瘑搴撳垪琛?
// 2. 获取知识库列表
GET /api/v1/knowledge/list
+
// 3. 鑾峰彇鐭ヨ瘑搴撹<EFBFBD>鎯?
// 3. 获取知识库详情
GET /api/v1/knowledge/:id
+ ?
+
// 4. 鏇存柊鐭ヨ瘑搴?
// 4. 更新知识库
PUT /api/v1/knowledge/:id
Body: { name?: string, description?: string }
// 5. 鍒犻櫎鐭ヨ瘑搴?
// 5. 删除知识库
DELETE /api/v1/knowledge/:id
?
Dify Dataset
ц<EFBFBD>documents<EFBFBD>?
documents自动删除
// 6. 妫€绱㈢煡璇嗗簱锛圧AG锛?
// 6. 检索知识库RAG
GET /api/v1/knowledge/:id/search?query=xxx&top_k=15
?
Dify retrieveKnowledge API
15
// 7. 鑾峰彇鐭ヨ瘑搴撶粺璁?
// 7. 获取知识库统计
GET /api/v1/knowledge/:id/stats
<EFBFBD><EFBFBD>oken?
Token
// 8. 获取文档选择(全文阅读模式)
GET /api/v1/knowledge/:id/document-selection?max_files=7&max_tokens=750000
<EFBFBD>Token闄愬埗锛?
Token限制
```
#### 文档管理API
@@ -100,21 +100,21 @@ GET /api/v1/knowledge/:id/document-selection?max_files=7&max_tokens=750000
// 9. 上传文档
POST /api/v1/documents/upload
Multipart: { file, kbId }
?
OSS
DF/Word/TXT/Markdown?
PDF/Word/TXT/Markdown
Dify进行索引
<EFBFBD>uploading鈫抪arsing鈫抜ndexing鈫抍ompleted?
uploadingparsingindexingcompleted
// 10. 获取文档详情
GET /api/v1/documents/:id
// 11. 删除文档
DELETE /api/v1/documents/:id
?
Dify删除Document
OSS删除文件
<EFBFBD>?
```
### 1.3 数据库Schema
@@ -134,10 +134,10 @@ knowledge_bases
createdAt (DateTime)
updatedAt (DateTime)
-- 鏂囨。琛?
-- 文档表
documents
id (UUID, PK)
kbId (String, FK ?knowledge_bases.id)
kbId (String, FK knowledge_bases.id)
userId (String)
filename (String)
fileType (String) -- pdf/docx/txt/md
@@ -148,10 +148,10 @@ documents
progress (Int, 0-100)
errorMessage (String?)
segmentsCount (Int?) -- Dify索引的片段数
tokensCount (Int?) -- 鎬籘oken鏁?
charCount (Int?) -- 瀛楃<EFBFBD>鏁?
tokensCount (Int?) -- 总Token
charCount (Int?) -- 字符数
language (String?)
extractedText (String?) -- 鎻愬彇鐨勫叏鏂囷紙鐢ㄤ簬鍏ㄦ枃闃呰<EFBFBD>妯″紡锛?
extractedText (String?) -- 提取的全文(用于全文阅读模式)
extractionMethod (String?) -- marker/pymupdf/docx
extractionQuality (Float?)
uploadedAt (DateTime)
@@ -161,7 +161,7 @@ documents
batch_tasks
id (UUID, PK)
userId (String)
kbId (String, FK ?knowledge_bases.id)
kbId (String, FK knowledge_bases.id)
name (String)
templateType (String)
templateId (String?)
@@ -181,8 +181,8 @@ batch_tasks
-- 批处理结果表
batch_results
id (UUID, PK)
taskId (String, FK ?batch_tasks.id)
documentId (String, FK ?documents.id)
taskId (String, FK batch_tasks.id)
documentId (String, FK documents.id)
status (String) -- success/failed
data (Json?) -- 提取的结构化数据
rawOutput (String?) -- LLM原始输出
@@ -191,7 +191,7 @@ batch_results
tokensUsed (Int?)
createdAt (DateTime)
-- 浠诲姟妯℃澘琛?
-- 任务模板表
task_templates
id (UUID, PK)
userId (String)
@@ -199,7 +199,7 @@ task_templates
description (String?)
prompt (String)
isPublic (Boolean, default: false)
outputFields (Json) -- 鏈熸湜鐨勮緭鍑哄瓧娈?
outputFields (Json) -- 期望的输出字段
createdAt (DateTime)
updatedAt (DateTime)
```
@@ -233,16 +233,16 @@ idx_pkb_batch_results_status (status)
#### 配额管理
```typescript
// 鐢ㄦ埛琛<EFBFBD>紙鍦╬latform_schema.users锛変腑鐨勫瓧娈?
kbQuota: Int @default(3) // 鐭ヨ瘑搴撻厤棰?
kbUsed: Int @default(0) // 宸蹭娇鐢ㄦ暟閲?
// 用户表在platform_schema.users)中的字段
kbQuota: Int @default(3) // 知识库配额
kbUsed: Int @default(0) // 已使用数量
// 鍒涘缓鐭ヨ瘑搴撴椂妫€鏌?
// 创建知识库时检查
if (user.kbUsed >= user.kbQuota) {
throw new Error('配额已满');
}
// 鍒涘缓鎴愬姛鍚庡<EFBFBD>鍔犺<EFBFBD>鏁?
// 创建成功后增加计数
await prisma.user.update({
data: { kbUsed: { increment: 1 } }
});
@@ -255,14 +255,14 @@ await prisma.user.update({
#### Dify集成
```typescript
// 鍒涘缓鐭ヨ瘑搴?鈫?鍒涘缓Dify Dataset
// 创建知识库 → 创建Dify Dataset
const difyDataset = await difyClient.createDataset({
name: `${userId}_${name}_${Date.now()}`,
description,
indexing_technique: 'high_quality',
});
// 妫€绱㈢煡璇嗗簱 鈫?璋冪敤Dify RAG
// 检索知识库 → 调用Dify RAG
const results = await difyClient.retrieveKnowledge(
difyDatasetId,
query,
@@ -275,13 +275,13 @@ const results = await difyClient.retrieveKnowledge(
);
```
#### 鏂囨。Token璁$畻锛坱okenService.ts锛?
#### 文档Token计算tokenService.ts
```typescript
// Token计算规则
const TOKEN_LIMITS = {
MAX_FILES: 7, // 鏈€澶?绡囨枃鐚?
MAX_TOTAL_TOKENS: 750000, // 鎬籘oken闄愬埗锛圦wen-Long: 1M涓婁笅鏂?- 250K瀵硅瘽绌洪棿锛?
MAX_SINGLE_DOC_TOKENS: 200000, // 鍗曠瘒鏂囩尞鏈€澶<EFBFBD>oken鏁?
MAX_FILES: 7, // 最多7篇文献
MAX_TOTAL_TOKENS: 750000, // 总Token限制Qwen-Long: 1M上下文 - 250K对话空间)
MAX_SINGLE_DOC_TOKENS: 200000, // 单篇文献最大Token
};
// 智能选择算法
@@ -290,7 +290,7 @@ function selectDocumentsForFullText(
maxFiles,
maxTokens
) {
// 鎸塗oken鏁板崌搴忔帓搴?
// 按Token数升序排序
const sorted = documentTokens.sort((a, b) => a.tokens - b.tokens);
// 贪心算法选择
@@ -323,29 +323,29 @@ backend/src/legacy/controllers/
└─ chatController.ts # 通用对话控制器包含3种模式
frontend/src/
鈹溾攢 pages/ChatPage.tsx # 涓诲<EFBFBD>璇濋〉闈?
├─ pages/ChatPage.tsx # 主对话页面
└─ components/
├─ FullTextMode.tsx # 全文阅读模式组件
├─ DeepReadMode.tsx # 逐篇精读模式组件
鈹斺攢 BatchMode.tsx # 鎵瑰<EFBFBD>鐞嗘ā寮忕粍浠?
└─ BatchMode.tsx # 批处理模式组件
```
### 2.2 三种工作模式详解
#### 妯″紡1锛氬叏鏂囬槄璇绘ā寮忥紙Full Text Mode锛?
#### 模式1全文阅读模式Full Text Mode
**鐢ㄩ€?*锛?5-50绡囨枃鐚<E69E83>殑缁煎悎鍒嗘瀽
**用途**35-50篇文献的综合分析
**瀹炵幇鍘熺悊锛?*
**实现原理:**
```typescript
// 1. 鍓嶇<EFBFBD>锛氱敤鎴疯繘鍏ョ煡璇嗗簱妯″紡 鈫?閫夋嫨"鍏ㄦ枃闃呰<E99783>"
// 1. 前端:用户进入知识库模式 → 选择"全文阅读"
const modeState = {
baseMode: 'knowledge_base',
kbMode: 'full_text',
selectedKbId: 'xxx',
};
// 2. 鍓嶇<EFBFBD>锛氭櫤鑳藉姞杞芥枃鐚?
// 2. 前端:智能加载文献
const selection = await knowledgeBaseApi.getDocumentSelection(kbId, {
max_files: 7,
max_tokens: 750000,
@@ -354,26 +354,26 @@ const selection = await knowledgeBaseApi.getDocumentSelection(kbId, {
// 3. 前端自动切换到Qwen-Long模型
if (modeState.kbMode === 'full_text') {
setSelectedModel('qwen-long'); // 1M涓婁笅鏂?
showToast('宸茶嚜鍔ㄥ垏鎹㈠埌Qwen-Long妯″瀷锛堟敮鎸?M涓婁笅鏂囷級');
setSelectedModel('qwen-long'); // 1M上下文
showToast('已自动切换到Qwen-Long模型支持1M上下文');
}
// 4. 前端发送消息时传递文档ID列表
await chatApi.sendMessageStream({
content: userQuestion,
modelType: 'qwen-long',
fullTextDocumentIds: loadedDocs.map(d => d.id), // 鉁?鍏抽敭鍙傛暟
fullTextDocumentIds: loadedDocs.map(d => d.id), // ✅ 关键参数
conversationId,
});
// 5. 鍚庣<EFBFBD>锛氬姞杞藉畬鏁村叏鏂?
// 5. 后端:加载完整全文
if (fullTextDocumentIds && fullTextDocumentIds.length > 0) {
const documents = await prisma.document.findMany({
where: { id: { in: fullTextDocumentIds } },
select: { id, filename, extractedText, tokensCount },
});
// 6. 缁勮<EFBFBD>鍏ㄦ枃涓婁笅鏂?
// 6. 组装全文上下文
const fullTextParts = [];
for (let i = 0; i < documents.length; i++) {
const doc = documents[i];
@@ -381,14 +381,14 @@ if (fullTextDocumentIds && fullTextDocumentIds.length > 0) {
// 格式【文献N文件名】\n全文内容
fullTextParts.push(
`銆愭枃鐚?{docNumber}锛?{doc.filename}銆慭n\n${doc.extractedText}`
`【文献${docNumber}${doc.filename}\n\n${doc.extractedText}`
);
// 添加引用信息
allCitations.push({
id: docNumber,
fileName: doc.filename,
score: 1.0, // 鍏ㄦ枃鐩稿叧搴?00%
score: 1.0, // 全文相关度100%
content: doc.extractedText.substring(0, 200),
});
}
@@ -397,7 +397,7 @@ if (fullTextDocumentIds && fullTextDocumentIds.length > 0) {
}
// 7. 传递给LLM
const systemPrompt = '浣犳槸涓撲笟鐨勫<EFBFBD><EFBFBD>枃鐚<EFBFBD>垎鏋愬姪鎵嬨€傛瘡绡囨枃鐚<EFBFBD>敤銆愭枃鐚甆锛氭枃浠跺悕銆戞爣璁般€傝<EFBFBD>璁ょ湡闃呰<EFBFBD>鎵€鏈夋枃鐚<EFBFBD>紝杩涜<EFBFBD>娣卞叆鐨勭患鍚堝垎鏋愩€傚湪鍥炵瓟鏃惰<EFBFBD>寮曠敤鍏蜂綋鏂囩尞锛屼娇鐢ㄣ€愭枃鐚甆銆戞牸寮忋€?;
const systemPrompt = '你是专业的学术文献分析助手。每篇文献用【文献N文件名】标记。请认真阅读所有文献进行深入的综合分析。在回答时请引用具体文献使用【文献N】格式。';
const userContent = `${userQuestion}\n\n## 参考资料(文献全文)\n\n${knowledgeBaseContext}`;
@@ -414,28 +414,28 @@ const response = await LLMFactory.getAdapter('qwen-long').chatStream(messages, {
});
```
**鍏抽敭鐗圭偣锛?*
- 鉁?浼犻€掑畬鏁村叏鏂囷紙涓嶆槸RAG鐗囨<E99097>锛?
- 鉁?鏅鸿兘閫夋嫨鏂囩尞锛堝熀浜嶵oken闄愬埗锛?
- 鉁?鏂囩尞鏉ユ簮鏍囪<E98F8D>锛氥€愭枃鐚甆锛氭枃浠跺悕銆?
- 鉁?鑷<>姩鍒囨崲鍒癚wen-Long妯″瀷锛?M涓婁笅鏂囷級
- 鉁?100%鐩稿叧搴︼紙鍥犱负鏄<EFBFBD>叏鏂囷級
- 鉁?閫傚悎璺ㄦ枃鐚<E69E83>瘮杈冦€佽秼鍔垮垎鏋愩€佺爺绌舵柟娉曞綊绾?
**关键特点:**
- ✅ 传递完整全文不是RAG片段
- ✅ 智能选择文献基于Token限制
- ✅ 文献来源标记【文献N文件名】
- ✅ 自动切换到Qwen-Long模型1M上下文
- 100%相关度(因为是全文)
- ✅ 适合跨文献比较、趋势分析、研究方法归纳
**Token浣跨敤锛?*
**Token使用:**
```
涓婁笅鏂囷細~750K tokens锛?绡囨枃鐚<E69E83>叏鏂囷級
上下文:~750K tokens7篇文献全文
对话空间:~250K tokens
杈撳嚭闀垮害锛?000 tokens锛堢患鍚堝垎鏋愰渶瑕佹洿闀垮洖绛旓級
输出长度6000 tokens(综合分析需要更长回答)
```
---
#### 妯″紡2锛氶€愮瘒绮捐<EFBFBD>妯″紡锛圖eep Read Mode锛?
#### 模式2逐篇精读模式Deep Read Mode
**鐢ㄩ€?*锛?-5绡囨枃鐚<E69E83>殑娣卞害鍒嗘瀽
**用途**1-5篇文献的深度分析
**瀹炵幇鍘熺悊锛?*
**实现原理:**
```typescript
// 1. 前端:用户选择"逐篇精读"
const modeState = {
@@ -450,12 +450,12 @@ const selectedDocs = [doc1, doc2, doc3]; // 用户手动选择
// 3. 前端:切换到某个文档
const currentDoc = selectedDocs[0];
// 4. 鍓嶇<EFBFBD>锛氬彂閫佹秷鎭<EFBFBD>椂浼犻€掑綋鍓嶆枃妗<EFBFBD>D锛堢敤浜嶳AG杩囨护锛?
// 4. 前端发送消息时传递当前文档ID用于RAG过滤
await chatApi.sendMessageStream({
content: userQuestion,
modelType: selectedModel,
knowledgeBaseIds: [kbId], // 知识库ID
documentIds: [currentDoc.id], // 鉁?鍏抽敭锛氬彧妫€绱㈠綋鍓嶆枃妗?
documentIds: [currentDoc.id], // ✅ 关键:只检索当前文档
conversationId: currentDocConversationId, // 每个文档独立对话
});
@@ -469,40 +469,40 @@ if (documentIds && documentIds.length > 0) {
retrieval_model: {
search_method: 'semantic_search',
top_k: 15,
document_ids: documentIds, // 鉁?Dify浼氬彧妫€绱㈣繖浜涙枃妗?
document_ids: documentIds, // Dify会只检索这些文档
},
}
);
}
```
**鍏抽敭鐗圭偣锛?*
- 鉁?鍩轰簬RAG妫€绱<E282AC>紙涓嶆槸鍏ㄦ枃锛?
- 鉁?闄愬畾鍦ㄥ綋鍓嶆枃妗h寖鍥?
- 鉁?姣忎釜鏂囨。鏈夌嫭绔嬬殑瀵硅瘽鍘嗗彶
- 鉁?鐢ㄦ埛鍙<E59F9B>互鍦ㄦ枃妗棿鍒囨崲
- 鉁?閫傚悎娣卞害鐞嗚В鍗曠瘒鏂囩尞
**关键特点:**
- ✅ 基于RAG检索不是全文
- ✅ 限定在当前文档范围
- ✅ 每个文档有独立的对话历史
- ✅ 用户可以在文档间切换
- ✅ 适合深度理解单篇文献
---
#### 妯″紡3锛氭壒澶勭悊妯″紡锛圔atch Mode锛?
#### 模式3批处理模式Batch Mode
**鐢ㄩ€?*锛?-50绡囨枃鐚<E69E83>殑鎵归噺淇℃伅鎻愬彇
**用途**3-50篇文献的批量信息提取
**瀹炵幇鍘熺悊锛?*
**实现原理:**
```typescript
// 1. 鐢ㄦ埛鍒涘缓鎵瑰<EFBFBD>鐞嗕换鍔?
// 1. 用户创建批处理任务
POST /api/v1/batch-tasks/create
Body: {
kbId: 'xxx',
name: '提取研究方法',
prompt: '璇蜂粠杩欑瘒鏂囩尞涓<EFBFBD>彁鍙栵細鐮旂┒璁捐<EFBFBD>銆佹牱鏈<EFBFBD>噺銆佺粺璁℃柟娉?,
prompt: '请从这篇文献中提取:研究设计、样本量、统计方法',
templateType: 'custom' | 'preset',
modelType: 'deepseek-v3',
concurrency: 3, // 骞跺彂鏁?
concurrency: 3, // 并发数
}
// 2. 鍚庣<EFBFBD>锛氬垱寤轰换鍔?
// 2. 后端:创建任务
const task = await prisma.batchTask.create({
data: {
userId,
@@ -519,7 +519,7 @@ const task = await prisma.batchTask.create({
// 3. 后端启动批处理Worker
async function processBatchTask(taskId) {
// 3.1 鑾峰彇浠诲姟鍜屾枃妗e垪琛?
// 3.1 获取任务和文档列表
const task = await prisma.batchTask.findUnique({
where: { id: taskId },
include: { knowledgeBase: { include: { documents: true } } },
@@ -527,7 +527,7 @@ async function processBatchTask(taskId) {
const documents = task.knowledgeBase.documents.filter(d => d.status === 'completed');
// 3.2 鏇存柊浠诲姟鐘舵€?
// 3.2 更新任务状态
await prisma.batchTask.update({
where: { id: taskId },
data: { status: 'running', startedAt: new Date() },
@@ -547,7 +547,7 @@ async function processBatchTask(taskId) {
{ role: 'user', content: llmPrompt },
]);
// 3.3.2 瀽LLM杈撳嚭锛堟湡鏈汮SON鏍煎紡锛?
// 3.3.2 解析LLM输出期望JSON格式
const data = parseJSONResponse(response.content);
// 3.3.3 保存结果
@@ -601,7 +601,7 @@ async function processBatchTask(taskId) {
// 4. 前端:查看批处理结果
GET /api/v1/batch-tasks/:id/results
杩斿洖锛?
{
task: { /* 任务信息 */ },
results: [
@@ -611,40 +611,40 @@ GET /api/v1/batch-tasks/:id/results
status: 'success',
data: {
: '随机对照试验',
鏍锋湰閲? '300?,
<EFBFBD>: 't妫<EFBFBD>?,
: '300人',
: 't检验、卡方检验',
},
},
// ...
],
}
// 5. 鍓嶇<EFBFBD>锛氬<EFBFBD>鍑虹粨鏋滐紙Excel/CSV锛?
// 5. 前端:导出结果(Excel/CSV
```
**鍏抽敭鐗圭偣锛?*
- 鉁?鎵归噺澶勭悊澶氫釜鏂囨。
- 鉁?骞跺彂鎺у埗锛堥粯璁?涓<>苟鍙戯級
- 鉁?缁撴瀯鍖栦俊鎭<E4BF8A>彁鍙?
- 鉁?杩涘害瀹炴椂鏇存柊
- 鉁?鏀<>寔鑷<E5AF94>畾涔夋ā鏉?
- 鉁?缁撴灉鍙<E78189><E98D99>鍑猴紙Excel/CSV锛?
- 鉁?閿欒<E996BF>澶勭悊鍜岄噸璇?
**关键特点:**
- ✅ 批量处理多个文档
- ✅ 并发控制默认3个并发
- ✅ 结构化信息提取
- ✅ 进度实时更新
- ✅ 支持自定义模板
- ✅ 结果可导出(Excel/CSV
- ✅ 错误处理和重试
---
### 2.3 涓夌<EFBFBD>妯″紡鐨勫<EFBFBD>姣?
### 2.3 三种模式的对比
| 缁村害 | 鍏ㄦ枃闃呰<E99783> | 閫愮瘒绮捐<E7BBAE> | 鎵瑰<E98EB5>鐞?|
| 维度 | 全文阅读 | 逐篇精读 | 批处理 |
|------|---------|---------|--------|
| **鏂囨。鏁伴噺** | 7绡囧乏鍙?| 1-5绡?| 3-50绡?|
| **鏁版嵁鏉ユ簮** | 瀹屾暣鍏ㄦ枃 | RAG妫€绱㈢墖娈?| 瀹屾暣鍏ㄦ枃 |
| **LLM璋冪敤** | 瀵硅瘽寮忥紙澶氳疆锛?| 瀵硅瘽寮忥紙澶氳疆锛?| 鎵归噺锛堝崟娆★級 |
| **涓婁笅鏂?* | ~750K tokens | ~15K tokens | 鍗曠瘒鍏ㄦ枃 |
| **杈撳嚭鏂瑰紡** | 娴佸紡锛圫SE锛?| 娴佸紡锛圫SE锛?| 鎵归噺淇濆瓨 |
| **閫傜敤鍦烘櫙** | 缁煎悎鍒嗘瀽銆佽法鏂囩尞姣旇緝 | 娣卞害鐞嗚В鍗曠瘒 | 淇℃伅鎻愬彇銆佹暟鎹<E69A9F>〃鏍?|
| **文档数量** | 7篇左右 | 1-5| 3-50|
| **数据来源** | 完整全文 | RAG检索片段 | 完整全文 |
| **LLM调用** | 对话式(多轮) | 对话式(多轮) | 批量(单次) |
| **上下文** | ~750K tokens | ~15K tokens | 单篇全文 |
| **输出方式** | 流式SSE | 流式SSE | 批量保存 |
| **适用场景** | 综合分析、跨文献比较 | 深度理解单篇 | 信息提取、数据表格 |
| **用户交互** | 实时问答 | 实时问答 | 后台处理 |
| **瀵硅瘽鍘嗗彶** | 鍏ㄥ眬鍏变韩 | 姣忕瘒鐙<E79892>珛 | 鏃犲<E98F83>璇?|
| **对话历史** | 全局共享 | 每篇独立 | 无对话 |
---
@@ -653,12 +653,12 @@ GET /api/v1/batch-tasks/:id/results
### PKB管理模块API
```
POST /api/v1/knowledge/create # 鍒涘缓鐭ヨ瘑搴?
GET /api/v1/knowledge/list # 鑾峰彇鐭ヨ瘑搴撳垪琛?
GET /api/v1/knowledge/:id # 鑾峰彇鐭ヨ瘑搴撹<EFBFBD>鎯?
PUT /api/v1/knowledge/:id # 鏇存柊鐭ヨ瘑搴?
DELETE /api/v1/knowledge/:id # 鍒犻櫎鐭ヨ瘑搴?
GET /api/v1/knowledge/:id/search # RAG妫€绱?
POST /api/v1/knowledge/create # 创建知识库
GET /api/v1/knowledge/list # 获取知识库列表
GET /api/v1/knowledge/:id # 获取知识库详情
PUT /api/v1/knowledge/:id # 更新知识库
DELETE /api/v1/knowledge/:id # 删除知识库
GET /api/v1/knowledge/:id/search # RAG检索
GET /api/v1/knowledge/:id/stats # 统计信息
GET /api/v1/knowledge/:id/document-selection # 文档选择(全文模式)
@@ -667,8 +667,8 @@ GET /api/v1/documents/:id # 获取文档详情
DELETE /api/v1/documents/:id # 删除文档
GET /api/v1/documents/:id/content # 获取文档内容(全文)
POST /api/v1/batch-tasks/create # 鍒涘缓鎵瑰<EFBFBD>鐞嗕换鍔?
GET /api/v1/batch-tasks/list # 鑾峰彇鎵瑰<EFBFBD>鐞嗕换鍔″垪琛?
POST /api/v1/batch-tasks/create # 创建批处理任务
GET /api/v1/batch-tasks/list # 获取批处理任务列表
GET /api/v1/batch-tasks/:id # 获取任务详情
GET /api/v1/batch-tasks/:id/results # 获取任务结果
DELETE /api/v1/batch-tasks/:id # 删除任务
@@ -678,11 +678,11 @@ POST /api/v1/task-templates/create # 创建模板
DELETE /api/v1/task-templates/:id # 删除模板
```
### AIA瀵硅瘽妯″潡API锛堝惈PKB闆嗘垚锛?
### AIA对话模块API含PKB集成
```
POST /api/v1/chat/send-message-stream # 鍙戦€佹秷鎭<EFBFBD>紙娴佸紡锛?
鍙傛暟锛?
POST /api/v1/chat/send-message-stream # 发送消息(流式)
参数:
- content: string
- modelType: 'deepseek-v3' | 'qwen3-72b' | 'qwen-long'
- knowledgeBaseIds?: string[] # RAG模式
@@ -697,79 +697,79 @@ DELETE /api/v1/chat/conversations/:id # 删除对话
---
## 馃敆 妯″潡闂翠緷璧栧叧绯?
## 🔗 模块间依赖关系
```
AIA智能问答模块
鈹?
鈹溾攢 渚濊禆 PKB鐭ヨ瘑搴撶<E690B4>鐞嗘ā鍧?
鈹? 鈹溾攢 鑾峰彇鐭ヨ瘑搴撳垪琛<E59EAA>紙閫夋嫨鐭ヨ瘑搴擄級
鈹? 鈹溾攢 鑾峰彇鏂囨。鍒楄〃锛堥€夋嫨鏂囨。锛?
鈹? 鈹溾攢 鑾峰彇鏂囨。鍏ㄦ枃锛堝叏鏂囬槄璇伙級
鈹? 鈹溾攢 RAG妫€绱<E282AC>紙閫愮瘒绮捐<E7BBAE>锛?
鈹? 鈹斺攢 鏂囨。鏅鸿兘閫夋嫨锛堝叏鏂囬槄璇伙級
鈹?
├─ 依赖 PKB知识库管理模块
│ ├─ 获取知识库列表(选择知识库)
│ ├─ 获取文档列表(选择文档)
│ ├─ 获取文档全文(全文阅读)
│ ├─ RAG检索逐篇精读
│ └─ 文档智能选择(全文阅读)
├─ 依赖 LLM网关
鈹? 鈹溾攢 DeepSeek V3
鈹? 鈹溾攢 Qwen3-72B
鈹? 鈹斺攢 Qwen-Long
鈹?
│ ├─ DeepSeek V3
│ ├─ Qwen3-72B
│ └─ Qwen-Long
└─ 依赖 Dify RAG引擎
└─ retrieveKnowledge API
```
---
## 馃幆 杩佺Щ鍏抽敭鐐?
## 🎯 迁移关键点
### 1. PKB模块迁移
```
鉁?绠€鍗曪細
✅ 简单:
- 数据库已在pkb_schema无需迁移
- API<EFBFBD>偣娓呮櫚锛屾槗浜庡<EFBFBD>鍒?
- API端点清晰,易于复制
- 业务逻辑独立
鈿狅笍 娉ㄦ剰锛?
- Dify闆嗘垚闇€瑕佷繚鎸?
- OSS鏂囦欢涓婁紶闇€瑕佷繚鎸?
- 閰嶉<EFBFBD>悊闇€瑕佷繚鎸?
⚠️ 注意:
- Dify集成需要保持
- OSS文件上传需要保持
- 配额管理需要保持
```
### 2. AIA模块中的PKB集成迁移
```
鉁?绠€鍗曪細
- 鎺ュ彛娓呮櫚锛坒ullTextDocumentIds/documentIds锛?
✅ 简单:
- 接口清晰fullTextDocumentIds/documentIds
- 三种模式逻辑独立
鈿狅笍 娉ㄦ剰锛?
- chatController.ts闇€瑕佸悓鏃惰縼绉?
- 鍓嶇<EFBFBD>3涓<EFBFBD>ā寮忕粍浠堕渶瑕佽縼绉?
- 瀵硅瘽鍘嗗彶绠$悊闇€瑕佷繚鎸?
⚠️ 注意:
- chatController.ts需要同时迁移
- 前端3个模式组件需要迁移
- 对话历史管理需要保持
```
### 3. 测试要点
```
蹇呴』娴嬭瘯锛?
鉁?PKB CRUD鍔熻兘
鉁?鏂囨。涓婁紶鍜屾彁鍙?
鉁?RAG妫€绱㈠姛鑳?
鉁?鍏ㄦ枃闃呰<E99783>妯″紡锛?绡囨枃鐚<E69E83>
鉁?閫愮瘒绮捐<E7BBAE>妯″紡锛堟枃妗垏鎹<E59E8F>
鉁?鎵瑰<E98EB5>鐞嗘ā寮忥紙骞跺彂澶勭悊锛?
鉁?閰嶉<E996B0>
鉁?瀵硅瘽鍘嗗彶绠$悊
鉁?妯″瀷鍒囨崲
必须测试:
PKB CRUD功能
✅ 文档上传和提取
RAG检索功能
✅ 全文阅读模式7篇文献
✅ 逐篇精读模式(文档切换)
✅ 批处理模式(并发处理)
✅ 配额管理
✅ 对话历史管理
✅ 模型切换
```
---
## 鉁?闃舵<E99783>0瀹屾垚鏍囧噯
## ✅ 阶段0完成标准
- [x] 娣卞叆鐞嗚ВPKB鐨勪袱涓<EFBFBD>儴鍒?
- [x] 深入理解PKB的两个部分
- [x] 列出所有API端点
- [x] 理解数据库Schema
- [x] 理解三种工作模式
- [x] 鐞嗚В妯″潡闂翠緷璧?
- [x] 理解模块间依赖
- [ ] 创建测试用例清单
- [ ] 准备测试数据
@@ -781,9 +781,8 @@ AIA智能问答模块
---
**瀹℃煡鐘舵€侊細** 馃煛 杩涜<E69DA9><EFBFBD>紙90%瀹屾垚锛?
**涓嬩竴姝ワ細** 鍒涘缓娴嬭瘯鐢ㄤ緥娓呭崟鍜屾祴璇曟暟鎹<E69A9F>噯澶囨柟妗?
**审查状态:** 🟡 进行中90%完成)
**下一步:** 创建测试用例清单和测试数据准备方案