# PKB(个人知识库)和 RVW(审稿功能)迁移计划
> **创建日期?* 2025-12-28
> **维护者:** 技术团?
> **目标?* 将已开发的PKB和RVW功能迁移到最新的模块化架构上
---
## 📋 执行摘要
### 迁移目标
将旧版本(`frontend` + `backend/src/legacy`)中?*个人知识库(PKB?*?*审稿功能(RVW?*迁移到新架构(`frontend-v2` + `backend/src/modules`),使其符合最新的模块化、云原生设计规范?
### 当前状?
| 功能 | 旧架构位?| 完成?| 数据库Schema | 前端UI |
|------|-----------|--------|-------------|--------|
| **PKB 个人知识?* | `backend/src/legacy` + `frontend/src` | ?100% | `pkb_schema` | ?完整UI |
| **RVW 审稿功能** | `backend/src/legacy` + `frontend/src` | ?100% | `public.ReviewTask` | ?完整UI |
### 迁移优先?
1. **P0(最高优先级?*: PKB个人知识?- ?00%完成,迁移风险低
2. **P1(高优先级)**: RVW审稿功能 - ?00%完成,迁移风险低
---
## 🔍 已有功能深度分析
### 一、PKB(个人知识库)功能详?
#### 1.1 功能特?
**核心能力?*
- ?**知识库CRUD**:创建、查看、编辑、删除知识库
- ?**配额管理**:每用户3个知识库,每?0个文?
- ?**文档上传**:支持PDF、Word、TXT、Markdown
- ?**文档状态追?*:uploading ?parsing ?indexing ?completed/error
- ?**Dify RAG集成**:基于Dify平台的向量检?
- ?**语义检?*:支持多知识库联合检索,top_k=15
- ?**统计信息**:文档数、Token数、段落数统计
- ?**全文阅读模式**(Phase2):Token限制、智能文档选择
**技术亮点:**
- 🏆 **Python微服务集?*:调用`extraction_service`提取文档文本
- 🏆 **Dify Dataset管理**:每个知识库对应一个Dify Dataset
- 🏆 **Token精确计算**:使用tiktoken计算Token数,双重限制?0文件 + 980K tokens?
- 🏆 **智能文档选择**:基于Token容量的智能推荐算?
#### 1.2 数据库结?
**PKB Schema(`pkb_schema`):**
```prisma
model KnowledgeBase {
id String @id @default(uuid())
userId String
name String
description String?
difyDatasetId String // 映射到Dify
fileCount Int @default(0)
totalSizeBytes BigInt @default(0)
createdAt DateTime @default(now())
updatedAt DateTime @updatedAt
documents Document[]
batchTasks BatchTask[]
}
model Document {
id String @id @default(uuid())
kbId String
userId String
filename String
fileType String
fileSizeBytes BigInt
fileUrl String
difyDocumentId String
status String // uploading/parsing/indexing/completed/error
progress Int @default(0)
errorMessage String?
segmentsCount Int?
tokensCount Int?
extractionMethod String? // nougat/pymupdf/mammoth
extractionQuality Float?
charCount Int?
language String? // chinese/english
extractedText String? // Phase2:全文存?
uploadedAt DateTime @default(now())
processedAt DateTime?
}
model BatchTask {
id String @id @default(uuid())
userId String
kbId String
name String
templateType String
templateId String?
prompt String
status String
totalDocuments Int
completedCount Int @default(0)
failedCount Int @default(0)
modelType String
concurrency Int @default(3)
startedAt DateTime?
completedAt DateTime?
durationSeconds Int?
results BatchResult[]
}
```
#### 1.3 后端代码结构
**服务层(`backend/src/legacy/services/`):**
```typescript
knowledgeBaseService.ts (365?
├── createKnowledgeBase() // 创建知识库(Dify Dataset?
├── getKnowledgeBases() // 获取列表
├── getKnowledgeBaseById() // 获取详情
├── updateKnowledgeBase() // 更新
├── deleteKnowledgeBase() // 删除(级联删除Dify Dataset?
├── searchKnowledgeBase() // 语义检索(调用Dify API?
├── getKnowledgeBaseStats() // 统计信息
└── getDocumentSelection() // 智能文档选择(Phase2?
documentService.ts
├── uploadDocument() // 上传文档
├── getDocuments() // 获取文档列表
├── deleteDocument() // 删除文档
├── reprocessDocument() // 重新处理
└── pollDocumentStatus() // 轮询状?
tokenService.ts (243?
├── calculateDocumentTokens() // 计算Token
├── selectDocumentsForFullText() // 智能选择
└── TOKEN_LIMITS 常量
```
**控制器层(`backend/src/legacy/controllers/`):**
```typescript
knowledgeBaseController.ts (341?
├── POST /knowledge-bases
├── GET /knowledge-bases
├── GET /knowledge-bases/:id
├── PUT /knowledge-bases/:id
├── DELETE /knowledge-bases/:id
├── GET /knowledge-bases/:id/search
├── GET /knowledge-bases/:id/stats
└── GET /knowledge-bases/:id/document-selection
documentController.ts
├── POST /knowledge-bases/:kbId/documents
├── GET /knowledge-bases/:kbId/documents
├── GET /documents/:id
├── GET /documents/:id/full-text
├── DELETE /documents/:id
└── POST /documents/:id/reprocess
```
#### 1.4 前端代码结构
**主页面(`frontend/src/pages/KnowledgePage.tsx`):** 281?
- 知识库列表视?
- 知识库详情视图(Tabs:文档管?+ 统计信息?
- 双进度条容量显示(文件数 + Token数)
**组件(`frontend/src/components/knowledge/`):**
```
KnowledgeBaseList.tsx // 知识库卡片列?
CreateKBDialog.tsx // 创建对话?
EditKBDialog.tsx // 编辑对话?
DocumentList.tsx // 文档列表(含状态徽章)
DocumentUpload.tsx // 文件上传(拖拽支持)
```
**状态管理(`frontend/src/stores/useKnowledgeBaseStore.ts`):**
- Zustand状态管?
- API调用封装
- 实时状态轮询(5秒间隔)
---
### 二、RVW(审稿功能)功能详情
#### 2.1 功能特?
**核心能力?*
- ?**稿件上传**:支持Word文档?doc/.docx),最?MB
- ?**双维度评?*?
- 稿约规范性评估(11项标准)
- 方法学评估(3大部分)
- ?**基于真实期刊标准**:《中华医学超声杂志》稿?
- ?**智能分析**:使用LLM进行结构化评?
- ?**完整报告**:JSON格式结果,支持导出PDF/复制文本
- ?**模型选择**:DeepSeek-V3 / Qwen3-72B / Qwen-Long
- ?**任务管理**:任务列表、状态追踪、进度显?
**评估标准?*
**稿约规范性评估(11项)?*
1. 文题(Title?
2. 作者(Authors?
3. 中文摘要(Chinese Abstract?
4. 英文摘要(English Abstract?
5. 中文关键词(Chinese Keywords?
6. 英文关键词(English Keywords?
7. 正文(Main Text?
8. 参考文献(References?
9. 图表(Figures and Tables?
10. 利益冲突(Conflict of Interest?
11. 伦理审查(Ethics Approval?
**方法学评估(3部分):**
1. 科研设计(Research Design?
2. 统计方法(Statistical Methods?
3. 统计分析(Statistical Analysis?
#### 2.2 数据库结?
**ReviewTask表(当前在`public` schema,需迁移到`rvw_schema`):**
```prisma
model ReviewTask {
id String @id @default(uuid())
userId String
fileName String
fileSize BigInt
extractedText String?
wordCount Int?
status String // pending/extracting/reviewing_editorial/reviewing_methodology/completed/failed
modelUsed String
overallScore Float?
editorialReview Json? // 稿约规范性评估结?
methodologyReview Json? // 方法学评估结?
errorMessage String?
startedAt DateTime?
completedAt DateTime?
durationSeconds Int?
createdAt DateTime @default(now())
}
```
#### 2.3 后端代码结构
**服务层(`backend/src/legacy/services/reviewService.ts`):** 453?
```typescript
reviewManuscript() // 主入口(异步执行?
processReviewTask() // 后台处理任务
reviewEditorialStandards() // 稿约规范性评?
reviewMethodology() // 方法学评?
parseJSONFromLLMResponse() // 容错JSON解析
getReviewTask() // 获取任务状?
getReviewTasks() // 获取任务列表(分页)
deleteReviewTask() // 删除任务
getReviewReport() // 获取完整报告
```
**Prompt设计(`backend/prompts/`):**
```
review_editorial_system.txt (210?
└── 11个评估维度的详细标准
review_methodology_system.txt (231?
└── 3个部分的评估标准
```
**控制器层(`backend/src/legacy/controllers/reviewController.ts`):** 265?
```typescript
POST /review/upload // 上传稿件并开始审?
GET /review/tasks/:taskId // 获取任务状?
GET /review/tasks/:taskId/report // 获取审查报告
GET /review/tasks // 获取任务列表(分页)
DELETE /review/tasks/:taskId // 删除任务
```
#### 2.4 前端代码结构
**主页面(`frontend/src/pages/ReviewPage.tsx`):** 625?
- 渐变色标题卡?
- 3步流程:上传稿件 ?选择模型 ?开始审?
- 5步进度展示:上传 ?提取文本 ?稿约评估 ?方法学评??生成报告
- 报告展示(Tabs切换?
- 导出功能(PDF生成 + 文本复制?
**组件(`frontend/src/components/review/`):**
```
ScoreCard.tsx // 分数卡片(颜色编码)
EditorialReview.tsx // 稿约规范性评估详?
MethodologyReview.tsx // 方法学评估详?
```
**视觉设计?*
- 渐变色主题:`linear-gradient(135deg, #667eea 0%, #764ba2 100%)`
- 分数颜色编码:≥90优秀(绿)、≥80良好(蓝)、≥70中等(黄)?70需改进(红?
- 拖拽上传支持
- 响应式布局
---
## 🎯 迁移策略
### 迁移原则
1. **保持功能完整?*?00%保留现有功能,不做删?
2. **遵循新架构规?*:符合模块化、Schema隔离、云原生设计
3. **复用平台能力**:使用`common`层的存储、日志、LLM、文档处理服?
4. **渐进式迁?*:先后端再前端,确保每步可测?
5. **保持数据兼容**:数据库表结构平滑迁移,不丢失数?
---
## 📋 迁移任务清单
### Phase 1: PKB个人知识库迁移(优先?
#### Task 1.1:后端代码迁?⏱️ 预计2-3小时
**目标目录?* `backend/src/modules/pkb/`
**迁移步骤?*
1. **创建模块结构** (30分钟)
```bash
backend/src/modules/pkb/
├── README.md # 模块说明
├── controllers/
? ├── knowledgeBaseController.ts # 从legacy迁移
? └── documentController.ts # 从legacy迁移
├── services/
? ├── knowledgeBaseService.ts # 从legacy迁移
? ├── documentService.ts # 从legacy迁移
? └── tokenService.ts # 从legacy迁移
├── routes/
? └── index.ts # 路由注册
└── types/
└── index.ts # 类型定义
```
2. **复制并更新服务层** (60分钟)
- 从`backend/src/legacy/services/`复制文件
- 更新导入路径?
```typescript
// ?旧代?
import { prisma } from '../../config/database.js';
import { difyClient } from '../../common/rag/DifyClient.js';
// ?新代?
import { prisma } from '@/config/database';
import { difyClient } from '@/common/rag/DifyClient';
```
- 使用平台能力?
```typescript
// ?使用storage抽象层(如果需要文件存储)
import { storage } from '@/common/storage';
// ?使用logger(替换console.log?
import { logger } from '@/common/logging';
// ?使用extractionClient(已有)
import { extractionClient } from '@/common/document/ExtractionClient';
```
3. **复制并更新控制器?* (30分钟)
- 从`backend/src/legacy/controllers/`复制文件
- 更新导入路径
- 移除`MOCK_USER_ID`,从`request.user`获取(待实现认证中间件)
4. **创建路由文件** (30分钟)
```typescript
// backend/src/modules/pkb/routes/index.ts
import type { FastifyInstance } from 'fastify';
import * as knowledgeBaseController from '../controllers/knowledgeBaseController';
import * as documentController from '../controllers/documentController';
export default async function pkbRoutes(fastify: FastifyInstance) {
// 知识库管?
fastify.post('/api/v1/pkb/knowledge-bases', knowledgeBaseController.createKnowledgeBase);
fastify.get('/api/v1/pkb/knowledge-bases', knowledgeBaseController.getKnowledgeBases);
fastify.get('/api/v1/pkb/knowledge-bases/:id', knowledgeBaseController.getKnowledgeBaseById);
fastify.put('/api/v1/pkb/knowledge-bases/:id', knowledgeBaseController.updateKnowledgeBase);
fastify.delete('/api/v1/pkb/knowledge-bases/:id', knowledgeBaseController.deleteKnowledgeBase);
fastify.get('/api/v1/pkb/knowledge-bases/:id/search', knowledgeBaseController.searchKnowledgeBase);
fastify.get('/api/v1/pkb/knowledge-bases/:id/stats', knowledgeBaseController.getKnowledgeBaseStats);
fastify.get('/api/v1/pkb/knowledge-bases/:id/document-selection', knowledgeBaseController.getDocumentSelection);
// 文档管理
fastify.post('/api/v1/pkb/knowledge-bases/:kbId/documents', documentController.uploadDocument);
fastify.get('/api/v1/pkb/knowledge-bases/:kbId/documents', documentController.getDocuments);
fastify.get('/api/v1/pkb/documents/:id', documentController.getDocumentById);
fastify.get('/api/v1/pkb/documents/:id/full-text', documentController.getDocumentFullText);
fastify.delete('/api/v1/pkb/documents/:id', documentController.deleteDocument);
fastify.post('/api/v1/pkb/documents/:id/reprocess', documentController.reprocessDocument);
}
```
5. **在主入口注册路由** (10分钟)
```typescript
// backend/src/index.ts
import pkbRoutes from './modules/pkb/routes';
// 注册PKB路由
await fastify.register(pkbRoutes);
```
6. **创建模块README** (20分钟)
```markdown
# PKB 个人知识库模?
## 功能概述
- 知识库CRUD
- 文档上传与管?
- Dify RAG检?
- 批处理任?
## API端点
...
## 数据库Schema
- pkb_schema.knowledge_bases
- pkb_schema.documents
- pkb_schema.batch_tasks
- pkb_schema.batch_results
```
#### Task 1.2:前端代码迁?⏱️ 预计2-3小时
**目标目录?* `frontend-v2/src/modules/pkb/`
**迁移步骤?*
1. **创建模块结构** (30分钟)
```bash
frontend-v2/src/modules/pkb/
├── index.tsx # 模块入口(路由配置)
├── api/
? └── index.ts # API封装
├── pages/
? ├── KnowledgeBasePage.tsx # 知识库列表页
? └── KnowledgeBaseDetail.tsx # 知识库详情页
├── components/
? ├── KnowledgeBaseList.tsx
? ├── CreateKBDialog.tsx
? ├── EditKBDialog.tsx
? ├── DocumentList.tsx
? └── DocumentUpload.tsx
├── hooks/
? └── useKnowledgeBase.ts # 状态管?
└── types/
└── index.ts # 类型定义
```
2. **复制并更新API?* (30分钟)
- 从`frontend/src/api/knowledgeBaseApi.ts`复制
- 更新API路径:`/api/knowledge-bases` ?`/api/v1/pkb/knowledge-bases`
3. **复制并更新组?* (90分钟)
- 从`frontend/src/components/knowledge/`复制所有组?
- 更新导入路径
- 使用新的`request`实例(如果有?
- 保持Ant Design 6.0组件兼容?
4. **复制并更新主页面** (60分钟)
- 从`frontend/src/pages/KnowledgePage.tsx`复制
- 拆分为两个页面:列表?+ 详情页(可选)
- 更新状态管理:Zustand ?React Query或保持Zustand
5. **创建模块入口** (30分钟)
```typescript
// frontend-v2/src/modules/pkb/index.tsx
import { lazy } from 'react';
import { ModuleConfig } from '@/framework/modules/types';
const KnowledgeBasePage = lazy(() => import('./pages/KnowledgeBasePage'));
const pkbModule: ModuleConfig = {
id: 'pkb',
name: '个人知识?,
icon: 'FileTextOutlined',
routes: [
{
path: '/pkb',
element: ,
permission: 'pkb:view',
},
],
};
export default pkbModule;
```
6. **在框架中注册模块** (10分钟)
```typescript
// frontend-v2/src/framework/modules/moduleRegistry.ts
import pkbModule from '@/modules/pkb';
registerModule(pkbModule);
```
#### Task 1.3:数据库Schema验证 ⏱️ 预计30分钟
**检查事项:**
- ?`pkb_schema.knowledge_bases` 表结构完?
- ?`pkb_schema.documents` 表结构完?
- ?`pkb_schema.batch_tasks` 表结构完?
- ?`pkb_schema.batch_results` 表结构完?
- ?外键关系正确
- ?索引齐全
**Prisma Schema已存在,无需修改?*
#### Task 1.4:集成测?⏱️ 预计1小时
**测试清单?*
1. ?创建知识?
2. ?上传文档(PDF/Word?
3. ?文档状态轮?
4. ?语义检?
5. ?删除文档
6. ?删除知识?
7. ?Token计算和智能选择
8. ?批处理任务创建和执行
---
### Phase 2: RVW审稿功能迁移
#### Task 2.1:后端代码迁?⏱️ 预计2-3小时
**目标目录?* `backend/src/modules/rvw/`
**迁移步骤?*
1. **创建模块结构** (30分钟)
```bash
backend/src/modules/rvw/
├── README.md
├── controllers/
? └── reviewController.ts
├── services/
? └── reviewService.ts
├── routes/
? └── index.ts
├── prompts/
? ├── editorial_system.txt # 从backend/prompts/复制
? └── methodology_system.txt # 从backend/prompts/复制
└── types/
└── index.ts
```
2. **复制并更新服务层** (60分钟)
- 从`backend/src/legacy/services/reviewService.ts`复制
- 更新导入路径
- 使用平台能力?
```typescript
import { logger } from '@/common/logging';
import { extractionClient } from '@/common/document/ExtractionClient';
import { LLMFactory } from '@/common/llm/adapters/LLMFactory';
```
- 移动Prompt文件到模块内?
3. **复制并更新控制器?* (30分钟)
- 从`backend/src/legacy/controllers/reviewController.ts`复制
- 更新导入路径
4. **创建路由文件** (30分钟)
```typescript
// backend/src/modules/rvw/routes/index.ts
import type { FastifyInstance } from 'fastify';
import * as reviewController from '../controllers/reviewController';
export default async function rvwRoutes(fastify: FastifyInstance) {
fastify.post('/api/v1/rvw/upload', reviewController.uploadManuscript);
fastify.get('/api/v1/rvw/tasks/:taskId', reviewController.getTaskStatus);
fastify.get('/api/v1/rvw/tasks/:taskId/report', reviewController.getTaskReport);
fastify.get('/api/v1/rvw/tasks', reviewController.getTaskList);
fastify.delete('/api/v1/rvw/tasks/:taskId', reviewController.deleteTask);
}
```
5. **在主入口注册路由** (10分钟)
```typescript
// backend/src/index.ts
import rvwRoutes from './modules/rvw/routes';
await fastify.register(rvwRoutes);
```
#### Task 2.2:数据库Schema迁移 ⏱️ 预计1小时
**当前问题?* `ReviewTask`表在`public` schema,需迁移到`rvw_schema`
**迁移步骤?*
1. **更新Prisma Schema** (20分钟)
```prisma
// backend/prisma/schema.prisma
model ReviewTask {
id String @id @default(uuid())
userId String @map("user_id")
fileName String @map("file_name")
fileSize BigInt @map("file_size")
extractedText String? @map("extracted_text")
wordCount Int? @map("word_count")
status String @default("pending")
modelUsed String @map("model_used")
overallScore Float? @map("overall_score")
editorialReview Json? @map("editorial_review")
methodologyReview Json? @map("methodology_review")
errorMessage String? @map("error_message")
startedAt DateTime? @map("started_at")
completedAt DateTime? @map("completed_at")
durationSeconds Int? @map("duration_seconds")
createdAt DateTime @default(now()) @map("created_at")
@@index([userId], map: "idx_rvw_tasks_user_id")
@@index([status], map: "idx_rvw_tasks_status")
@@index([createdAt], map: "idx_rvw_tasks_created_at")
@@map("review_tasks")
@@schema("rvw_schema") // ?迁移到rvw_schema
}
```
2. **创建迁移脚本** (20分钟)
```sql
-- backend/prisma/migrations/migrate_review_to_rvw_schema.sql
-- 1. 创建rvw_schema(如果不存在?
CREATE SCHEMA IF NOT EXISTS rvw_schema;
-- 2. 在rvw_schema中创建新?
CREATE TABLE rvw_schema.review_tasks (
-- 复制public.ReviewTask表结?
-- 添加蛇形命名(user_id, file_name等)
);
-- 3. 迁移数据
INSERT INTO rvw_schema.review_tasks
SELECT * FROM public."ReviewTask";
-- 4. 创建索引
CREATE INDEX idx_rvw_tasks_user_id ON rvw_schema.review_tasks(user_id);
CREATE INDEX idx_rvw_tasks_status ON rvw_schema.review_tasks(status);
CREATE INDEX idx_rvw_tasks_created_at ON rvw_schema.review_tasks(created_at);
-- 5. 验证数据
SELECT COUNT(*) FROM rvw_schema.review_tasks;
-- 6. 备份后删除旧表(可选)
-- DROP TABLE public."ReviewTask";
```
3. **运行迁移** (20分钟)
```bash
# 生成Prisma Client
cd backend
npx prisma generate
# 运行手动迁移脚本
psql $DATABASE_URL < prisma/migrations/migrate_review_to_rvw_schema.sql
# 验证
npm run test:db
```
#### Task 2.3:前端代码迁?⏱️ 预计2-3小时
**目标目录?* `frontend-v2/src/modules/rvw/`
**迁移步骤?*
1. **创建模块结构** (30分钟)
```bash
frontend-v2/src/modules/rvw/
├── index.tsx
├── api/
? └── index.ts
├── pages/
? ├── ReviewPage.tsx
? └── ReviewList.tsx (可?
├── components/
? ├── ScoreCard.tsx
? ├── EditorialReview.tsx
? └── MethodologyReview.tsx
├── hooks/
? └── useReviewTask.ts
└── types/
└── index.ts
```
2. **复制并更新API?* (30分钟)
- 从`frontend/src/api/reviewApi.ts`复制
- 更新API路径:`/api/review` ?`/api/v1/rvw`
3. **复制并更新组?* (60分钟)
- 从`frontend/src/components/review/`复制所有组?
- 保持视觉设计(渐变色、颜色编码)
4. **复制并更新主页面** (90分钟)
- 从`frontend/src/pages/ReviewPage.tsx`复制
- 保持完整UI流程
- 更新CSS导入(如果需要)
5. **创建模块入口** (30分钟)
```typescript
// frontend-v2/src/modules/rvw/index.tsx
import { lazy } from 'react';
import { ModuleConfig } from '@/framework/modules/types';
const ReviewPage = lazy(() => import('./pages/ReviewPage'));
const rvwModule: ModuleConfig = {
id: 'rvw',
name: '稿件审查',
icon: 'FileTextOutlined',
routes: [
{
path: '/rvw',
element: ,
permission: 'rvw:view',
},
],
};
export default rvwModule;
```
6. **在框架中注册模块** (10分钟)
#### Task 2.4:集成测?⏱️ 预计1小时
**测试清单?*
1. ?上传Word稿件
2. ?状态轮询(5个步骤)
3. ?稿约规范性评估(11项)
4. ?方法学评估(3部分?
5. ?总体评分计算
6. ?报告展示(Tabs切换?
7. ?导出PDF
8. ?复制报告文本
9. ?任务列表查询
10. ?删除任务
---
## 🔧 技术细节补?
### 关键依赖复用
**已有平台能力(可直接复用):**
```typescript
// ?文档提取服务(已有)
import { extractionClient } from '@/common/document/ExtractionClient';
// 支持:PDF、Word、TXT,已集成Python微服?
// ?LLM网关(已有)
import { LLMFactory } from '@/common/llm/adapters/LLMFactory';
// 支持:DeepSeek-V3, Qwen-Max, GPT-5-Pro, Claude-4.5
// ?存储服务(已有)
import { storage } from '@/common/storage';
// 支持:LocalAdapter ?OSSAdapter零代码切?
// ?日志系统(已有)
import { logger } from '@/common/logging';
// ?RAG服务(已有,PKB需要)
import { difyClient } from '@/common/rag/DifyClient';
```
### 外部依赖
**PKB模块额外依赖?*
- ?**Dify平台**:已部署,提供RAG检索能?
- ?**tiktoken**:Token计算,已安装(`@dqbd/tiktoken`?
- ?**Python微服?*:文档提取,已部?
**RVW模块额外依赖?*
- ?**html2canvas**:PDF导出(前端),需安装
- ?**jspdf**:PDF生成(前端),需安装
### API路径规范
**新架构API路径?*
```
PKB模块?
/api/v1/pkb/knowledge-bases/*
/api/v1/pkb/documents/*
RVW模块?
/api/v1/rvw/upload
/api/v1/rvw/tasks/*
```
**旧架构API路径(需向后兼容):**
```
/api/knowledge-bases/* (可保留,重定向到新路径?
/api/review/* (可保留,重定向到新路径?
```
---
## 📝 数据迁移与向后兼?
### PKB模块
- ?**无需数据迁移**:`pkb_schema`已存在且结构完整
- ?**API向后兼容**:保留旧路径`/api/knowledge-bases`,内部转发到新路?
### RVW模块
- ⚠️ **需要数据迁?*:`public.ReviewTask` ?`rvw_schema.review_tasks`
- ⚠️ **字段名调?*:驼峰命??蛇形命名(`userId` ?`user_id`?
- ?**API向后兼容**:保留旧路径`/api/review`,内部转发到新路?
**迁移脚本模板?*
```sql
-- 创建新Schema
CREATE SCHEMA IF NOT EXISTS rvw_schema;
-- 创建新表(蛇形命名)
CREATE TABLE rvw_schema.review_tasks AS
SELECT
id,
"userId" AS user_id,
"fileName" AS file_name,
"fileSize" AS file_size,
"extractedText" AS extracted_text,
"wordCount" AS word_count,
status,
"modelUsed" AS model_used,
"overallScore" AS overall_score,
"editorialReview" AS editorial_review,
"methodologyReview" AS methodology_review,
"errorMessage" AS error_message,
"startedAt" AS started_at,
"completedAt" AS completed_at,
"durationSeconds" AS duration_seconds,
"createdAt" AS created_at
FROM public."ReviewTask";
-- 创建索引
CREATE INDEX idx_rvw_tasks_user_id ON rvw_schema.review_tasks(user_id);
CREATE INDEX idx_rvw_tasks_status ON rvw_schema.review_tasks(status);
CREATE INDEX idx_rvw_tasks_created_at ON rvw_schema.review_tasks(created_at);
```
---
## ?验收标准
### PKB模块迁移完成标准
1. ?后端代码在`backend/src/modules/pkb/`
2. ?前端代码在`frontend-v2/src/modules/pkb/`
3. ?API路径为`/api/v1/pkb/*`
4. ?所有功能测试通过(知识库CRUD、文档上传、检索、批处理?
5. ?前端UI完全迁移(列表、详情、上传、对话框?
6. ?复用平台能力(logger、storage、extractionClient、difyClient?
7. ?文档完整(README.md、API文档?
### RVW模块迁移完成标准
1. ?后端代码在`backend/src/modules/rvw/`
2. ?前端代码在`frontend-v2/src/modules/rvw/`
3. ?API路径为`/api/v1/rvw/*`
4. ?数据已迁移到`rvw_schema.review_tasks`
5. ?所有功能测试通过(上传、评估、报告、导出)
6. ?前端UI完全迁移(上传、进度、报告、导出)
7. ?复用平台能力(logger、extractionClient、LLMFactory?
8. ?Prompt文件在模块内部(`modules/rvw/prompts/`?
---
## 📚 文档更新清单
### 需要更新的文档
1. **系统当前状态与开发指?*
- 文件:`docs/00-系统总体设计/00-系统当前状态与开发指?md`
- 更新:PKB和RVW模块状态从"已完成(旧架构)"改为"?100%(新架构?
2. **模块README创建**
- `backend/src/modules/pkb/README.md`
- `backend/src/modules/rvw/README.md`
3. **前端模块文档**
- `frontend-v2/src/modules/pkb/README.md`
- `frontend-v2/src/modules/rvw/README.md`
4. **API文档更新**
- `docs/04-开发规?04-API路由总览.md`
- 添加PKB和RVW的API端点清单
5. **迁移完成报告**
- 新建:`docs/08-项目管理/PKB和RVW迁移完成报告.md`
- 记录:迁移时间、遇到的问题、解决方案、测试结?
---
## 🎯 总结
### 迁移优势
1. ?**架构统一**:所有模块遵循相同的模块化结?
2. ?**易于维护**:代码组织清晰,职责明确
3. ?**复用平台能力**:减少重复代码,提升代码质量
4. ?**支持独立部署**:每个模块可独立打包、部署、销?
5. ?**Schema隔离**:数据库层面模块独立,降低耦合
### 预计总耗时
- **PKB模块迁移**?-8小时
- **RVW模块迁移**?-9小时(含数据迁移?
- **总计**?3-17小时(约2个工作日?
### 风险评估
- ?**风险?*:功能已100%完成,代码质量高
- ?**测试覆盖**:有完整的手动测试流?
- ?**向后兼容**:保留旧API路径,不影响现有前端
---
**文档维护者:** 技术团?
**最后更新:** 2025-12-28
**下一步:** 执行迁移任务,按TODO清单逐项完成