Files

HaHafeng 3a4aa9123c feat: Add Personal Center module and UI improvements

- Add ProfilePage with avatar upload, password change, and module status display

- Update logo and favicon for login page and browser tab

- Redirect Data Cleaning module default route to Tool C

- Hide Settings button from top navigation for MVP

- Add avatar display in top navigation bar with refresh sync

- Add Prompt knowledge base integration development plan docs

2026-01-28 18:18:09 +08:00

19 KiB

Raw Blame History

Prompt 知识库集成开发计划

版本： v1.1
创建日期： 2026-01-28
优先级： P0（核心能力增强）
状态： 📋 规划中
预计工期： 6-7 个工作日
前置依赖： Prompt 管理系统 (已完成)、RAG 引擎 (已完成)

📋 目录

项目概述
需求分析
技术方案
数据库设计
UI 设计
开发任务清单
AIA 智能体配置指南
测试计划
风险与应对

1. 项目概述

1.1 背景

当前 Prompt 管理系统已支持：

✅ 数据库存储与版本管理
✅ 灰度预览（DRAFT/ACTIVE）
✅ 变量渲染（Handlebars）
✅ 三级容灾（数据库→缓存→兜底）

缺失能力： Prompt 无法动态引用外部知识库（如方法学规范、GCP 指南、统计学手册）。

1.2 目标

构建 Prompt + 知识库 集成能力，实现：

🎯 在 Prompt 管理后台配置知识库绑定（非硬编码）
🎯 支持两种注入模式：RAG 检索 和 全量注入
🎯 运行时自动将知识库内容注入到 Prompt 变量中
🎯 为 AIA 10 个智能体配置最佳知识库策略

1.3 核心价值

痛点	解决方案
专家知识只能硬编码到 Prompt	知识库绑定，动态引用
RAG 检索可能遗漏关键内容	支持 FULL 全量注入模式
每个智能体配置分散在代码中	统一后台配置，运营可调整

2. 需求分析

2.1 业务需求

需求方	需求描述	优先级
方法学专家	方法学评审需要完整参考 CONSORT 声明	P0
统计专家	样本量计算需要参考公式手册	P0
产品经理	可在后台配置和调整知识库绑定	P0
运营人员	无需开发即可为新 Prompt 配置知识库	P1

2.2 技术需求

需求	描述
两种注入模式	RAG（向量检索）+ FULL（全量注入）
配置化	在 Prompt 管理后台 UI 配置
变量注入	自动将内容注入到指定 Prompt 变量
缓存优化	FULL 模式需要缓存知识库全文

2.3 已有能力复用

能力	位置	状态
PromptService	`backend/src/common/prompt/`	✅ 可扩展
RAG 引擎	`backend/src/common/rag/`	✅ 可复用
PKB 知识库	`backend/src/modules/pkb/`	✅ 可复用
Prompt 管理 UI	`frontend-v2/src/pages/admin/`	✅ 可扩展

3. 技术方案

3.1 整体架构

┌─────────────────────────────────────────────────────────────────┐
│                    Prompt 管理后台（运营端）                      │
│  ┌─────────────────────────────────────────────────────────┐   │
│  │ Prompt 编辑器                                            │   │
│  │ ┌─────────────────┐  ┌─────────────────────────────┐   │   │
│  │ │ 内容编辑区域     │  │ 🆕 知识库增强配置面板        │   │   │
│  │ │ {{context}}     │  │ ☑️ 启用知识库增强            │   │   │
│  │ │ {{question}}    │  │ 📚 知识库：[CONSORT声明]     │   │   │
│  │ │ ...             │  │ 🔄 模式：FULL / RAG          │   │   │
│  │ └─────────────────┘  │ 📝 注入变量：context         │   │   │
│  │                      └─────────────────────────────┘   │   │
│  └─────────────────────────────────────────────────────────┘   │
└───────────────────────────┬─────────────────────────────────────┘
                            │
                            ▼
┌─────────────────────────────────────────────────────────────────┐
│                  PromptService（增强版）                         │
│                                                                  │
│  get(code, variables, userId, userQuery?)                        │
│       │                                                          │
│       ▼                                                          │
│  ┌──────────────────────────────────────────────────────────┐   │
│  │ 1. 获取 Prompt 模板 + knowledge_config                    │   │
│  │ 2. 检查 knowledge_config.enabled                          │   │
│  │    ├─ 未启用 → 直接渲染返回                               │   │
│  │    └─ 已启用 → 根据 injection_mode 分支处理               │   │
│  │        ├─ FULL → 全量加载知识库文档                       │   │
│  │        └─ RAG  → 向量检索 Top K                           │   │
│  │ 3. 将内容注入 variables[target_variable]                  │   │
│  │ 4. 渲染完整 Prompt 返回                                   │   │
│  └──────────────────────────────────────────────────────────┘   │
└───────────────────────────┬─────────────────────────────────────┘
                            │
              ┌─────────────┴─────────────┐
              │                           │
              ▼                           ▼
┌──────────────────────┐     ┌──────────────────────────────────┐
│ FULL 模式            │     │ RAG 模式                          │
│ DocumentService      │     │ RagEngine                         │
│ - 全量加载文档       │     │ - 向量检索                        │
│ - 缓存优化           │     │ - Top K + 相似度过滤              │
└──────────────────────┘     └──────────────────────────────────┘

3.2 注入模式对比

特性	FULL 全量注入	RAG 向量检索
适用场景	小型核心知识库（<10 篇）	大型知识库（>20 篇）
准确率	⭐⭐⭐⭐⭐ 最高	⭐⭐⭐⭐ 较高
Token 消耗	较多（全文）	较少（片段）
响应速度	略慢（预填充）	较快
典型用例	CONSORT 声明、SPIRIT 清单	ICD-10 编码、文献库

3.3 数据流

用户提问
    │
    ▼
业务模块调用 promptService.get(code, vars, userId, userQuery)
    │
    ▼
┌─────────────────────────────────────────┐
│ PromptService.get()                      │
│                                          │
│ 1. 查询 prompt_templates 获取配置        │
│ 2. 检查 knowledge_config                 │
└─────────────┬───────────────────────────┘
              │
    ┌─────────┴─────────┐
    │                   │
    ▼                   ▼
enabled: false      enabled: true
    │                   │
    ▼                   ▼
直接渲染         判断 injection_mode
                        │
          ┌─────────────┴─────────────┐
          │                           │
          ▼                           ▼
    mode: "FULL"                mode: "RAG"
          │                           │
          ▼                           ▼
    加载知识库全文            向量检索 Top K
    (DocumentService)          (RagEngine)
          │                           │
          └─────────┬─────────────────┘
                    │
                    ▼
        注入到 variables[target_variable]
                    │
                    ▼
            Handlebars 渲染
                    │
                    ▼
              返回完整 Prompt

4. 数据库设计

4.1 Schema 变更

修改表： capability_schema.prompt_templates

model prompt_templates {
  id           Int      @id @default(autoincrement())
  code         String   @unique @db.VarChar(100)
  name         String   @db.VarChar(200)
  description  String?  @db.Text
  module       String   @db.VarChar(50)
  variables    Json?
  model_config Json?    @map("model_config")
  
  // 🆕 知识库配置
  knowledge_config Json?  @map("knowledge_config")
  
  created_at   DateTime  @default(now()) @map("created_at")
  updated_at   DateTime  @updatedAt @map("updated_at")
  
  versions     prompt_versions[]
  
  @@map("prompt_templates")
  @@schema("capability_schema")
}

4.2 knowledge_config 结构

interface KnowledgeConfig {
  enabled: boolean;
  kb_codes: string[];              // 关联的知识库编码
  injection_mode: 'FULL' | 'RAG';
  target_variable: string;         // 默认 'context'
  // RAG 模式配置
  query_field?: string;
  top_k?: number;
  min_score?: number;
}

4.3 系统知识库表（新建）

-- 系统知识库
CREATE TABLE capability_schema.system_knowledge_bases (
  id UUID PRIMARY KEY DEFAULT gen_random_uuid(),
  code VARCHAR(50) UNIQUE NOT NULL,
  name VARCHAR(100) NOT NULL,
  description TEXT,
  category VARCHAR(50),
  document_count INT DEFAULT 0,
  total_tokens INT DEFAULT 0,
  status VARCHAR(20) DEFAULT 'active',
  created_at TIMESTAMP DEFAULT NOW(),
  updated_at TIMESTAMP DEFAULT NOW()
);

-- 知识库文档
CREATE TABLE capability_schema.system_kb_documents (
  id UUID PRIMARY KEY DEFAULT gen_random_uuid(),
  kb_id UUID REFERENCES capability_schema.system_knowledge_bases(id),
  filename VARCHAR(255) NOT NULL,
  file_path VARCHAR(500),
  file_size INT,
  token_count INT DEFAULT 0,
  status VARCHAR(20) DEFAULT 'pending',
  created_at TIMESTAMP DEFAULT NOW()
);

5. UI 设计

5.1 系统知识库管理

入口： 运营管理端 → 系统知识库

功能	说明
知识库列表	查看、搜索、按分类筛选
创建知识库	编码、名称、分类、描述
文档管理	上传/删除文档
状态查看	文档数、Token 数

5.2 Prompt 编辑器（方案 A：右侧独立卡片）

在现有右侧面板新增「📚 知识库增强」卡片：

┌───────────────────────────────────┬─────────────────────────┐
│  📝 Prompt 内容                    │  ⚙️ 配置                 │
│  ┌─────────────────────────────┐ │  模块 / 状态 / 版本      │
│  │ {{context}}                 │ ├─────────────────────────┤
│  │ 你是一位方法学专家...        │ │  📚 知识库增强           │
│  └─────────────────────────────┘ │  ☑️ 启用                  │
│                                   │  知识库: [CONSORT ▼]    │
│  🧪 测试渲染                      │  模式: ● FULL ○ RAG     │
│                                   │  注入变量: [context ▼]  │
│                                   ├─────────────────────────┤
│                                   │  🔤 变量列表             │
└───────────────────────────────────┴─────────────────────────┘

6. 开发任务清单

6.1 总体时间线

Day 1:   数据库设计 + 迁移
Day 2:   系统知识库管理（后端 API）
Day 3:   系统知识库管理（前端页面）
Day 4:   PromptService 增强（FULL/RAG）
Day 5:   Prompt 编辑器 UI（知识库配置卡片）
Day 6:   AIA 智能体配置 + 集成测试
Day 7:   优化 + 文档 + 上线

6.2 详细任务

Phase 1: 数据库（Day 1）

ID	任务	状态
1.1	prompt_templates 添加 knowledge_config 字段	⏳
1.2	创建 system_knowledge_bases 表	⏳
1.3	创建 system_kb_documents 表	⏳
1.4	执行 Prisma 迁移	⏳

Phase 2: 系统知识库管理（Day 2-3）

ID	任务	状态
2.1	知识库 CRUD API	⏳
2.2	文档上传/删除 API	⏳
2.3	文档向量化集成	⏳
2.4	知识库列表页	⏳
2.5	知识库详情页（文档管理）	⏳

Phase 3: PromptService 增强（Day 4）

ID	任务	状态
3.1	扩展 get() 方法支持 knowledge_config	⏳
3.2	实现 FULL 模式（全量加载）	⏳
3.3	实现 RAG 模式（向量检索）	⏳
3.4	添加缓存优化	⏳

Phase 4: 前端 UI（Day 5）

ID	任务	状态
4.1	PromptEditor 新增知识库配置卡片	⏳
4.2	知识库选择器组件	⏳
4.3	注入模式切换	⏳
4.4	保存/加载配置联调	⏳

Phase 5: 联调收尾（Day 6-7）

ID	任务	状态
5.1	配置 AIA 智能体的 knowledge_config	⏳
5.2	端到端测试	⏳
5.3	上线部署	⏳

7. AIA 智能体配置指南

7.1 Phase 1: 选题优化

Prompt Code	智能体	知识库	模式	理由
`AIA_SCIENTIFIC_QUESTION`	科学问题梳理	临床研究方法学导论	FULL	方法学书籍需要全量理解
`AIA_PICO_ANALYSIS`	PICO 梳理	ICD-10/11 编码手册	RAG	编码手册数据量大，需检索
`AIA_TOPIC_EVALUATION`	选题评价	顶级期刊选题指南	FULL	指南内容精简，全量最佳

7.2 Phase 2: 方案设计

Prompt Code	智能体	知识库	模式	理由
`AIA_OUTCOME_DESIGN`	观察指标设计	COMET 核心指标集	RAG	COMET 数据库较大
`AIA_CRF_DESIGN`	CRF 设计	CDISC/CDASH 标准	FULL	字段逻辑需要完整参考
`AIA_PROTOCOL_WRITING`	方案撰写	SPIRIT 2013 声明	FULL	清单必须完整参考
`AIA_SAMPLE_SIZE`	样本量计算	样本量公式手册	FULL	公式手册内容精简

7.3 Phase 3: 方案预评审

Prompt Code	智能体	知识库	模式	理由
`AIA_METHODOLOGY_REVIEW`	方法学评审	CONSORT 2010 声明	FULL	⭐ 必须全量，漏检会导致评审不完整

7.4 Phase 5: 写作助手

Prompt Code	智能体	知识库	模式	理由
`AIA_PAPER_POLISH`	论文润色	-	无	纯语言处理，无需知识库
`AIA_PAPER_TRANSLATE`	论文翻译	-	无	纯翻译任务，无需知识库

8. 测试计划

8.1 单元测试

测试项	用例
PromptService.get()	知识库未启用时正常返回
PromptService.get()	FULL 模式正确加载全文
PromptService.get()	RAG 模式正确检索 Top K
PromptService.get()	知识库不存在时降级处理

8.2 集成测试

场景	步骤	预期
方法学评审	调用 AIA_METHODOLOGY_REVIEW	返回包含 CONSORT 全文的 Prompt
PICO 梳理	输入疾病名称	返回包含相关 ICD 编码的 Prompt
无知识库	调用 AIA_PAPER_POLISH	正常返回，无知识库内容

8.3 效果对比测试

智能体	FULL 模式效果	RAG 模式效果	结论
方法学评审	完整覆盖所有条目	可能遗漏	使用 FULL
PICO 梳理	Token 超限	精准命中	使用 RAG

9. 风险与应对

9.1 技术风险

风险	影响	概率	应对
FULL 模式 Token 超限	请求失败	中	设置 max_tokens 限制，超限警告
RAG 检索不准确	内容遗漏	中	提供 FULL 模式备选
知识库加载慢	用户等待	低	缓存 + 预加载

9.2 业务风险

风险	影响	应对
知识库内容过时	引用错误规范	定期更新机制
配置错误	智能体效果下降	灰度预览 + 测试

9.3 成本分析

模式	典型场景	Token 消耗	成本估算
FULL	5 篇文档，共 5 万 Token	5 万	¥0.05/次
RAG	Top 5 片段，共 5000 Token	5000	¥0.005/次

DeepSeek-V3 输入价格：约 ¥1/百万 Token

📎 附录

A. 相关文档

B. 代码位置

类型	路径
PromptService	`backend/src/common/prompt/prompt.service.ts`
RAG 引擎	`backend/src/common/rag/`
前端编辑器	`frontend-v2/src/pages/admin/PromptEditorPage.tsx`
数据库 Schema	`backend/prisma/schema.prisma`

C. 知识库命名规范

{CATEGORY}_{NAME}_{VERSION}

示例：
- METHODOLOGY_CONSORT_2010
- METHODOLOGY_SPIRIT_2013
- STATISTICS_SAMPLE_SIZE_FORMULAS
- CRF_CDASH_V2

最后更新：2026-01-28

19 KiB Raw Blame History Unescape Escape