Files
AIclinicalresearch/docs/09-架构实施
HaHafeng 40c2f8e148 feat(rag): Complete RAG engine implementation with pgvector
Major Features:
- Created ekb_schema (13th schema) with 3 tables: KB/Document/Chunk
- Implemented EmbeddingService (text-embedding-v4, 1024-dim vectors)
- Implemented ChunkService (smart Markdown chunking)
- Implemented VectorSearchService (multi-query + hybrid search)
- Implemented RerankService (qwen3-rerank)
- Integrated DeepSeek V3 QueryRewriter for cross-language search
- Python service: Added pymupdf4llm for PDF-to-Markdown conversion
- PKB: Dual-mode adapter (pgvector/dify/hybrid)

Architecture:
- Brain-Hand Model: Business layer (DeepSeek) + Engine layer (pgvector)
- Cross-language support: Chinese query matches English documents
- Small Embedding (1024) + Strong Reranker strategy

Performance:
- End-to-end latency: 2.5s
- Cost per query: 0.0025 RMB
- Accuracy improvement: +20.5% (cross-language)

Tests:
- test-embedding-service.ts: Vector embedding verified
- test-rag-e2e.ts: Full pipeline tested
- test-rerank.ts: Rerank quality validated
- test-query-rewrite.ts: Cross-language search verified
- test-pdf-ingest.ts: Real PDF document tested (Dongen 2003.pdf)

Documentation:
- Added 05-RAG-Engine-User-Guide.md
- Added 02-Document-Processing-User-Guide.md
- Updated system status documentation

Status: Production ready
2026-01-21 20:24:29 +08:00
..

架构实施

文档定位: 架构演进、技术改造、工程实践
适用范围: 技术架构师、技术负责人


📋 目录结构

09-架构实施/
  ├── 02-数据库连接配置.md       # ✅ Schema隔离的数据库配置
  ├── migration-scripts/         # ⏳ Schema迁移SQL脚本Week 1创建
  ├── 01-Monorepo架构设计/      # ⏳ Monorepo转换方案
  ├── 02-产品打包方案/          # ⏳ 独立产品打包流程
  └── 03-微服务拆分/            # ⏳ 微服务拆分策略

🎯 核心内容

1. Monorepo架构设计

  • Monorepo总体设计
  • 包管理策略pnpm workspaces
  • 代码共享与复用
  • 构建和部署

2. 产品打包方案

  • 独立产品打包流程
  • 依赖管理
  • 构建脚本
  • 版本管理

3. 微服务拆分

  • 拆分策略和时机
  • 服务间通信
  • API网关配置
  • 数据迁移

📅 实施计划

阶段一:模块化单体(当前)

  • 严格代码隔离
  • Schema隔离逻辑
  • 模块化设计

阶段二首次拆分6-18个月

  • Monorepo转换
  • Schema物理隔离
  • 拆分独立系统RVW
  • 引入API网关

阶段三全面微服务18个月+

  • 所有模块独立部署
  • K8s编排
  • 服务网格

📚 快速导航

当前实施中Week 1

  1. 数据库连接配置 - Schema隔离迁移配置
  2. 迁移SQL脚本 - Week 1创建

未来实施

  1. Monorepo架构设计 - 待规划
  2. 产品打包方案 - 待规划
  3. 微服务拆分 - 待规划

🔗 相关文档


最后更新: 2025-11-06
维护人: 技术架构师