Files
AIclinicalresearch/docs/02-通用能力层/[AI对接] 通用能力快速上下文.md
HaHafeng 88cc049fb3 feat(asl): Complete Day 5 - Fulltext Screening Backend API Development
- Implement 5 core API endpoints (create task, get progress, get results, update decision, export Excel)
- Add FulltextScreeningController with Zod validation (652 lines)
- Implement ExcelExporter service with 4-sheet report generation (352 lines)
- Register routes under /api/v1/asl/fulltext-screening
- Create 31 REST Client test cases
- Add automated integration test script
- Fix PDF extraction fallback mechanism in LLM12FieldsService
- Update API design documentation to v3.0
- Update development plan to v1.2
- Create Day 5 development record
- Clean up temporary test files
2025-11-23 10:52:07 +08:00

3.7 KiB
Raw Blame History

[AI对接] 通用能力快速上下文

阅读时间: 2-3分钟 | Token消耗 ~1500 tokens
层级: L1 | 前置阅读: 00-系统总体设计/[AI对接] 快速上下文.md


📋 通用能力层定位

通用能力层是跨业务模块共享的核心技术能力,是业务逻辑的基础。

核心原则:

  • 可复用(多个业务模块共享)
  • 业务相关(包含领域知识)
  • 独立部署(可以独立为微服务)
  • 高内聚(每个能力职责单一)

🎯 5个核心能力

1. LLM大模型网关 最高优先级

复用率: 71% (5个模块依赖)

依赖模块:

  • AIAAI智能问答
  • ASLAI智能文献
  • PKB个人知识库
  • DC数据清洗
  • RVW稿件审查

核心价值:

商业模式的技术基础!

功能1根据用户版本选择模型
- 专业版 → DeepSeek¥1/百万)
- 高级版 → DeepSeek + Qwen3
- 旗舰版 → 全部模型

功能2成本控制
- 统一监控所有LLM调用
- 超出配额自动限流
- 按版本计费

功能3统一调用接口
- 屏蔽不同LLM API差异
- 流式/非流式统一处理

状态: 待实现
优先级: P0必须在ASL模块开发前完成
预计时间: 3-5天


2. 文档处理引擎

复用率: 86% (6个模块依赖)

核心功能:

  • PDF提取Nougat + PyMuPDF
  • Docx提取Mammoth
  • Txt提取多编码
  • Excel处理

状态: 已实现Python微服务
位置: extraction_service/


3. RAG引擎

复用率: 43% (3个模块依赖)

核心功能:

  • 向量化存储Embedding
  • 语义检索Semantic Search
  • RAG问答
  • 智能引用100%准确溯源)

状态: 已实现基于Dify

优化成果:

  • 检索覆盖率从5%提升到40-50%8-10倍

4. 数据ETL引擎

复用率: 29% (2个模块依赖)

依赖模块:

  • DC数据清洗
  • SSA智能统计

核心功能:

  • Excel多表JOIN
  • 数据清洗
  • 数据转换

技术方案:

  • 云端版Polars性能极高
  • 单机版SQLite内存友好

状态: 待实现


5. 医学NLP引擎

复用率: 14% (1个模块依赖)

依赖模块:

  • DC数据清洗 - 病例NER提取

核心功能:

  • 医学实体识别疾病、药物、TNM分期
  • 医学术语标准化

技术方案:

  • 云端版LLM API高准确率
  • 单机版spaCy隐私优先

状态: 待实现


📊 优先级排序

能力 复用率 优先级 状态 原因
LLM网关 71% P0 5个模块依赖商业模式基础
文档处理 86% - 已实现,需要增强
RAG引擎 43% - 已实现,需要优化
ETL引擎 29% P2 DC模块开发时再实现
医学NLP 14% P2 DC模块开发时再实现

⚠️ 关键提醒

LLM网关必须优先实现

  • 5个模块依赖71%
  • ASL模块开发的前置条件
  • 商业模式的技术基础

预计时间: 3-5天
建议: ASL模块Week 1同步开发


🔗 快速导航

详细设计文档:


最后更新: 2025-11-06
维护人: 技术架构师