HaHafeng beb7f7f559 feat(asl): Implement full-text screening core LLM service and validation system (Day 1-3)
Core Components:
- PDFStorageService with Dify/OSS adapters
- LLM12FieldsService with Nougat-first + dual-model + 3-layer JSON parsing
- PromptBuilder for dynamic prompt assembly
- MedicalLogicValidator with 5 rules + fault tolerance
- EvidenceChainValidator for citation integrity
- ConflictDetectionService for dual-model comparison

Prompt Engineering:
- System Prompt (6601 chars, Section-Aware strategy)
- User Prompt template (PICOS context injection)
- JSON Schema (12 fields constraints)
- Cochrane standards (not loaded in MVP)

Key Innovations:
- 3-layer JSON parsing (JSON.parse + json-repair + code block extraction)
- Promise.allSettled for dual-model fault tolerance
- safeGetFieldValue for robust field extraction
- Mixed CN/EN token calculation

Integration Tests:
- integration-test.ts (full test)
- quick-test.ts (quick test)
- cached-result-test.ts (fault tolerance test)

Documentation Updates:
- Development record (Day 2-3 summary)
- Quality assurance strategy (full-text screening)
- Development plan (progress update)
- Module status (v1.1 update)
- Technical debt (10 new items)

Test Results:
- JSON parsing success rate: 100%
- Medical logic validation: 5/5 passed
- Dual-model parallel processing: OK
- Cost per PDF: CNY 0.10

Files: 238 changed, 14383 insertions(+), 32 deletions(-)
Docs: docs/03-涓氬姟妯″潡/ASL-AI鏅鸿兘鏂囩尞/05-寮€鍙戣褰?2025-11-22_Day2-Day3_LLM鏈嶅姟涓庨獙璇佺郴缁熷紑鍙?md
2025-11-22 22:21:12 +08:00

AI科研助手

专注于赋能临床及科研人员的智能化平台

📚 项目文档

📖 文档导航中心

🔗 快速链接

🛠️ 子项目文档

🏗️ 技术栈

前端

  • React 18 + TypeScript
  • Vite
  • TailwindCSS
  • Zustand
  • LobeChat组件

后端

  • Node.js + Fastify + TypeScript
  • Prisma ORM
  • PostgreSQL
  • Redis

第三方服务

  • DifyRAG知识库
  • DeepSeek-V3主力LLM
  • Qwen3备用LLM

核心功能

1. 智能问答系统

  • 基于项目背景的上下文对话
  • 支持@知识库引用
  • 3种对话模式RAG快速检索、全文阅读、批处理

2. 知识库管理

  • 文档上传与管理支持PDF/Word/Txt
  • 智能文本提取Python微服务
  • RAG检索优化top_k=15, chunk_size=1500

3. 批处理模式

  • 批量提取结构化信息3-50个文档
  • 预设模板+自定义Prompt
  • Excel导出

4. 稿件审查功能 新增

  • 双维度智能评估
    • 稿约规范性评估11个标准
    • 方法学评估3个部分20个检查点
  • 完整工作流程
    • Word文档上传.doc/.docx
    • 实时进度展示
    • 详细评估报告
    • PDF导出+文本复制
  • 多模型支持DeepSeek-V3 / Qwen3-72B / Qwen-Long
  • 独立导航入口:左侧菜单"稿件审查"

5. 12个智能体规划中

  • 选题评价智能体(已完成)
  • 其他11个智能体计划中

🚀 快速开始

1. 启动基础服务

# 启动PostgreSQL和Redis
docker-compose up -d

2. 后端开发

cd backend
npm install
npm run dev

3. 前端开发

cd frontend
npm install
npm run dev

📦 目录结构

AIclinicalresearch/
├── frontend/           # 前端项目
├── backend/            # 后端项目
├── docs/               # 项目文档
├── docker-compose.yml  # Docker配置
└── README.md           # 本文件

🔑 环境变量

请参考 .env.example 文件配置环境变量。

📖 开发指南

请查看 开发里程碑 了解详细的开发计划。

📄 License

MIT


🔗 相关链接


当前开发阶段: 里程碑1 - Day 6前端基础架构
开发进度: 50% - 前后端基础架构已完成

Description
No description provided
Readme 76 MiB
Languages
TypeScript 83%
Python 6.2%
JavaScript 3.8%
CSS 3.2%
R 2.5%
Other 1.2%