Files
AIclinicalresearch/docs/00-系统总体设计/00-系统当前状态与开发指南.md
HaHafeng 2c7ed94161 feat(dc/tool-c): 完成前端基础框架(Day 4 MVP)
核心功能:
- 新增Tool C主入口(index.tsx, 258行):状态管理+布局
- 新增Header组件(91行):顶栏+返回按钮+导出
- 新增Toolbar组件(104行):7个快捷按钮+搜索框
- 新增DataGrid组件(111行):AG Grid Community集成
- 新增Sidebar组件(149行):右侧栏骨架版
- 新增API封装(toolC.ts, 218行):8个API方法
- 新增类型定义(types/index.ts, 62行)

AG Grid集成:
- 安装ag-grid-community + ag-grid-react
- Excel风格表格渲染
- 列排序、过滤、调整宽度
- 缺失值高亮显示(红色斜体)
- 数值右对齐
- 自定义Emerald绿色主题(ag-grid-custom.css, 113行)
- 虚拟滚动支持大数据

路由配置:
- 更新dc/index.tsx:新增ToolCModule懒加载
- 更新Portal.tsx:Tool C状态改为ready
- 路径:/data-cleaning/tool-c

API封装(8个方法):
- uploadFile(上传CSV/Excel)
- getSession(获取Session元数据)
- getPreviewData(获取预览数据)
- updateHeartbeat(延长10分钟)
- generateCode(生成代码,不执行)
- executeCode(执行代码)
- processMessage(生成+执行,一步到位)核心API
- getChatHistory(对话历史)

文档更新:
- 新增Day 4前端基础完成总结(213行)
- 更新工具C当前状态文档
- 更新TODO清单(Day 1-4标记完成)
- 更新系统总体设计文档

测试数据准备:
- cqol-demo.csv(21列x313行真实医疗数据)
- G鼓膜穿孔数据.xlsx(备用)

Day 5待完成:
- MessageItem组件(消息渲染)
- CodeBlock组件(Prism.js代码高亮)
- InputArea组件(输入框交互)
- InsightsPanel组件(数据洞察)
- 完善Sidebar(完整Chat交互)
- 端到端测试

影响范围:
- frontend-v2/src/modules/dc/pages/tool-c/*(新增11个文件)
- frontend-v2/src/modules/dc/api/toolC.ts(新增)
- frontend-v2/src/modules/dc/index.tsx(更新路由)
- frontend-v2/src/modules/dc/pages/Portal.tsx(启用Tool C)
- docs/03-业务模块/DC-数据清洗整理/*(文档更新)
- package.json(新增依赖)

Breaking Changes: 无

总代码行数:+1106行(前端基础框架)

Refs: #Tool-C-Day4
2025-12-07 17:40:07 +08:00

15 KiB
Raw Blame History

AIclinicalresearch 系统当前状态与开发指南

文档版本: v1.0
创建日期: 2025-11-28
维护者: 开发团队
最后更新: 2025-11-28
文档目的: 快速了解系统当前状态为新AI助手提供上下文


📋 快速导航

🎯 如果您是新的AI助手,请优先阅读:

  1. 本文档5分钟 - 了解系统当前状态
  2. 前后端模块化架构设计-V2.md15分钟 - 了解技术架构
  3. [AI对接] 快速上下文.md10分钟 - 快速上手指南

🎯 项目概述

项目名称

壹证循科技 - AI临床研究平台

核心定位

一个覆盖临床科研全生命周期、AI驱动的一站式智能科研平台

目标用户

  • 主要用户:临床医生、研究人员(三甲医院)
  • 次要用户:医院科研管理科室、信息中心
  • 商业模式云端SaaS + 私有化部署 + 单机版

📊 业务模块概览7大核心功能

模块代号 模块名称 核心功能 商业价值 当前状态 优先级
AIA AI智能问答 10+专业智能体选题评价、PICO梳理等 已完成 P1
PKB 个人知识库 RAG问答、私人文献库 已完成 P1
ASL AI智能文献 文献筛选、Meta分析、证据图谱 🚧 正在开发 P0
DC 数据清洗整理 ETL + 医学NER百万行级数据 🚧 Tool B完成 + Tool C Day 4完成 P0
SSA 智能统计分析 队列/预测模型/RCT分析 📋 规划中 P2
ST 统计分析工具 100+轻量化统计工具 📋 规划中 P2
RVW 稿件审查系统 方法学评估、审稿流程 📋 规划中 P3

🏗️ 技术架构(三层设计)

架构总览

┌─────────────────────────────────────────────────────────┐
│              业务模块层 (Product Layer)                    │
│  AIA | PKB | ASL | DC | SSA | ST | RVW                  │
│  ✅    ✅    🚧   🚧   📋   📋   📋                        │
└─────────────────────────────────────────────────────────┘
                      ↓ 依赖
┌─────────────────────────────────────────────────────────┐
│             通用能力层 (Capability Layer)                 │
│  LLM网关 | 文档处理 | RAG引擎 | ETL引擎 | 医学NLP        │
│  ✅       ✅        ✅       🚧       📋                   │
└─────────────────────────────────────────────────────────┘
                      ↓ 依赖
┌─────────────────────────────────────────────────────────┐
│              平台基础层 (Platform Layer)                  │
│  存储 | 日志 | 缓存 | 任务 | 健康检查 | 监控 | 数据库连接池 │
│  ✅    ✅    ✅    ✅    ✅        ✅    ✅                │
└─────────────────────────────────────────────────────────┘

技术栈

前端

  • React 19 + TypeScript 5 + Vite 6
  • Ant Design 5 + TailwindCSS 3
  • React Query v5 + React Router DOM v6
  • 架构frontend-v2模块化顶部导航

后端

  • Fastify v4 (Node.js 22)
  • Prisma 6 (10个Schema隔离)
  • LLMDeepSeek-V3, Qwen-Max, GPT-5-Pro, Claude-4.5
  • 架构增量演进legacy + common + modules

数据库

  • PostgreSQL 16
  • 10个Schema隔离platform/aia/pkb/asl/dc/ssa/st/rvw/admin/common

云原生部署

  • 阿里云 SAE (Serverless 应用引擎)
  • RDS (PostgreSQL) + OSS (对象存储) + Redis (可选)

🚀 当前开发状态2025-12-03

已完成模块

1. 平台基础层2025-11-17完成

  • 存储服务LocalAdapter ↔ OSSAdapter
  • 日志系统Winston + 结构化JSON
  • 缓存服务Memory ↔ Redis
  • 异步任务MemoryQueue ↔ DatabaseQueue
  • 健康检查Liveness + Readiness
  • 监控指标(数据库连接/内存/API
  • 数据库连接池Serverless优化
  • 100%测试通过

2. AIA模块 - AI智能问答已完成

  • 10个专业智能体
  • 流式对话 + 非流式对话
  • 知识库模式RAG检索
  • 批处理模式
  • 状态:生产就绪

3. PKB模块 - 个人知识库(已完成)

  • 知识库CRUD
  • 文档上传PDF/Word/TXT/MD
  • RAG问答
  • 批处理任务
  • 状态:生产就绪

🚧 正在开发模块

4. ASL模块 - AI智能文献正在开发

开发进度

  • 标题摘要初筛MVP:完整流程(设置→启动→审核→结果→导出)
  • 全文复筛后端LLM服务、数据库、批处理、APIDay 2-5完成
  • 🚧 全文复筛前端UI4个核心页面Day 6-8预计2.5天)

核心功能

  • 双模型并行筛选DeepSeek-V3 + Qwen-Max
  • PICOS标准判断
  • 12字段结构化提取全文复筛
  • 医学逻辑验证 + 证据链验证
  • Excel批量导出

技术亮点

  • Nougat优先 + PyMuPDF降级PDF提取
  • 3层JSON解析容错机制
  • 冲突检测与人工复核
  • 云原生存储(零文件落盘)

详细文档ASL模块当前状态

5. DC模块 - 数据清洗整理(后端完成,前端待开发)

⚠️ 代码丢失事件2025-11-28

  • 2025-11-27开发的代码因Cursor缓存丢失而完全消失
  • 2025-11-28基于设计文档完整重建后端代码
  • 已Git提交保护不会再丢失

开发进度

  • Tool B后端100%完成重建完成1,658行代码
    • 4个核心服务HealthCheck、Template、DualModel、Conflict
    • 1个控制器6个API端点
    • 路由集成(/api/v1/dc/tool-b
    • Prisma Schema4个表
    • 100%云原生(复用平台能力)
  • Tool B前端0%有V4原型设计未实现
  • ⚠️ 数据库表:未确认创建(需执行npx prisma db push
  • Tool A:未开发
  • Tool C:未开发
  • Portal:未开发

核心功能Tool B

  • 双模型并发提取DeepSeek-V3 + Qwen-Max
  • 自动冲突检测(字段级对比)
  • Excel健康检查空值率、Token估算、拦截策略
  • 预设模板系统(肺癌、糖尿病、高血压)

技术亮点

  • Excel内存处理零落盘云原生
  • 双模型交叉验证减少AI幻觉
  • 3层JSON解析容错机制
  • 复用LLMFactory、storage、cache、jobQueue

当前问题

  • 🔴 数据库表未确认存在测试前必须执行db push
  • 🔴 前端完全未开发预计2-3天工作量
  • 🟡 后端未经真实API测试

详细文档DC模块当前状态


📁 项目结构概览

AIclinicalresearch/
├── frontend-v2/              # 🌐 前端React 19 + TS
│   └── src/
│       ├── framework/        # 框架层(布局、路由、权限)
│       ├── modules/          # 业务模块
│       │   ├── asl/          # ✅ AI智能文献
│       │   ├── aia/          # ✅ AI智能问答
│       │   ├── pkb/          # ✅ 个人知识库
│       │   ├── dc/           # 🚧 数据清洗(开发中)
│       │   └── ...
│       └── shared/           # 共享组件和工具
│
├── backend/                  # ⚙️ 后端Fastify + Prisma
│   └── src/
│       ├── common/           # ⭐ 平台基础设施(云原生)
│       │   ├── storage/      # 存储抽象层
│       │   ├── logging/      # 日志系统
│       │   ├── cache/        # 缓存服务
│       │   ├── jobs/         # 异步任务
│       │   └── ...
│       ├── legacy/           # 🔸 现有业务代码(稳定)
│       └── modules/          # 🌟 新架构模块
│           ├── asl/          # ✅ AI智能文献
│           └── dc/           # 🚧 数据清洗(开发中)
│
├── docs/                     # 📚 文档体系
│   ├── 00-系统总体设计/      # 架构设计
│   ├── 01-平台基础层/        # 平台能力
│   ├── 02-通用能力层/        # LLM、RAG等
│   ├── 03-业务模块/          # 各模块文档
│   ├── 04-开发规范/          # 云原生规范等
│   └── 08-项目管理/          # 计划和进度
│
└── prisma/
    └── schema.prisma         # 10个Schema定义

🎯 核心设计原则

1. 云原生架构 ☁️

  • 无状态应用:不依赖本地文件系统
  • 存储抽象层:适配器模式,零代码环境切换
  • 异步任务避免Serverless超时30秒
  • 数据库连接池:防止连接数耗尽
  • 详细规范云原生开发规范 必读

2. 模块化与独立部署 🔧

  • 前后端分离:每个模块前后端完全独立
  • Schema隔离数据库层面模块隔离10个Schema
  • 路由独立每个模块有独立的API路由前缀
  • 支持独立销售:任何模块都可独立打包

3. 商业模式灵活性 💰

  • 4种部署形态云端SaaS、私有化部署、单机版、混合部署
  • 多版本支持:专业版/高级版/旗舰版Feature Flag控制
  • AI成本可控动态切换LLM模型
  • 模块化售卖:任何模块都可独立销售

4. 渐进式演进 📈

  • 新旧并存Frontend-v2+ Frontend旧保留
  • 增量改造Legacy模块保持稳定新模块标准化
  • Just-in-time:聚焦当前,架构预留,避免过度设计

📅 开发时间线

时间 阶段 主要成果
2025-11-12 Week 1 数据库Schema隔离10个Schema
2025-11-13~14 Week 2 前端模块化架构 + 后端分层
2025-11-17 Week 2+ 平台基础设施8个核心模块
2025-11-18~21 Week 3~4 ASL标题摘要初筛MVP
2025-11-22~23 ASL Day 2-5 ASL全文复筛后端完成
2025-11-26~27 DC Day 2-3 DC工具B健康检查+模板管理
2025-11-28 当前 🚧 ASL全文复筛前端 + DC工具B开发

🎯 下一步计划

短期1-2周

  1. ASL全文复筛前端Day 6-8

    • 4个核心页面设置、进度、工作台、结果
    • PDF上传和预览功能
    • 双模型判断对比UI
    • 实时进度监控
  2. DC工具B完成Day 4-7

    • ExtractionService实现
    • 批量提取API
    • 前端集成和测试

中期1-2月

  1. DC模块完整实现工具A、工具C、Portal
  2. ASL模块优化Prompt优化、并发处理
  3. LLM网关统一抽取

长期3月+

  1. SSA模块智能统计分析
  2. ST模块统计分析工具
  3. RVW模块稿件审查系统

📚 重要文档索引

🎯 必读文档新AI助手

  1. 本文档 - 系统当前状态
  2. 前后端模块化架构设计-V2.md - 架构总纲
  3. 云原生开发规范.md - 开发规范(必读)
  4. 01-系统架构分层设计.md - 三层架构详解
  5. 09-总体需求文档(PRD).md - 产品需求

🚀 当前开发相关

🏗️ 架构设计


🔧 开发环境

环境要求

Node.js: v22.18.0+
PostgreSQL: 16+
npm: 10+

快速启动

后端

cd backend
npm install
npx prisma generate
npm run dev  # http://localhost:3001

前端

cd frontend-v2
npm install
npm run dev  # http://localhost:3000

环境变量配置

参考:环境配置指南


⚠️ 重要注意事项

对新AI助手

  1. 优先阅读云原生开发规范:所有代码必须遵守
  2. 使用平台基础设施:不要重复实现存储、日志、缓存等
  3. 遵循Schema隔离每个模块的表必须在对应的Schema中
  4. 查看最新开发记录:了解当前开发状态和已知问题

常见陷阱

  1. 不要在业务模块中自己实现存储:使用 import { storage } from '@/common/storage'
  2. 不要硬编码配置:使用环境变量
  3. 不要依赖本地文件系统使用OSS或内存处理
  4. 不要创建新的Prisma实例:使用全局 prisma 实例

📊 项目统计

代码量

  • 前端:约 15,000 行TypeScript + TSX
  • 后端:约 20,000 行TypeScript
  • 文档:约 50,000 行Markdown
  • 总计:约 85,000 行

模块完成度

  • 已完成AIA100%、PKB100%、平台基础层100%
  • 🚧 开发中ASL80%、DC30%
  • 📋 未开始SSA、ST、RVW

测试覆盖率

  • 平台基础层100%8/8模块全部通过
  • AIA模块:手动测试通过
  • PKB模块:手动测试通过
  • ASL模块部分自动化测试31个REST Client测试用例
  • DC模块:开发中

🌟 技术亮点

  1. 适配器模式:存储/缓存/日志支持本地↔云端零代码切换
  2. 10个Schema一次性完成:架构一次到位
  3. Prisma自动路由Schema迁移后代码无需修改
  4. 4个LLM集成DeepSeek、Qwen、GPT、Claude
  5. 增量演进:新旧并存,降低风险
  6. 云原生就绪为SAE部署做好准备

📞 联系方式

  • 项目负责人:技术架构师
  • 文档维护:开发团队
  • 问题反馈GitHub Issues

文档版本v1.0
最后更新2025-11-28
下次更新ASL全文复筛前端完成 或 DC工具B完成


🎉 祝新的AI助手工作顺利所有信息已梳理完毕可以无缝衔接