Files
AIclinicalresearch/docs/03-业务模块/RVW-稿件审查系统/00-模块当前状态与开发指南.md
HaHafeng ba464082cb feat(core): finalize rvw stability updates and pending module changes
Summary:
- Harden RVW prompt protocol handling and methodology review flow with 20-checkpoint coverage, divide-and-conquer execution, and timeout tuning
- Update RVW frontend methodology report rendering to show real structured outputs and grouped checkpoint sections
- Include pending backend/frontend updates across IIT admin, SSA, extraction forensics, and related integration files
- Sync system and RVW status documentation, deployment checklist, and RVW architecture/plan docs

Validation:
- Verified lint diagnostics for touched RVW backend/frontend files show no new errors
- Kept backup dump files and local test artifacts untracked

Made-with: Cursor
2026-03-14 00:00:04 +08:00

22 KiB
Raw Blame History

RVW稿件审查模块 - 当前状态与开发指南

文档版本: v6.2
创建日期: 2026-01-07
最后更新: 2026-03-13
维护者: 开发团队
当前状态: 🚀 V3.0.2 "方法学稳定性增强" 进行中(分治并行 + 20检查点覆盖 + 展示口径收敛)
文档目的: 快速了解RVW模块状态为新AI助手提供上下文

🎉 V3.0 进展2026-03-07

  • LLM 数据核查DataForensicsSkill 增加 LLM 验证通道,规则验证兜底,独立 60s 超时
  • 临床专业评估:新增 ClinicalAssessmentSkill基于 FINER 标准的研究选题系统评估
  • PromptService 集成RVW_DATA_VALIDATION + RVW_CLINICAL 两个 Prompt 可在运营管理端配置
  • 稳定性增强SkillExecutor 使用 Promise.allSettled 实现并行故障隔离
  • 部分完成支持:新增 partial_completed 状态 + errorDetails 字段,部分模块失败仍展示成功结果
  • 前端 4 Tab 报告:稿约规范性 / 方法学 / 数据验证 / 临床评估Word 导出全覆盖

V3.0.1 增强2026-03-10

  • 4模块受控并行DataForensics 与 Editorial/Methodology/Clinical 同组并行,maxConcurrency=4 控制并发上限
  • 增量结果持久化:每个 Skill 完成即写入任务中间结果,getTaskDetail 返回模块级 reviewProgress
  • 先出先看TaskDetail 在审查中即可展示已完成模块(无需等待全流程结束)
  • Word 导出修复:补齐“数据验证”章节,导出汇总 + 表格明细 + 该表问题列表

🆕 V3.0.2 进展2026-03-13

  • 方法学 Prompt 动静分离收敛:业务提示词继续走运营管理端,系统协议负责结构化输出
  • 20检查点结构化增强:方法学结果新增 checkpointsid 1-20状态与发现可追踪
  • 方法学分治并行评估A/B/C:按 1-9 / 10-14 / 15-20 三段并行,降低整包超时概率
  • 规则汇总器合并结果:统一生成 overall_score/summary/conclusion/checkpoints/parts,并保留降级兜底
  • 前端展示口径统一:方法学报告按“三大项->检查点”展示去除重复占位文案并显示真实LLM内容

V2.0 进展回顾:

  • L1 算术验证 + L2 统计验证 + L2.5 一致性取证
  • Skills 核心框架types, registry, executor, profile
  • DataForensicsSkill + EditorialSkill + MethodologySkill
  • ReviewWorker 改造 + 前端数据验证 Tab

📊 模块概览

基本信息

项目 信息
模块名称 RVW - 稿件审查系统 (Review)
模块定位 智能期刊审稿辅助系统(可独立销售)
商业价值 极高
独立性 极高(用户群完全不同)
目标用户 期刊初审编辑
开发状态 🚀 V3.0.2 进行中:方法学分治并行 + 20检查点覆盖展示 + 超时优化

核心目标

打造一个**"开箱即用"**的智能审稿工具。编辑上传稿件,系统自动运行多维检查(规范性+方法学+数据验证+临床评估),输出可供参考的审稿报告。

核心指标:上传到出报告 < 3分钟4模块并行规范性问题检出率 > 80%

功能规格

核心AI能力已完成

  1. 稿约规范性评估11项标准

    • 文题字数、摘要结构、参考文献、图片DPI等
    • 基于《中华医学超声杂志》稿约标准
  2. 方法学评估3部分20个检查点

    • 科研设计评估9个检查点
    • 统计学方法描述评估5个检查点
    • 统计分析评估6个检查点
  3. 数据验证V2.0 规则 + V3.0 LLM 双通道)

    • L1 算术验证:行列加总、百分比计算
    • L2 统计验证CI↔P 一致性、T检验、卡方检验
    • L2.5 一致性取证SE三角验证、SD>Mean检查
    • LLM 智能核查:批量表格发给 LLM 核查(独立 60s 超时,失败降级为纯规则验证)
  4. 临床专业评估V3.0 新增)

    • 基于 FINER 标准(可行性/创新性/伦理性/相关性)
    • 研究问题明确性评估PICO 完整性)
    • 创新性 + 临床价值 + 科学性 + 可行性多维分析
    • Prompt 可在运营管理端配置RVW_CLINICAL
  5. 综合评分 + PICO提取

    • 规范性分数0-100
    • 方法学状态(🔴错误 🟡存疑 🟢通过)
    • PICO结构化提取P/I/C/O

交互功能( 已完成)

功能 旧版本 新版本 状态
单文件上传 已完成
批量上传 已完成
审稿工作台(宽表) 已完成
智能体选择 自动 用户可选 已完成
批量操作 已完成
状态筛选 已完成
历史归档 ⏸️ 数据库已支持UI暂缓
系统设置 ⏸️ 暂不开发
登录页面 ⏸️ ⏸️ 复用平台登录
PICO卡片 ⏸️ 数据库已支持UI暂缓

🏗️ 架构状态

已完成迁移Modules

后端(✅ 已完成):
backend/src/modules/rvw/
├── routes/index.ts                  # v2 API路由/api/v2/rvw
├── controllers/reviewController.ts  # 控制器(含批量操作、智能体选择)
├── services/
│   ├── reviewService.ts             # 核心服务(任务创建、执行)
│   ├── editorialService.ts          # 稿约规范性评估
│   ├── methodologyService.ts        # 方法学评估
│   ├── clinicalService.ts           # 🆕 V3.0 临床专业评估服务
│   └── utils.ts                     # 工具函数
├── workers/
│   └── reviewWorker.ts              # pg-boss异步任务处理V2.0 Skills集成 + V3.0 partial_completed + V3.0.1 增量落库)
├── skills/                          # V2.0 Skills 架构
│   ├── core/                        # 核心框架types, registry, executor[allSettled]等)
│   ├── library/                     # Skill 实现Forensics[+LLM], Editorial, Methodology, 🆕Clinical
│   └── index.ts                     # 模块入口
├── types/index.ts                   # TypeScript类型定义含 partial_completed 状态)
└── __tests__/                       # API测试脚本

前端(✅ 已完成):
frontend-v2/src/modules/rvw/
├── index.tsx                        # 模块入口
├── api/index.ts                     # API接口
├── types/index.ts                   # 类型定义
├── styles/index.css                 # 样式文件
├── pages/
│   └── Dashboard.tsx                # 审稿工作台(任务列表、筛选)
└── components/
    ├── Header.tsx                   # 页头(上传按钮)
    ├── Sidebar.tsx                  # 侧边栏导航
    ├── TaskTable.tsx                # 任务列表表格(支持 partial_completed 状态)
    ├── TaskDetail.tsx               # 任务详情(进度条+增量展示+Word导出+部分完成警告)
    ├── EditorialReport.tsx          # 稿约规范性报告
    ├── MethodologyReport.tsx        # 方法学评估报告
    ├── ForensicsReport.tsx          # 数据验证报告(含 LLM 核查结果)
    ├── ClinicalReport.tsx           # 🆕 V3.0 临床专业评估报告
    ├── AgentModal.tsx               # 智能体选择弹窗4 个维度)
    └── ScoreRing.tsx                # 评分环组件

旧版本(保留兼容):
backend/src/legacy/
├── routes/reviewRoutes.ts           # v1 API路由保留
├── controllers/reviewController.ts
└── services/reviewService.ts

Prompt文件 + PromptService 数据库双通道):
backend/prompts/
├── review_editorial_system.txt      # 稿约评估266行
└── review_methodology_system.txt    # 方法学评估257行
数据库 prompt_templates 表(运营管理端可配置):
├── RVW_DATA_VALIDATION              # 🆕 V3.0 数据验证 LLM 核查 Prompt
└── RVW_CLINICAL                     # 🆕 V3.0 临床专业评估 Prompt

数据库(✅ 已完成):
- ReviewTask表已添加新字段selectedAgents, editorialScore, methodologyScore, methodologyStatus, picoExtract, isArchived, archivedAt
- 🆕 V3.0 新增 error_details JSONB 字段Skill 级失败详情,支持 partial_completed 状态)
- ✅ Schema已迁移到 rvw_schema2026-01-10完成

📋 开发进度

Phase 任务 状态 完成日期
Phase 1 后端模块迁移与扩展 已完成 2026-01-07
Phase 2 数据库字段扩展 已完成 2026-01-07
Phase 3 前端重构frontend-v2 已完成 2026-01-07
Phase 4 集成测试与Bug修复 已完成 2026-01-10
Phase 5 报告导出Word 已完成 2026-01-10
Phase 6 Schema隔离迁移 已完成 2026-01-10
Phase 7 系统设置与归档 ⏸️ 暂缓 -
总计 - 95% -

Phase 1-5 完成内容

后端Phase 1

  • 创建 backend/src/modules/rvw/ 模块结构
  • 迁移并优化 reviewService、editorialService、methodologyService
  • 实现智能体选择selectedAgentseditorial/methodology/both
  • 实现批量运行APIbatchRunReviewTasks
  • 替换 console.log 为 logger 服务
  • 注册 v2 API路由/api/v2/rvw
  • 实现 pg-boss 异步任务处理reviewWorker

数据库Phase 2

  • 添加 selectedAgents 字段String[]
  • 添加 editorialScore 字段Float?
  • 添加 methodologyScore 字段Float?- 2026-01-10新增
  • 添加 methodologyStatus 字段String?
  • 添加 picoExtract 字段Json?
  • 添加 isArchived、archivedAt 字段(归档支持)
  • 使用 prisma db push 同步到数据库

前端Phase 3

  • 创建 frontend-v2/src/modules/rvw/ 模块目录结构
  • 实现 Dashboard 页面(任务列表、筛选、批量操作)
  • 实现 TaskDetail 组件(审稿进度条、实时状态轮询)
  • 实现 EditorialReport 组件(稿约规范性评估报告)
  • 实现 MethodologyReport 组件(方法学评估报告)
  • 实现 AgentModal 组件(智能体选择弹窗)
  • 注册到 moduleRegistry.ts

集成测试与Bug修复Phase 4

  • 修复方法学分数不显示问题(列表页显示"warn"而不是分数)
  • 修复只选方法学时详情页不显示报告问题
  • 修复 activeTab 默认值导致的显示问题
  • 完整测试单智能体和双智能体审稿流程

报告导出Phase 5

  • 安装 docx 和 file-saver 库
  • 实现 Word 文档导出功能
  • 支持结构化报告(标题、基本信息表格、稿约规范性、方法学评估)
  • 问题和建议使用不同颜色标记

Schema隔离迁移Phase 6

  • 将 review_tasks 表从 public 迁移到 rvw_schema
  • 更新 Prisma schema 中的 @@schema 指令
  • 重新生成 Prisma Client
  • 验证所有查询和关联正常工作

详细任务清单见:RVW模块迁移计划


🔧 技术依赖

复用的平台能力

能力 位置 用途
LLM网关 @/common/llm/LLMFactory AI评估稿约/方法学/数据核查/临床评估)
PromptService @/common/prompt 🆕 V3.0 Prompt 管理(灰度预览、运营端配置)
文档处理 ExtractionClient Word/PDF文本提取
存储 @/common/storage 文件存储OSS/本地)
日志 @/common/logging 结构化日志
任务队列 jobQueue 异步任务处理pg-boss

LLM模型

模型 用途 说明
DeepSeek-V3 默认 性价比高,推理能力强
DeepSeek-R1 备选 深度推理
Qwen3-72B 备选 中文理解好

📚 相关文档

需求文档

开发文档

参考文档

Prompt文件


🎯 快速开始

访问审稿模块

  1. 启动后端

    cd backend
    npm run dev
    
  2. 启动前端(新版 frontend-v2

    cd frontend-v2
    npm run dev
    
  3. 访问审稿页面

    • 打开 http://localhost:3000
    • 点击顶部导航栏的 "预审稿" 标签
    • 或直接访问 http://localhost:3000/rvw
  4. 测试流程

    • 点击"上传稿件"按钮
    • 选择Word/PDF文档≤5MB
    • 选择智能体(稿约规范性/方法学/两者都选)
    • 点击"运行"按钮
    • 等待AI评估完成约1-2分钟
    • 查看评估报告

API测试新版 v2 API

### 获取任务列表
GET http://localhost:3001/api/v2/rvw/tasks

### 按状态筛选
GET http://localhost:3001/api/v2/rvw/tasks?status=pending

### 上传稿件
POST http://localhost:3001/api/v2/rvw/tasks
Content-Type: multipart/form-data
# file: 文件
# selectedAgents: ["editorial", "methodology"]

### 运行单个任务
POST http://localhost:3001/api/v2/rvw/tasks/{{taskId}}/run
Content-Type: application/json
{"selectedAgents": ["editorial", "methodology"]}

### 批量运行任务
POST http://localhost:3001/api/v2/rvw/tasks/batch-run
Content-Type: application/json
{"taskIds": ["id1", "id2"], "selectedAgents": ["editorial"]}

### 获取任务详情
GET http://localhost:3001/api/v2/rvw/tasks/{{taskId}}

### 获取报告
GET http://localhost:3001/api/v2/rvw/tasks/{{taskId}}/report

旧版API保持兼容

### 上传稿件旧API
POST http://localhost:3001/api/v1/review/upload
Content-Type: multipart/form-data

⚠️ 注意事项

对新AI助手

  1. V3.0 已完成4 维审查 + 稳定性增强 + partial_completed 支持
  2. 已集成到 frontend-v2:通过顶部导航栏"预审稿"进入
  3. v2 API 已就绪/api/v2/rvw/* 路由可用
  4. 遵循云原生规范:使用 logger 服务替代 console.log
  5. PromptService 集成RVW_DATA_VALIDATION + RVW_CLINICAL Prompt 可在运营管理端配置
  6. 并行故障隔离SkillExecutor 使用 Promise.allSettled单个 Skill 崩溃不影响其他
  7. ⚠️ 保留旧APIv1路由保持兼容支持旧前端

已完成改造

问题 改造前 改造后 状态
日志 console.log logger服务 已完成
用户认证 Mock用户ID getUserId(request) 已完成
智能体选择 自动 用户可选 已完成
批量操作 batchRunReviewTasks 已完成

待后续改造

问题 当前 目标 优先级
Schema位置 rvw_schema - 已完成
任务处理 pg-boss - 已完成
报告导出 Word (.docx) PDF优化 P3

📈 验收标准

根据MVP PRD验收标准如下

  1. 流程通用户能成功上传5个PDF勾选双模型运行等待3分钟内状态全部变为"已完成"

  2. 报告准

    • 上传一篇故意删掉"摘要结论"的稿件,规范性智能体必须报错
    • 上传一篇故意混淆"t检验"和"卡方检验"的稿件,方法学智能体必须报"存疑"或"错误"
  3. 无崩溃连续上传20个文件系统不卡死不白屏


🚀 未来规划

已完成2026-01-07 ~ 2026-01-10- V1.x

  • 架构迁移到 modules/rvw后端
  • 架构迁移到 modules/rvw前端 frontend-v2
  • 整合MVP新功能批量上传、工作台、智能体选择
  • 云原生改造logger服务
  • v2 API 路由注册
  • 数据库字段扩展
  • pg-boss异步任务处理2026-01-10
  • Word报告导出2026-01-10
  • 方法学分数显示修复2026-01-10
  • 单智能体审稿显示修复2026-01-10
  • Schema迁移到 rvw_schema2026-01-10

🚀 V2.0 "数据侦探" 开发进度2026-02-12 ~ 进行中)

阶段 任务 状态 完成日期
Week 1 Day 1 Python 服务搭建 已完成 2026-02-12
Week 1 Day 2 Word 表格提取 + 特殊符号 已完成 2026-02-13
Week 1 Day 3 L1 算术验证器 已完成 2026-02-14
Week 1 Day 4 数据结构设计 已完成 2026-02-15
Week 1 Day 5 API 集成 已完成 2026-02-16
Week 2 Day 6 L2 统计验证器 + L2.5 一致性取证 已完成 2026-02-17
Week 2 Day 7 Skills 核心框架 已完成 2026-02-18
Week 2 Day 8 DataForensicsSkill 已完成 2026-02-18
Week 2 Day 9 EditorialSkill 封装 已完成 2026-02-18
Week 2 Day 10 ReviewWorker 改造 已完成 2026-02-18
Week 3 统计验证扩展 + 用户体验优化 已完成 2026-02-18
Week 4 功能测试 + Bug 修复 📋 待开始 -

V2.0 核心功能(已完成)

  • L1 算术验证:行列加总、百分比验证
  • L2 统计验证CI↔P 一致性、T检验逆向、卡方检验含 subrow 精确高亮)
  • L2.5 一致性取证终审提权SE三角验证、SD>Mean检查
  • Skills 架构Skill Registry、Skill Executor、Journal Profiles
  • 负号归一化6 种 Unicode 负号变体支持
  • 文件格式提示PDF/.doc 无法数据验证的用户提示

Week 3 完成内容2026-02-18

  • 负号归一化(防止 float() 崩溃)
  • T 检验验证增强(智能样本量提取)
  • SE 三角验证增强subrow 支持)
  • CI vs P 值验证增强subrow 支持)
  • 前端翻译映射更新6 种新 IssueType
  • 文件格式提示Header、ReportDetail、TaskDetail

🚀 V3.0 "智能审稿增强" 开发进度2026-03-07

任务 状态 说明
LLM 数据核查通道 已完成 DataForensicsSkill 增加 LLM 验证,独立 60s 超时,规则验证兜底
RVW_DATA_VALIDATION Prompt 已完成 PromptService 集成,运营管理端可配置
临床专业评估 Skill 已完成 ClinicalAssessmentSkill基于 FINER 标准
RVW_CLINICAL Prompt 已完成 PromptService 集成,运营管理端可配置
SkillExecutor Promise.allSettled 已完成 并行 Skill 故障隔离,单个崩溃不影响其他
partial_completed 状态 已完成 新增任务状态 + error_details JSONB 字段
reviewWorker 写入 errorDetails 已完成 记录每个失败/超时 Skill 的名称和原因
前端 4 Tab 报告 已完成 稿约规范性/方法学/数据验证/临床评估
前端 partial_completed UI 已完成 琥珀色警告横幅 + 列表"部分完成"标签
Word 导出覆盖临床评估 已完成 导出报告包含临床专业评估章节

V3.0.1 "性能与体验增强" 开发进度2026-03-10

任务 状态 说明
DataForensics 并入并行组 已完成 与 Editorial/Methodology/Clinical 同组并行执行
并发上限控制 已完成 Executor 支持按 maxConcurrency 分批并行
模块完成即持久化 已完成 Worker 通过 onSkillComplete 增量写入 contextData
任务详情增量返回 已完成 getTaskDetail 返回模块结果与 reviewProgress
前端先出先看 已完成 审查过程中实时展示已完成 Tab
Word 导出补齐数据验证 已完成 导出包含数据验证汇总、表格明细、该表问题列表

🆕 V3.0.2 "方法学稳定性增强" 开发进度2026-03-13

任务 状态 说明
方法学 checkpoints 扩展 已完成 结果结构支持 20 检查点逐项状态与发现
方法学前端展示收敛 已完成 采用“三大项分组 + 检查点明细”,移除重复占位展示
方法学分治并行评估 已完成 A/B/C 三段并行执行1-9/10-14/15-20
方法学规则汇总器 已完成 合并分段结果并统一结论;分段失败可降级
方法学超时窗口扩展 已完成 MethodologySkill 超时从 5min 调整到 8min
快速模式开关(后续) 规划中 长文档自动降耗与更短输出预算

后续版本V3.1+

  • 全面移除评分机制(只列问题,不打分)
  • 单模块重试机制partial_completed → 重试失败模块)
  • ANOVA 验证(多组比较)
  • 配对 T 检验验证
  • 非参数检验Mann-Whitney、Wilcoxon
  • .doc 格式支持Pandoc 方案评估)
  • Profile 管理 UI期刊配置界面
  • PDF报告导出优化
  • PICO卡片UI实现
  • 历史归档UI实现
  • 独立产品打包

文档版本: v6.2
最后更新: 2026-03-13
当前状态: 🚀 V3.0.2 "方法学稳定性增强" 进行中(分治并行 + 20检查点覆盖 + 展示口径收敛)
下一步: V3.0.2 收尾验证(超时率/覆盖率) + V3.1 单模块重试与评分策略优化