feat(rvw): Complete V2.0 Week 3 - Statistical validation extension and UX improvements

Week 3 Development Summary:

- Implement negative sign normalization (6 Unicode variants)

- Enhance T-test validation with smart sample size extraction

- Enhance SE triangle and CI-P consistency validation with subrow support

- Add precise sub-cell highlighting for P-values in multi-line cells

- Add frontend issue type Chinese translations (6 new types)

- Add file format tips for PDF/DOC uploads

Technical improvements:

- Add _clean_statistical_text() in extractor.py

- Add _safe_float() wrapper in validator.py

- Add ForensicsReport.tsx component

- Update ISSUE_TYPE_LABELS translations

Documentation:

- Add 2026-02-18 development record

- Update RVW module status (v5.1)

- Update system status (v5.2)

Status: Week 3 complete, ready for Week 4 testing
Co-authored-by: Cursor <cursoragent@cursor.com>
This commit is contained in:
2026-02-18 18:26:16 +08:00
parent 9f256c4a02
commit f9ed0c2528
36 changed files with 2790 additions and 501 deletions

View File

@@ -1,21 +1,30 @@
# RVW稿件审查模块 - 当前状态与开发指南
> **文档版本:** v5.0
> **文档版本:** v5.1
> **创建日期:** 2026-01-07
> **最后更新:** 2026-02-18
> **维护者:** 开发团队
> **当前状态:** 🚀 **V2.0 "数据侦探" 开发中(Week 2 Day 10 完成**
> **当前状态:** 🚀 **V2.0 "数据侦探" Week 3 完成(统计验证扩展+用户体验优化**
> **文档目的:** 快速了解RVW模块状态为新AI助手提供上下文
>
> **🎉 V2.0 进展2026-02-18**
> **🎉 V2.0 进展2026-02-18 Week 3**
> - ✅ **负号归一化**:防止 float() 崩溃,覆盖 6 种负号变体
> - ✅ **T 检验验证增强**:智能样本量提取 + subrow 精确高亮
> - ✅ **SE 三角验证增强**:多行单元格 subrow 支持
> - ✅ **CI vs P 值验证增强**subrow 支持 + 灵活 P 值解析
> - ✅ **前端翻译映射**:新增 6 种 IssueType 中文翻译
> - ✅ **文件格式提示**PDF/.doc 上传时提示无法数据验证
>
> **🎉 V2.0 进展Week 1-2**
> - ✅ **L1 算术验证器**行列加总、百分比验证Day 3
> - ✅ **L2 统计验证器**CI↔P 值一致性、T检验逆向验证Day 6
> - ✅ **L2 统计验证器**CI↔P 值一致性、卡方检验逆向验证Day 6
> - ✅ **L2.5 一致性取证**SE三角验证、SD>Mean检查Day 6 终审提权)
> - ✅ **Word 文档解析**python-docx 表格提取Day 2
> - ✅ **Word 文档解析**python-docx 表格提取 + 特殊符号提取Day 2
> - ✅ **Skills 核心框架**types、registry、executor、profile、contextDay 7
> - ✅ **DataForensicsSkill**:依赖注入、路径安全、优雅降级Day 8
> - ✅ **DataForensicsSkill**OSS 集成、依赖注入、优雅降级Day 8
> - ✅ **EditorialSkill + MethodologySkill**封装现有服务Day 9
> - ✅ **ReviewWorker 改造**:集成 SkillExecutor支持 V1/V2 切换Day 10
> - ✅ **前端数据验证 Tab**ForensicsReport 组件、精确单元格高亮Week 3
---
@@ -377,37 +386,50 @@ Content-Type: multipart/form-data
| 阶段 | 任务 | 状态 | 完成日期 |
|------|------|------|---------|
| Week 1 Day 1 | Python 服务搭建 | ✅ 已完成 | 2026-02-12 |
| Week 1 Day 2 | Word 表格提取 | ✅ 已完成 | 2026-02-13 |
| Week 1 Day 2 | Word 表格提取 + 特殊符号 | ✅ 已完成 | 2026-02-13 |
| Week 1 Day 3 | L1 算术验证器 | ✅ 已完成 | 2026-02-14 |
| Week 1 Day 4 | 数据结构设计 | ✅ 已完成 | 2026-02-15 |
| Week 1 Day 5 | API 集成 | ✅ 已完成 | 2026-02-16 |
| **Week 2 Day 6** | **L2 统计验证器 + L2.5 一致性取证** | **✅ 已完成** | **2026-02-17** |
| Week 2 Day 7 | Skills 核心框架 | 📋 待开发 | - |
| Week 2 Day 8 | DataForensicsSkill | 📋 待开发 | - |
| Week 2 Day 9 | EditorialSkill 封装 | 📋 待开发 | - |
| Week 2 Day 10 | ReviewService 改造 | 📋 待开发 | - |
| Week 2 Day 6 | L2 统计验证器 + L2.5 一致性取证 | ✅ 已完成 | 2026-02-17 |
| Week 2 Day 7 | Skills 核心框架 | ✅ 已完成 | 2026-02-18 |
| Week 2 Day 8 | DataForensicsSkill | ✅ 已完成 | 2026-02-18 |
| Week 2 Day 9 | EditorialSkill 封装 | ✅ 已完成 | 2026-02-18 |
| Week 2 Day 10 | ReviewWorker 改造 | ✅ 已完成 | 2026-02-18 |
| **Week 3** | **统计验证扩展 + 用户体验优化** | **✅ 已完成** | **2026-02-18** |
| Week 4 | 功能测试 + Bug 修复 | 📋 待开始 | - |
**V2.0 核心功能**
**V2.0 核心功能(已完成)**
- **L1 算术验证**:行列加总、百分比验证
- **L2 统计验证**CI↔P 一致性、T检验逆向、卡方检验
- **L2 统计验证**CI↔P 一致性、T检验逆向、卡方检验(含 subrow 精确高亮)
- **L2.5 一致性取证**终审提权SE三角验证、SD>Mean检查
- **Skills 架构**Skill Registry、Skill Executor、Journal Profiles
- **负号归一化**6 种 Unicode 负号变体支持
- **文件格式提示**PDF/.doc 无法数据验证的用户提示
**Week 3 完成内容2026-02-18**
- ✅ 负号归一化(防止 float() 崩溃)
- ✅ T 检验验证增强(智能样本量提取)
- ✅ SE 三角验证增强subrow 支持)
- ✅ CI vs P 值验证增强subrow 支持)
- ✅ 前端翻译映射更新6 种新 IssueType
- ✅ 文件格式提示Header、ReportDetail、TaskDetail
### 后续版本V2.1+
- [ ] Week 4 功能测试和 Bug 修复
- [ ] ANOVA 验证(多组比较)
- [ ] 配对 T 检验验证
- [ ] 非参数检验Mann-Whitney、Wilcoxon
- [ ] .doc 格式支持Pandoc 方案评估)
- [ ] Profile 管理 UI期刊配置界面
- [ ] PDF报告导出优化
- [ ] PICO卡片UI实现
- [ ] 历史归档UI实现
- [ ] L3 高级逻辑推理验证
- [ ] 登录页面(独立产品时)
- [ ] 审稿人管理系统
- [ ] 多轮审稿流程
- [ ] 期刊库管理
- [ ] 独立产品打包
---
**文档版本:** v3.2
**最后更新:** 2026-01-10
**当前状态:** ✅ Phase 1-6 完成模块95%可用Schema已隔离
**下一步:** 生产环境部署测试
**文档版本:** v5.1
**最后更新:** 2026-02-18
**当前状态:** 🚀 V2.0 "数据侦探" Week 3 完成Skills 架构 + 统计验证 + 用户体验优化
**下一步:** Week 4 功能测试和 Bug 修复