- Add Git commit preparation checklist - Add Phase testing guides and issue tracking - Add utility scripts (env setup, test data initialization) - Add temp migration SQL files (for reference) - Update startup scripts and README - Remove obsolete scripts
3.0 KiB
3.0 KiB
🧪 Phase 1 测试指南 - 快速参考
状态: ✅ 代码优化完成,等待测试
耗时: 约20分钟
目标: 验证RAG优化效果,决定是否需要Phase 2
📊 优化成果
| 参数 | 优化前 | 优化后 | 提升 |
|---|---|---|---|
| top_k | 3 | 15 | 5倍 |
| chunk_size | 500 | 1500 | 3倍 |
| 总覆盖 | 1页 | 15-20页 | 15倍 |
🚀 立即开始测试(3步)
Step 1: 重启后端(1分钟)
# 在后端目录停止服务(Ctrl+C),然后:
cd D:\MyCursor\AIclinicalresearch\backend
npm run dev
等待看到:
✓ Server listening on http://0.0.0.0:3001
Step 2: 重新上传文档(10-15分钟)
-
删除旧知识库
- 找到"阿尔兹海默知识库"
- 点击删除 → 确认
-
创建新知识库
- 点击"创建知识库"
- 名称:
阿尔兹海默知识库(优化版) - 点击确定
-
上传文档
- 进入新知识库
- 上传7个PDF文件
- 等待处理完成(每个文件1-2分钟)
- ✅ 确认所有文档显示"已就绪"
Step 3: 测试效果(5分钟)
访问"智能问答":http://localhost:3000/chat
测试1:元数据查询
@阿尔兹海默知识库(优化版)
这个知识库有几个文件?请列出文件名。
预期:能识别出更多文件(接近7个)
测试2:总结问题
@阿尔兹海默知识库(优化版)
请总结这7篇文献的核心观点和主要发现。
预期:总结更全面,覆盖更多文献
测试3:对比问题
@阿尔兹海默知识库(优化版)
这些文献在研究方法上有什么异同?请对比分析。
预期:对比更深入,分析更准确
📝 记录测试结果
问题1结果
- 识别出文件数:____/7
- 回答质量:⭐⭐⭐⭐⭐ (打分)
问题2结果
- 总结完整度:⭐⭐⭐⭐⭐
- 覆盖文献数:____/7
问题3结果
- 对比深度:⭐⭐⭐⭐⭐
- 分析维度数:____
🎯 决策标准
✅ 满意 → 停止Phase 2
- AI能识别大部分文件
- 总结覆盖70%+文献
- 对比分析有深度
- 行动:进入里程碑2(开发其他智能体)
⚠️ 不满意 → 进入Phase 2
- AI仍遗漏重要信息
- 总结不够全面
- 对比有明显缺失
- 行动:开发全文精读模式(5-7天)
💡 提示
- 每个问题都要@知识库
- 可以选择qwen-long模型测试(更强大)
- 记录详细的测试结果
- 截图保存关键回答
📞 遇到问题?
文档上传失败:
- 检查后端服务是否运行
- 检查Dify服务是否正常
- 查看后端控制台错误日志
AI回答仍不理想:
- 确认使用的是新上传的知识库
- 确认文档已完成处理(✅ 已就绪)
- 可以尝试增加top_k到20测试
准备好了吗?立即开始测试! 🚀