Files
AIclinicalresearch/PHASE1-测试指南.md
HaHafeng 855d142fec chore: add remaining test docs, scripts and temp files
- Add Git commit preparation checklist
- Add Phase testing guides and issue tracking
- Add utility scripts (env setup, test data initialization)
- Add temp migration SQL files (for reference)
- Update startup scripts and README
- Remove obsolete scripts
2025-11-16 15:44:55 +08:00

3.0 KiB
Raw Blame History

🧪 Phase 1 测试指南 - 快速参考

状态: 代码优化完成,等待测试
耗时: 约20分钟
目标: 验证RAG优化效果决定是否需要Phase 2


📊 优化成果

参数 优化前 优化后 提升
top_k 3 15 5倍
chunk_size 500 1500 3倍
总覆盖 1页 15-20页 15倍

🚀 立即开始测试3步

Step 1: 重启后端1分钟

# 在后端目录停止服务Ctrl+C然后
cd D:\MyCursor\AIclinicalresearch\backend
npm run dev

等待看到:

✓ Server listening on http://0.0.0.0:3001

Step 2: 重新上传文档10-15分钟

  1. 访问: http://localhost:3000/knowledge

  2. 删除旧知识库

    • 找到"阿尔兹海默知识库"
    • 点击删除 → 确认
  3. 创建新知识库

    • 点击"创建知识库"
    • 名称:阿尔兹海默知识库(优化版)
    • 点击确定
  4. 上传文档

    • 进入新知识库
    • 上传7个PDF文件
    • 等待处理完成每个文件1-2分钟
    • 确认所有文档显示"已就绪"

Step 3: 测试效果5分钟

访问"智能问答"http://localhost:3000/chat

测试1元数据查询

@阿尔兹海默知识库(优化版)
这个知识库有几个文件?请列出文件名。

预期能识别出更多文件接近7个


测试2总结问题

@阿尔兹海默知识库(优化版)
请总结这7篇文献的核心观点和主要发现。

预期:总结更全面,覆盖更多文献


测试3对比问题

@阿尔兹海默知识库(优化版)
这些文献在研究方法上有什么异同?请对比分析。

预期:对比更深入,分析更准确


📝 记录测试结果

问题1结果

  • 识别出文件数____/7
  • 回答质量: (打分)

问题2结果

  • 总结完整度:
  • 覆盖文献数____/7

问题3结果

  • 对比深度:
  • 分析维度数____

🎯 决策标准

满意 → 停止Phase 2

  • AI能识别大部分文件
  • 总结覆盖70%+文献
  • 对比分析有深度
  • 行动进入里程碑2开发其他智能体

⚠️ 不满意 → 进入Phase 2

  • AI仍遗漏重要信息
  • 总结不够全面
  • 对比有明显缺失
  • 行动开发全文精读模式5-7天

💡 提示

  • 每个问题都要@知识库
  • 可以选择qwen-long模型测试更强大
  • 记录详细的测试结果
  • 截图保存关键回答

📞 遇到问题?

文档上传失败

  • 检查后端服务是否运行
  • 检查Dify服务是否正常
  • 查看后端控制台错误日志

AI回答仍不理想

  • 确认使用的是新上传的知识库
  • 确认文档已完成处理( 已就绪)
  • 可以尝试增加top_k到20测试

准备好了吗?立即开始测试! 🚀