- Add Git commit preparation checklist - Add Phase testing guides and issue tracking - Add utility scripts (env setup, test data initialization) - Add temp migration SQL files (for reference) - Update startup scripts and README - Remove obsolete scripts
149 lines
3.0 KiB
Markdown
149 lines
3.0 KiB
Markdown
# 🧪 Phase 1 测试指南 - 快速参考
|
||
|
||
**状态**: ✅ 代码优化完成,等待测试
|
||
**耗时**: 约20分钟
|
||
**目标**: 验证RAG优化效果,决定是否需要Phase 2
|
||
|
||
---
|
||
|
||
## 📊 优化成果
|
||
|
||
| 参数 | 优化前 | 优化后 | 提升 |
|
||
|------|--------|--------|------|
|
||
| top_k | 3 | 15 | **5倍** |
|
||
| chunk_size | 500 | 1500 | **3倍** |
|
||
| 总覆盖 | 1页 | 15-20页 | **15倍** |
|
||
|
||
---
|
||
|
||
## 🚀 立即开始测试(3步)
|
||
|
||
### Step 1: 重启后端(1分钟)
|
||
|
||
```bash
|
||
# 在后端目录停止服务(Ctrl+C),然后:
|
||
cd D:\MyCursor\AIclinicalresearch\backend
|
||
npm run dev
|
||
```
|
||
|
||
等待看到:
|
||
```
|
||
✓ Server listening on http://0.0.0.0:3001
|
||
```
|
||
|
||
---
|
||
|
||
### Step 2: 重新上传文档(10-15分钟)
|
||
|
||
1. **访问**: http://localhost:3000/knowledge
|
||
|
||
2. **删除旧知识库**
|
||
- 找到"阿尔兹海默知识库"
|
||
- 点击删除 → 确认
|
||
|
||
3. **创建新知识库**
|
||
- 点击"创建知识库"
|
||
- 名称:`阿尔兹海默知识库(优化版)`
|
||
- 点击确定
|
||
|
||
4. **上传文档**
|
||
- 进入新知识库
|
||
- 上传7个PDF文件
|
||
- **等待处理完成**(每个文件1-2分钟)
|
||
- ✅ 确认所有文档显示"已就绪"
|
||
|
||
---
|
||
|
||
### Step 3: 测试效果(5分钟)
|
||
|
||
访问"智能问答":http://localhost:3000/chat
|
||
|
||
#### 测试1:元数据查询
|
||
```
|
||
@阿尔兹海默知识库(优化版)
|
||
这个知识库有几个文件?请列出文件名。
|
||
```
|
||
|
||
**预期**:能识别出更多文件(接近7个)
|
||
|
||
---
|
||
|
||
#### 测试2:总结问题
|
||
```
|
||
@阿尔兹海默知识库(优化版)
|
||
请总结这7篇文献的核心观点和主要发现。
|
||
```
|
||
|
||
**预期**:总结更全面,覆盖更多文献
|
||
|
||
---
|
||
|
||
#### 测试3:对比问题
|
||
```
|
||
@阿尔兹海默知识库(优化版)
|
||
这些文献在研究方法上有什么异同?请对比分析。
|
||
```
|
||
|
||
**预期**:对比更深入,分析更准确
|
||
|
||
---
|
||
|
||
## 📝 记录测试结果
|
||
|
||
### 问题1结果
|
||
- 识别出文件数:____/7
|
||
- 回答质量:⭐⭐⭐⭐⭐ (打分)
|
||
|
||
### 问题2结果
|
||
- 总结完整度:⭐⭐⭐⭐⭐
|
||
- 覆盖文献数:____/7
|
||
|
||
### 问题3结果
|
||
- 对比深度:⭐⭐⭐⭐⭐
|
||
- 分析维度数:____
|
||
|
||
---
|
||
|
||
## 🎯 决策标准
|
||
|
||
### ✅ **满意** → 停止Phase 2
|
||
- AI能识别大部分文件
|
||
- 总结覆盖70%+文献
|
||
- 对比分析有深度
|
||
- **行动**:进入里程碑2(开发其他智能体)
|
||
|
||
### ⚠️ **不满意** → 进入Phase 2
|
||
- AI仍遗漏重要信息
|
||
- 总结不够全面
|
||
- 对比有明显缺失
|
||
- **行动**:开发全文精读模式(5-7天)
|
||
|
||
---
|
||
|
||
## 💡 提示
|
||
|
||
- 每个问题都要@知识库
|
||
- 可以选择qwen-long模型测试(更强大)
|
||
- 记录详细的测试结果
|
||
- 截图保存关键回答
|
||
|
||
---
|
||
|
||
## 📞 遇到问题?
|
||
|
||
**文档上传失败**:
|
||
- 检查后端服务是否运行
|
||
- 检查Dify服务是否正常
|
||
- 查看后端控制台错误日志
|
||
|
||
**AI回答仍不理想**:
|
||
- 确认使用的是新上传的知识库
|
||
- 确认文档已完成处理(✅ 已就绪)
|
||
- 可以尝试增加top_k到20测试
|
||
|
||
---
|
||
|
||
**准备好了吗?立即开始测试!** 🚀
|
||
|
||
|