AIclinicalresearch/PHASE1-测试指南.md

# 🧪 Phase 1 测试指南 - 快速参考

**状态**: ✅ 代码优化完成，等待测试
**耗时**: 约20分钟
**目标**: 验证RAG优化效果，决定是否需要Phase 2

---

## 📊 优化成果

| 参数 | 优化前 | 优化后 | 提升 |
|------|--------|--------|------|
| top_k | 3 | 15 | **5倍** |
| chunk_size | 500 | 1500 | **3倍** |
| 总覆盖 | 1页 | 15-20页 | **15倍** |

---

## 🚀 立即开始测试（3步）

### Step 1: 重启后端（1分钟）

```bash
# 在后端目录停止服务（Ctrl+C），然后：
cd D:\MyCursor\AIclinicalresearch\backend
npm run dev
```

等待看到：
```
✓ Server listening on http://0.0.0.0:3001
```

---

### Step 2: 重新上传文档（10-15分钟）

1. **访问**: http://localhost:3000/knowledge

2. **删除旧知识库**
   - 找到"阿尔兹海默知识库"
   - 点击删除 → 确认

3. **创建新知识库**
   - 点击"创建知识库"
   - 名称：`阿尔兹海默知识库（优化版）`
   - 点击确定

4. **上传文档**
   - 进入新知识库
   - 上传7个PDF文件
   - **等待处理完成**（每个文件1-2分钟）
   - ✅ 确认所有文档显示"已就绪"

---

### Step 3: 测试效果（5分钟）

访问"智能问答"：http://localhost:3000/chat

#### 测试1：元数据查询
```
@阿尔兹海默知识库（优化版）
这个知识库有几个文件？请列出文件名。
```

**预期**：能识别出更多文件（接近7个）

---

#### 测试2：总结问题
```
@阿尔兹海默知识库（优化版）
请总结这7篇文献的核心观点和主要发现。
```

**预期**：总结更全面，覆盖更多文献

---

#### 测试3：对比问题
```
@阿尔兹海默知识库（优化版）
这些文献在研究方法上有什么异同？请对比分析。
```

**预期**：对比更深入，分析更准确

---

## 📝 记录测试结果

### 问题1结果
- 识别出文件数：____/7
- 回答质量：⭐⭐⭐⭐⭐ (打分)

### 问题2结果
- 总结完整度：⭐⭐⭐⭐⭐
- 覆盖文献数：____/7

### 问题3结果
- 对比深度：⭐⭐⭐⭐⭐
- 分析维度数：____

---

## 🎯 决策标准

### ✅ **满意** → 停止Phase 2
- AI能识别大部分文件
- 总结覆盖70%+文献
- 对比分析有深度
- **行动**：进入里程碑2（开发其他智能体）

### ⚠️ **不满意** → 进入Phase 2
- AI仍遗漏重要信息
- 总结不够全面
- 对比有明显缺失
- **行动**：开发全文精读模式（5-7天）

---

## 💡 提示

- 每个问题都要@知识库
- 可以选择qwen-long模型测试（更强大）
- 记录详细的测试结果
- 截图保存关键回答

---

## 📞 遇到问题？

**文档上传失败**：
- 检查后端服务是否运行
- 检查Dify服务是否正常
- 查看后端控制台错误日志

**AI回答仍不理想**：
- 确认使用的是新上传的知识库
- 确认文档已完成处理（✅ 已就绪）
- 可以尝试增加top_k到20测试

---

**准备好了吗？立即开始测试！** 🚀