feat: add extraction_service (PDF/Docx/Txt) and update .gitignore to exclude venv

This commit is contained in:
AI Clinical Dev Team
2025-11-16 15:32:44 +08:00
parent 2a4f59b08b
commit 39eb62ee79
18 changed files with 2706 additions and 0 deletions

View File

@@ -0,0 +1,29 @@
这是一个测试文本文件。
用于测试Txt文件提取功能。
AI临床研究平台 - Phase 2 Day 3测试
功能特点:
1. 自动编码检测
2. 支持UTF-8、GBK等多种编码
3. 统计字符数和行数
4. 快速文本提取
测试内容包含:
- 中文字符
- 英文字符 (English characters)
- 数字 123456
- 特殊符号 !@#$%^&*()
多行文本测试:
第一行
第二行
第三行
结束。