feat: add extraction_service (PDF/Docx/Txt) and update .gitignore to exclude venv
This commit is contained in:
29
extraction_service/test_files/test.txt
Normal file
29
extraction_service/test_files/test.txt
Normal file
@@ -0,0 +1,29 @@
|
||||
这是一个测试文本文件。
|
||||
用于测试Txt文件提取功能。
|
||||
|
||||
AI临床研究平台 - Phase 2 Day 3测试
|
||||
|
||||
功能特点:
|
||||
1. 自动编码检测
|
||||
2. 支持UTF-8、GBK等多种编码
|
||||
3. 统计字符数和行数
|
||||
4. 快速文本提取
|
||||
|
||||
测试内容包含:
|
||||
- 中文字符
|
||||
- 英文字符 (English characters)
|
||||
- 数字 123456
|
||||
- 特殊符号 !@#$%^&*()
|
||||
|
||||
多行文本测试:
|
||||
第一行
|
||||
第二行
|
||||
第三行
|
||||
|
||||
结束。
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
Reference in New Issue
Block a user