文件解析
我们的系统提供了强大而灵活的文件解析功能,支持多种文件类型和存储选项,为用户提供全面的文档处理解决方案。
主要特点
-
开箱即用:无需外部依赖,支持 Docker/Vercel/Render 一键部署。
-
多文件类型支持:
- 文本文件
- Word文档 (Docx)
- Excel表格
- PowerPoint演示文稿 (Pptx)
- 图片
- 音频文件
-
多种存储选项:
- Base64
- 本地存储
- AWS S3
- Cloudflare R2
- 腾讯云 COS
- 阿里云 OSS
- MinIO
- Telegram CDN 等
-
OCR 支持:支持从图片中提取文本,为不具备图像识别能力的模型提供替代方案。此功能需要部署开源的 PaddleOCR API,可实现高精度的文字识别,大大提升了系统处理图像文档的能力。
-
音频支持:可将音频转换为文本(需要 Azure Speech to Text 服务)。
-
全模型兼容:支持所有AI模型的文件解析,不依赖特定AI厂商的接口。
优势
-
全面性:支持广泛的文件类型,满足各种文档处理需求。
-
灵活性:多种存储选项适应不同的部署环境和需求。
-
成本效益:不依赖付费的AI厂商接口,实现免费的文件解析。
-
私有化部署:支持OCR等功能的私有化部署,保护数据安全。
-
易用性:开箱即用的设计,简化了部署和使用过程。
使用方法
- 在对话界面中,点击文件上传按钮。
- 选择要上传的文件。
- 系统会自动识别文件类型并进行相应的解析。
- 解析完成后,可以在对话中直接引用文件内容。
配置服务
-
参考 文件解析项目 Blob Service (opens in a new tab) 并按照其说明进行部署。
-
部署成功后,获取文件上传的服务网址(接入点)。
-
在您的系统设置中,找到"通用设置"选项。
-
在"通用设置"中,找到"文件解析服务"字段。
-
将您部署的 blob-service 的 URL 填入"文件解析服务"字段中。
-
保存设置。