文件解析

我们的系统提供了强大而灵活的文件解析功能，支持多种文件类型和存储选项，为用户提供全面的文档处理解决方案。

文件解析

主要特点

开箱即用：无需外部依赖，支持 Docker/Vercel/Render 一键部署。
多文件类型支持：
- 文本文件
- PDF
- Word文档 (Docx)
- Excel表格
- PowerPoint演示文稿 (Pptx)
- 图片
- 音频文件
多种存储选项：
- Base64
- 本地存储
- AWS S3
- Cloudflare R2
- 腾讯云 COS
- 阿里云 OSS
- MinIO
- Telegram CDN 等
OCR 支持：支持从图片中提取文本，为不具备图像识别能力的模型提供替代方案。此功能需要部署开源的 PaddleOCR API，可实现高精度的文字识别，大大提升了系统处理图像文档的能力。
音频支持：可将音频转换为文本（需要 Azure Speech to Text 服务）。
全模型兼容：支持所有AI模型的文件解析，不依赖特定AI厂商的接口。

优势

全面性：支持广泛的文件类型，满足各种文档处理需求。
灵活性：多种存储选项适应不同的部署环境和需求。
成本效益：不依赖付费的AI厂商接口，实现免费的文件解析。
私有化部署：支持OCR等功能的私有化部署，保护数据安全。
易用性：开箱即用的设计，简化了部署和使用过程。

使用方法

在对话界面中，点击文件上传按钮。
选择要上传的文件。
系统会自动识别文件类型并进行相应的解析。
解析完成后，可以在对话中直接引用文件内容。

配置服务

参考文件解析项目 Blob Service (opens in a new tab) 并按照其说明进行部署。
部署成功后，获取文件上传的服务网址（接入点）。
在您的系统设置中，找到"通用设置"选项。
在"通用设置"中，找到"文件解析服务"字段。
将您部署的 blob-service 的 URL 填入"文件解析服务"字段中。
保存设置。

文件解析服务

联网搜索分享对话