Skip to content
文档
文件解析

文件解析

我们的系统提供了强大而灵活的文件解析功能,支持多种文件类型和存储选项,为用户提供全面的文档处理解决方案。

文件解析

主要特点

  1. 开箱即用:无需外部依赖,支持 Docker/Vercel/Render 一键部署。

  2. 多文件类型支持

    • 文本文件
    • PDF
    • Word文档 (Docx)
    • Excel表格
    • PowerPoint演示文稿 (Pptx)
    • 图片
    • 音频文件
  3. 多种存储选项

    • Base64
    • 本地存储
    • AWS S3
    • Cloudflare R2
    • 腾讯云 COS
    • 阿里云 OSS
    • MinIO
    • Telegram CDN 等
  4. OCR 支持:支持从图片中提取文本,为不具备图像识别能力的模型提供替代方案。此功能需要部署开源的 PaddleOCR API,可实现高精度的文字识别,大大提升了系统处理图像文档的能力。

  5. 音频支持:可将音频转换为文本(需要 Azure Speech to Text 服务)。

  6. 全模型兼容:支持所有AI模型的文件解析,不依赖特定AI厂商的接口。

优势

  1. 全面性:支持广泛的文件类型,满足各种文档处理需求。

  2. 灵活性:多种存储选项适应不同的部署环境和需求。

  3. 成本效益:不依赖付费的AI厂商接口,实现免费的文件解析。

  4. 私有化部署:支持OCR等功能的私有化部署,保护数据安全。

  5. 易用性:开箱即用的设计,简化了部署和使用过程。

使用方法

  1. 在对话界面中,点击文件上传按钮。
  2. 选择要上传的文件。
  3. 系统会自动识别文件类型并进行相应的解析。
  4. 解析完成后,可以在对话中直接引用文件内容。

配置服务

  1. 参考 文件解析项目 Blob Service (opens in a new tab) 并按照其说明进行部署。

  2. 部署成功后,获取文件上传的服务网址(接入点)。

  3. 在您的系统设置中,找到"通用设置"选项。

  4. 在"通用设置"中,找到"文件解析服务"字段。

  5. 将您部署的 blob-service 的 URL 填入"文件解析服务"字段中。

  6. 保存设置。

文件解析服务