Skip to content
文档
内容审核

内容审核

为了符合国内站点备案要求并提供安全的用户体验,我们实施了全面的内容审核机制。系统支持多种审核模式,可以灵活配置以满足不同场景的需求。

内容审核

审核方式

我们提供以下几种内容审核方式:

  1. 文本词库审核: 通过预设的敏感词库进行匹配,快速识别常见的违规内容。

  2. 正则表达式审核: 使用正则表达式进行更复杂的模式匹配,可以识别特定格式的敏感信息。

  3. 百度内容审核: 接入百度云的内容审核服务,利用其强大的AI能力进行全面审核。

  4. 特定模型审核: 针对某些特殊模型,可以配置专门的审核规则。

审核范围

内容审核覆盖以下方向:

  • 用户输入的提示词(Prompt)
  • AI生成的回复内容

配置说明

  1. 在管理后台的"安全设置"中可以进行审核配置。
  2. 可以选择启用一种或多种审核方式。
  3. 对于文本词库和正则表达式,可以自定义规则。
  4. 特定模型审核可以针对不同模型设置不同的审核策略。

审核结果处理

当检测到违规内容时,系统会采取以下措施:

  1. 阻止内容生成或显示
  2. 向用户展示友好的提示信息
  3. 记录审核日志,方便管理员追踪

百度云审核

百度云审核提供了非常丰富的审核策略,可针对不同策略做不同粒度处理。百度云审核模式需要配置百度云审核服务的API Key和Secret Key。具体步骤如下:

  1. 登录百度云控制台,开通内容审核服务。
  2. 获取API Key和Secret Key。
  3. 在我们的系统管理后台的"安全设置"中,选择"百度云审核"模式。
  4. 填入获取的API Key和Secret Key。

详细的配置说明和审核策略粒度设置,请参考百度云审核快速入门 (opens in a new tab)文档。

对于违禁词汇审核策略,需要在百度云控制台中进行配置。您可以根据业务需求自定义敏感词库和审核规则。具体配置方法请参考上述百度云文档链接。

启用百度云审核后,系统将自动调用百度云API对内容进行实时审核,提供更全面和智能的内容安全保障。