检测项配置

本文向您介绍如何在AI安全护栏产品控制台进行检测项配置。

  1. 登录AI安全护栏产品控制台

  2. 在左侧导航栏,选择防护配置 > 检测项配置,可以看到以下检测服务:

    • AI输入内容安全检测(query_security_check)

    • AI生成内容安全检测(response_security_check)

    image

  3. 根据您的检测需求,判断是否需要开始敏感内容检测或者提示词攻击检测服务。当然您可以点击操作列中的管理按钮,查看这两个服务的规则明细后,再判断是否需要开启。示例如下:

    • 待补充页面截图(前端未调整完)

    • 如果您开启的是敏感内容检测,请关注弹框提示,该功能会单独计费,更多信息请参见开通与计费概述

      image

    • 如果您开启的是提示词攻击检测,请关注弹框提示,该功能当前处于公测阶段,支持免费试用,如有任何使用问题,欢迎联系我们的商务经理。

      image

  4. 词库设置:选择词库进行加黑或加白操作,具体方案请参考词库管理

  5. 管理标签

    每个风险标签均可以在控制台进行开关配置,部分风险标签会提供更细分检测范围的开关配置,具体参见AI安全护栏产品控制台

    • 规则管理页签,以AI输入内容安全检测(query_security_check)为例,单击操作管理检测规则。

      1. 选择需要调整的检测类型,以不良内容检测为例。

      2. 单击编辑进入编辑模式,修改对应检测状态。

      3. 单击保存,保存新配置的检测范围。新配置的检测范围约2~5分钟生效并应用于生产环境。

      image

  6. 代答库设置:根据命中标签,设置对应的代答库内容作为答案进行返回。在检测项配置列表页面,以AI输入内容安全检测(query_security_check)为例,单击操作管理

    • 选择需要调整的检测类型,以广告内容检测为例。

      1. 单击编辑进入编辑模式,修改自定义配置代答库配置。

      2. 代答库选配列,可选择已创建的代答库,也可单击增加代答库新增代答库。单个标签,最多支持配置三个代答库。

      3. 单击保存,保存新配置的自定义代答库。新配置的自定义代答库约1分钟内生效并应用于生产环境。

      image