检测项配置_内容安全(Content Moderation)-阿里云帮助中心

本文向您介绍如何在AI安全护栏产品控制台进行检测项配置。

登录AI安全护栏产品控制台
在左侧导航栏，选择防护配置 > 检测项配置，可以看到以下检测服务：
- AI输入内容安全检测（query_security_check）
- AI生成内容安全检测（response_security_check）
根据您的检测需求，判断是否需要开始敏感内容检测或者提示词攻击检测服务。当然您可以点击操作列中的管理按钮，查看这两个服务的规则明细后，再判断是否需要开启。示例如下：
- 待补充页面截图（前端未调整完）
- 如果您开启的是敏感内容检测，请关注弹框提示，该功能会单独计费，更多信息请参见开通与计费概述。
- 如果您开启的是提示词攻击检测，请关注弹框提示，该功能当前处于公测阶段，支持免费试用，如有任何使用问题，欢迎联系我们的商务经理。
词库设置：选择词库进行加黑或加白操作，具体方案请参考词库管理
管理标签
每个风险标签均可以在控制台进行开关配置，部分风险标签会提供更细分检测范围的开关配置，具体参见AI安全护栏产品控制台
- 在规则管理页签，以AI输入内容安全检测（query_security_check）为例，单击操作列管理检测规则。
  1. 选择需要调整的检测类型，以不良内容检测为例。
  2. 单击编辑进入编辑模式，修改对应检测状态。
  3. 单击保存，保存新配置的检测范围。新配置的检测范围约2~5分钟生效并应用于生产环境。
代答库设置：根据命中标签，设置对应的代答库内容作为答案进行返回。在检测项配置列表页面，以AI输入内容安全检测（query_security_check）为例，单击操作列管理
- 选择需要调整的检测类型，以广告内容检测为例。
  1. 单击编辑进入编辑模式，修改自定义配置代答库配置。
  2. 在代答库选配列，可选择已创建的代答库，也可单击增加代答库新增代答库。单个标签，最多支持配置三个代答库。
  3. 单击保存，保存新配置的自定义代答库。新配置的自定义代答库约1分钟内生效并应用于生产环境。