本文向您介绍如何在AI安全护栏产品控制台进行检测项配置。
在左侧导航栏,选择
,可以看到以下检测服务:AI输入内容安全检测(query_security_check)
AI生成内容安全检测(response_security_check)
根据您的检测需求,判断是否需要开始敏感内容检测或者提示词攻击检测服务。当然您可以点击操作列中的管理按钮,查看这两个服务的规则明细后,再判断是否需要开启。示例如下:
待补充页面截图(前端未调整完)
如果您开启的是敏感内容检测,请关注弹框提示,该功能会单独计费,更多信息请参见开通与计费概述。
如果您开启的是提示词攻击检测,请关注弹框提示,该功能当前处于公测阶段,支持免费试用,如有任何使用问题,欢迎联系我们的商务经理。
词库设置:选择词库进行加黑或加白操作,具体方案请参考词库管理
管理标签
每个风险标签均可以在控制台进行开关配置,部分风险标签会提供更细分检测范围的开关配置,具体参见AI安全护栏产品控制台
在规则管理页签,以AI输入内容安全检测(query_security_check)为例,单击操作列管理检测规则。
选择需要调整的检测类型,以不良内容检测为例。
单击编辑进入编辑模式,修改对应检测状态。
单击保存,保存新配置的检测范围。新配置的检测范围约2~5分钟生效并应用于生产环境。
代答库设置:根据命中标签,设置对应的代答库内容作为答案进行返回。在检测项配置列表页面,以AI输入内容安全检测(query_security_check)为例,单击操作列管理
选择需要调整的检测类型,以广告内容检测为例。
单击编辑进入编辑模式,修改自定义配置代答库配置。
在代答库选配列,可选择已创建的代答库,也可单击增加代答库新增代答库。单个标签,最多支持配置三个代答库。
单击保存,保存新配置的自定义代答库。新配置的自定义代答库约1分钟内生效并应用于生产环境。