添加系统事件规则

本文介绍了如何添加系统事件规则,及时了解各云产品的运行状态,并接收报警通知,以便在业务故障时,快速分析并定位问题。

操作步骤

  1. 进入 云监控控制台

  2. 在左侧导航栏选择 事件中心 > 系统事件

  3. 单击 事件报警规则 页签。

  4. 单击 创建报警规则

  5. 创建/修改事件报警 面板,设置系统事件的报警规则参数。

    参数

    说明

    报警规则名称

    事件报警规则的名称。

    产品类型

    选择 云数据库OceanBase版

    事件类型

    选择 状态通知

    事件等级

    选择 严重

    事件名称

    目前可选择的事件如下(可多选):

    • OceanBase 实例自动备份失败

    • OceanBase 实例磁盘空间不足

    • OceanBase 实例磁盘空间不足(已恢复)

    • OceanBase 节点进程异常

    • OceanBase 节点进程异常(已恢复)

    关键词过滤

    报警规则的过滤关键词。取值:

    • 满足包含上面任何一个关键词:当事件内容中包含任何一个关键词时,云监控会发送报警通知。

    • 满足不包含上面任何一个关键词:当事件内容中不包含任何一个关键词时,云监控会发送报警通知。

    说明

    关于如何查看事件内容,请参见 查看系统事件

    SQL Filter

    SQ L过滤语句。

    支持 andor 的条件筛选,例如:Warn and i-hp368focau7dp0hw****,表示当事件内容中包含实例 i-hp368focau7dp0hw**** 和报警级别 Warn 时,云监控才会发送报警通知。

    联系人组

    事件报警规则的报警联系人组。

    通知方式

    事件报警的级别和通知方式。取值:

    • Critical(电话+短信+邮件+WebHook)

    • Warning(短信+邮件+WebHook)

    • Info(邮件+WebHook)

    资源范围

    • 全部资源

    • 应用分组:根据选择的分组资源进行监控及通知。

    消息服务队列

    事件报警投递到轻量消息队列(原 MNS)的指定队列。

    函数计算

    事件报警投递到函数计算的指定函数。

    URL 回调

    公网可访问的 URL,用于接收云监控通过 POST 请求推送的报警信息。目前仅支持 HTTP 协议。关于如何设置报警回调,请参见 使用系统事件报警回调(旧版)

    当您需要测试报警回调地址的连通性时,可以执行以下操作。

    1. 单击回调地址正后方的 测试

      WebHook测试 面板,您可以通过 Webhook 返回的状态码和测试结果详情对报警回调地址的连通性进行判断和排查。

      说明

      您还可以设置 Webhook 的 回调模板类型语言,再次单击 测试,获取对应的测试结果详情。

    2. 单击 关闭

    日志服务

    事件报警投递到日志服务的指定日志库。

    通道沉默周期

    报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:5 分钟、15 分钟、30 分钟、60 分钟、3 小时、6 小时、12 小时和 24 小时。

    某监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。

    例如:当 通道沉默周期 选择 12 小时 时,如果报警未恢复正常,则间隔 12 小时后,云监控会再次发送报警通知。

  6. 单击 确定,完成系统事件规则创建。