告警管理

EMAS提供了告警管理的能力,支持页面的异常检测和预警。

概述

告警功能是阿里云 EMAS 提供的另一项重要工具,旨在帮助用户实时监测关键业务指标。当这些指标达到预设的阈值时,系统会触发告警并推送通知。通过利用多维度分析的下钻能力,用户能够深入了解告警的背景和原因,做出及时的响应和调整。

功能介绍

告警设置

  • 功能描述:用户可以根据业务需求设置各种告警规则。当特定指标超过或低于预设阈值时,自动触发告警。

  • 使用建议:在关键业务指标(如 JS 错误率、白屏率、页面加载时间)上设置告警,以确保及时响应潜在问题。

多维度下钻分析

  • 功能描述:在告警触发后,用户可以利用多维度分析功能进行下钻,深入分析引发告警的具体因素。

  • 使用建议:通过下钻至具体的时间段、设备类型或地域,快速识别并定位问题根源。

应用场景

实时异常监测

  • 场景描述:运维团队设置告警规则来监测 JS 错误率和白屏率。当某个页面的错误率突然升高时,立即触发告警并通知相关技术人员。

  • 关键指标:JS 错误率、白屏率。

  • 应用价值:快速识别异常事件,缩短响应时间,减少用户影响。

性能下降预警

  • 场景描述:开发团队设置页面加载时间的阈值告警,监控应用性能。当页面加载时间超过预设标准时,触发告警。

  • 关键指标:页面加载时间、首屏渲染时间。

  • 应用价值:及时发现性能下降问题,进行优化调整,提升用户体验。

资源消耗控制

  • 场景描述:通过告警监测静态资源的加载时间和请求成功率,确保资源加载正常。当资源加载时间过长或请求失败率增加时,触发告警。

  • 关键指标:资源加载时间、请求失败率。

  • 应用价值:维护资源加载效率,保障应用正常运行。

使用告警管理功能

1. 新建告警联系人

  • 登录EMAS管理控制台,查找您的项目,单击项目,进入EMAS概览页。

  • 在顶部导航栏,选择研发工具

  • 在页面左侧导航栏选择应用监控 > 告警管理,打开告警管理页面。

  • 告警管理页面,单击右上角的告警设置,选择联系人管理页签。

  • 单击新增联系人,打开新增联系人页面。

  • 填写联系人名称手机号Email钉钉机器人webhook地址,单击确定

    说明

    获取钉钉机器人webhook地址请参见如何配置告警钉钉机器人

2. 新建联系人组

  • 告警设置页面,选择联系人组管理页签。

    image.png

  • 单击新建群组,打开新增联系组页面。

  • 填写联系组名称,选择创建好的告警联系人,单击确定

3. 新增告警规则

  • 登录EMAS管理控制台,查找您的项目,单击项目,进入EMAS概览页。

  • 在顶部导航栏,选择研发工具

  • 在页面左侧导航栏选择应用监控 > 告警管理,打开告警管理页面。

  • 告警管理页面,单击右上角的告警设置,选择告警规则页签。

  • 告警规则页签,单击页面的新增规则

image

  • 新增告警规则页面,设置如下参数,单击确定

    参数

    说明

    告警名称

    输入告警的名称。

    问题类型

    选择需要配置告警的指标项。

    告警级别

    可选致命警告

    覆盖范围

    根据所选问题类型,选择对应覆盖范围。

    已支持的筛选条件:APP版本、设备ID、系统版本、品牌、机型、用户昵称、客户端IP、渠道、语言、页面、启动时间、触发时间、是否主线程、国家、省份、城市、分辨率、进程、运营商、CPU架构、聚合ID。

    触发条件

    可选择两种:

    • 同时满足以下条件。

    • 满足以下任一条件。

    说明

    • 可以添加多条指标策略。

    • 最近N分钟:检查数据的时间窗口大小。

    • 指标:不同问题类型下有不同的指标。

    • 筛选条件:

      • 阈值:单个时间窗口内异常数目达到一定量,就会触发报警。

      • 比:指单个时间窗口内,相对n个时间单位前同一时间窗口内的值,上涨或下跌幅度是否超过设置的值。

    允许通知时间段

    设置通知时间段及间隔时间。

    告警途径

    选择告警发送的方式,可选择邮件、短信、钉钉。

    说明

    需要告警联系人配置对应的联系方式后才能收到告警。

    联系人组

    选择配置好的联系人组。

  • 对于暂时不需要告警的规则,您可以在告警规则页签,单击操作列右侧的立即禁用来控制是否生效。

4. 查看告警

  • 在页面左侧导航栏,选择应用监控 > 告警管理,打开告警管理页面。

  • 登录EMAS管理控制台,查找您的项目,单击项目,进入EMAS概览页。

  • 在顶部导航栏,选择研发工具

  • 在页面左侧导航栏选择应用监控 > 告警管理,打开告警管理页面。

  • 您也可以通过时间问题类型告警级别规则名称来搜索告警信息。

    image.png

  • 单击单条告警右侧的分析处理,跳转至下钻数据查看页面。

    说明

    告警的分析处理页面,可以修改当前缺陷类型的状态,分为New、Open、Fixed。

FAQ

如何配置告警钉钉机器人

  • 在钉钉群添加钉钉机器人,并获取Webhook地址。

    选择指定钉钉群,在右上角单击群设置 > 机器人 > 添加机器人 > 自定义 > 添加。

    重要

    “添加机器人”页面的“安全设置”选项,必须选择“自定义关键词”选项,并添加关键词“EMAS”。

    添加机器人

  • 添加完成后即可获取Webhook地址,示例如下:

    image

    https://oapi.dingtalk.com/robot/send?access_token=XXXXXX

  • 应用监控控制台的联系人设置中,配置钉钉机器人的Webhook地址,详细操作请参见新建告警联系人