监控类型概述

更新时间: 2024-03-19 17:04:38

自定义监控提供数据统计的监控产品类型,您可以配置个性化的监控项。本文介绍监控产品的类型及部分应用示例。

监控类型

监控产品的类型以统计指标为依据进行划分,主要分为常用、高级类型。具体可参考下表。

名称

类别

应用场景

备注

分钟统计/无 Key

常用

统计单业务量每分钟的数据。

通过筛选日志固定位置的关键字,统计单个指标分钟级的数据,如统计某个接口在一分钟内被调用的总量等。

支持日志关键字筛选

分钟统计/多 Key

常用

统计 N 个维度的 N 个 Key 业务量每分钟的数据,如统计系统各个接口分别被调用的总量。

通过配置日志的 Group By 维度,统计各维度各 Key 数据,等同于 SQL 中 Group By 的功能。

支持日志关键字筛选

大盘

常用

将监控项通过灵活的配置,以报表及走势图形式展现。

只做报表展现,不支持告警配置。所有告警设定在配置监控项时完成。

常用服务指标

常用

统计单业务或 N 个维度的 N 个 Key 业务的总量、成功量、失败量、成功率、平均耗时 5 个统计项。

支持日志关键字筛选

秒级统计/无 Key

常用

统计单业务量每秒的数据,如统计系统某个接口每秒被调用的总量。

通过对日志固定位置的关键字筛选,统计单个指标的每秒数据。

秒级统计可以更及时的查看数据及排查问题,但所需要的存储空间也更大,秒级统计/无 Key 一天需要存 86400 个数值(24 小时/天 * 60 分/小时 * 60 秒/分 = 86400 秒/天),所以请有选择地使用。

按秒级统计数据,支持日志关键字筛选,不支持告警配置

秒级统计/多 Key

常用

统计 N 个维度的 N 个 Key 业务量每秒的数据,如统计系统各个接口分别被调用的总量。

通过配置日志的 Group By 维度,统计各维度各 Key 数据,等同于 SQL 中 Group By 的功能。

秒级统计可以更及时的查看数据及排查问题,但所需要的存储空间也更大,秒级统计/多 Key 一天需要存 86400 * N 个数值(24 小时/天 * 60 分钟/小时 * 60 秒/分 = 86400 秒/天,N 代表 Key 的数量),所以请有选择地使用。

按秒级统计数据,支持日志关键字筛选,不支持告警配置。

分钟统计 Top

常用

统计维度的多个 Key 的每分钟的数据,并对数值排序,展现前 N 个最高数值的 Key,如统计平均耗时前 10 的错误码。

通过计算多维度数值在每分钟内的大小,再将数值进行排序,展现前 N 个 Key 及其数值。

-

单笔数据 Top

常用

对单条日志的数值维度进行排序,查看最高 N 个单笔业务,如统计耗时前 10 的单笔订单。

-

匹配查找告警

高级

统计日志中固定位置的关键字出现次数,达到一定量后进行告警。

例如:日志中,打印日期后出现 Error 关键字就发送告警。

  • 只有告警功能,无数据展现。

  • 告警内容为符合告警条件的日志内容。

  • 可自定义告警文案。

归档统计

高级

对一个秒级数据源,按小时、天、周、月统计数值。

只做统计,不做告警使用。

应用示例

示例一

假设存在下述日志:

2012-11-1111:11:11粤A123XX,广州北收费站,G25,广州,¥50
2012-11-1111:11:12粤A123XX,广州北收费站,G26,广州,¥50
2012-11-1111:11:13粤A123XX,广州北收费站,G27,广州,¥50
2012-11-1111:11:14粤A123XX,广州北收费站,G27,广州,¥50
2012-11-1111:11:15粤A123XX,广州北收费站,G26,广州,¥50
……
  • 分钟统计/无 Key :要从上面这批日志里了解在 2012-11-11 11:11 这一分钟,广州北收费站共计通过多少车辆,使用分钟统计/无 Key,通过“广州北收费站”关键字筛选,统计日志行数,就可以可统计出广州北收费站的分钟级数据。

  • 分钟统计/多 Key :要从上面这批日志里了解在 2012-11-11 11:11 这一分钟,每个收费站各通行了多少辆车,使用分钟统计/多 Key 对收费站这个维度进行 Group By 统计,就可以统计出每个收费站的分钟级数据。

  • 分钟统计 Top :在统计收费站车辆通行数量的场景里,全中国有几十万个收费站,我们并不需要每个收费站、每分钟的历史数据(因为绝大部分时间里大部分的收费站都是空闲的,数据都是 0,全部统计记录会浪费很多成本)。假设某交警部门想要在节假日期间分析出当前流量最大的收费站,以便做出交通警力调配。这种场景可以使用分钟统计 Top 监控功能,在上例里只需要万分之一的成本,就能实现此需求。

  • 匹配查找告警:要从上面这批日志里排查车牌为“粤 A12345”这辆车的去向,只要它出现在任何一个收费站就报警。使用匹配查找告警,通过车牌“粤 A12345”关键字筛选,就能对这辆车进行监控。

示例二

假设存在下述日志:

2012-11-1111:11:11粤 A123XX,广州北收费站,G25,广州,¥50,2340ms,Y
2012-11-1111:11:12粤 A123XX,广州北收费站,G26,广州,¥50,3209ms,Y
2012-11-1111:11:13粤 A123XX,广州北收费站,G27,广州,¥50,4200ms,Y
2012-11-1111:11:14粤 A123XX,广州北收费站,G27,广州,¥50,5700ms,Y
2012-11-1111:11:15粤 A123XX,广州北收费站,G26,广州,¥50,8500ms,Y
……

常用服务指标:要从日志中统计每分钟每个收费站收费多少车辆、成功收费多少车辆、多少车辆收费失败、平均收费时长多少,使用常用服务指标对收费站这个维度进行 Group By,将收费时长维度配成耗时,再配置结果维度,即可统计出每个收费站收费 总量、成功量、失败量、成功率、收费时长 等的分钟数据。

示例三

假设存在下述日志:

2012-11-1111:11:11粤A123XX,广州北收费站,G25,广州,¥50,收费员-张三
2012-11-1111:11:12粤A123XX,广州北收费站,G26,广州,¥50,收费员-李四
2012-11-1111:11:13粤A123XX,广州北收费站,G27,广州,¥50,收费员-王五
2012-11-1111:11:14粤A123XX,广州北收费站,G27,广州,¥50,收费员-李四
2012-11-1111:11:15粤A123XX,广州北收费站,G26,广州,¥50,收费员-张三
……

单笔数据 Top :假设某交警部门正在调查乱收费现象,想知道每分钟里收费最高的前 100 笔记录。在这前 100 笔记录中,收费金额超过 ¥500 就要介入调查。在这种场景下,不要使用 Group By 对收费员维度进行统计,因为这样会产生几十万、几百万的无效数据长期占用资源。使用单笔数据 Top 不仅能用极低的成本找到前 100 笔记录,而且能查询到每一笔记录的详情。

上一篇: 自定义监控概述 下一篇: 创建大盘
阿里云首页 金融分布式架构 相关技术圈