云数据库 SelectDB 版提供了丰富的性能监控数据,方便您查看和掌握集群的运行状态。监控指标通过Grafana仪表盘展示,并使用预设的PromQL查询语句。本文介绍如何在控制台查看集群监控信息。
前提条件
已开通应用实时监控服务ARMS(Application Real-Time Monitoring Service)服务。具体操作,请参见开通ARMS。
操作步骤
在页面左上角,选择实例所在地域。
在实例列表页面,单击目标实例ID,进入到实例详情页面。
在左侧导航栏,单击监控告警。
在监控告警页面,选择监控页签。
如果存在多个集群,您可以在监控页签内的左上角单击cluster选择不同集群,以查看不同集群的监控信息。
说明监控指标通过Grafana仪表盘展示,并使用预设的PromQL查询语句。在编辑页面中,您可以修改PromQL以查看不同的监控指标,但是修改后的内容不支持保存。
监控指标看板默认展示最近1小时内的集群监控信息,您可在页面右上角选择时间自行调整。
监控项
云数据库 SelectDB 版监控项分为节点基础指标和集群请求指标两个维度。
节点基础指标
集群内节点的基础指标,集群以32核为一个节点步长。例如您的集群配置为64核则会将其分为两个节点。
监控项 | 说明 | 单位 |
CPU使用率 | 所选中集群的所有节点CPU使用率。如果扩容集群或其他资源消耗性操作前,您可以从这个图表中找到集群使用率最低的时间。 | % |
内存使用率 | 所选中集群的所有节点内存利用率。 | % |
内存使用量 | 所选中集群的所有节点内存使用量。如果内存使用量持续较高,您可以考虑对目标集群进行扩容,具体操作请参见集群伸缩。 | MB |
磁盘读写次数(IOPS) | 所选中集群的所有节点硬盘 I/O 利用情况。每100 GB硬盘缓存可提供约5000 IOPS,如果您需要更的高硬盘读写能力,可以考虑拓展更多的硬盘缓存或者集群。 | 次/s |
网络流入吞吐量 | 所选中集群的所有节点每秒通过网络写入的平均速度。 | Byte/s |
网络流出吞吐量 | 所选中集群的所有节点每秒通过网络读取的平均速度。如果网络读的查询速度较慢,您需要修改缓存设置,尽量的减少查询时的网络读取。 | Byte/s |
集群请求指标
云数据库 SelectDB 版集群的请求指标以及实例维度的指标。
监控项 | 说明 | 单位 |
每秒查询次数(QPS) | 每秒连接到集群的查询请求总数。 | 个 |
查询成功率 | 所选中集群每分钟内查询成功的查询语句占全部查询的比例。当查询成功率发生异常下降时,考虑是否出现了集群、节点的故障。 | % |
查询平均耗时 | 所选中集群每分钟内所有查询的平均耗时。 | ms |
99th 查询耗时 | 所选中集群给定时间内升序排列排在第99%位置的请求的响应时间;用于反映集群慢查询的速度。 | ms |
导入数据速度 | 所选中集群每秒导入的数据记录条数。 | Row/s |
数据合并 Compaction Score | 所选中集群数据文件的合并压力,Score越大,进行合并计算的压力越大。大于 2000 后会触发写入反压,数据合并压力大的表会出现数据写入失败。 | 无 |
失效节点数 | 当前集群失效节点的个数。 | 个 |
缓存命中率 | 缓存读写操作占所有读写操作的百分比。 | % |
缓存读写吞吐量 | 集群各节点硬盘每秒的读取/写入吞吐速率。 | Byte/s |
远端存储读吞吐量 | 单位时间内读取远端存储的数据量。 | Byte/s |
连接数 | 当前实例的会话数。 | 个 |
对象存储容量 | 当前实例数据所占用的对象存储容量。 | Byte |