业务实时监控(Real-time Monitoring Service,简称 RMS)是一款具有可视化监测能力的金融级监控产品。基于日志、指标、链路等海量数据进行多维聚合,向用户提供业务监控、应用监控、云原生监控、基础资源监控、日志查询分析、分布式链路等多角度的可视化监测功能,有丰富的可视化大盘,并提供了告警订阅功能。该服务可以帮助运维、研发、SRE (Site Reliability Engineer)等快速地发现问题、定位问题、分析问题、解决问题,为线上系统可用率提供有效保障。
业务实时监控支持的功能特性如下:
全方位实时监控:提供业务、应用、基础资源、云原生等各种视角的监控能力,可实现关键指标秒级、普通指标分钟级的监控,具有高可靠、高时效、低延迟的特点。
灵活的报警规则:可根据业务特征、时间段、重要程度等维度设置报警规则,实现不误报、不漏报。
便捷的自定义配置:具有丰富的自定义产品配置功能,可便捷、高效地进行产品、报警配置。
开放的技术栈配置: 可实现 Kubernetes、SOFA 技术栈应用部署即监控,通过简单技术栈配置,即可接入并监控非标业务应用。可视化大盘:丰富的可视化大盘,帮助您定制个性化的监控大盘。
分布式链路:提供应用拓扑和链路查询功能,观测应用及服务之间的复杂调用关系、性能指标、出错信息与关联日志,从而实现故障根因分析、服务治理、应用开发调试、性能管理、性能调优、架构管控、故障定责等运维开发工作。
日志查询和日志关联:提供日志查询和日志关联功能。用户不仅可以对日志执行查询操作,还可以进行历史查询和上下文查询,以及查看 Error 指标关联的错误日志和链路关联业务日志,更加方便高效地进行问题分析定位。
低资源占用:在可靠传输大量监控数据时,保证对宿主机的 CPU、内存等资源的极低占用率。
高可用:提供万台设备的分钟级监控部署能力,故障自动恢复,集群可伸缩。
稳定高效的时序和数据存储:在线持续聚合数据,保证数据容量可控,提供智能分级存储、存放策略。