系统通过采集各种指标、日志和链路等数据,并进行海量数据的清洗、计算。以此来支撑产品层的应用监控、业务监控、平台监控、基础设施监控、告警管理和分布式链路等能力。作为一个企业级产品,系统提供资源租户隔离、访问鉴权控制和监控配置模板等企业级特性。并且提供数据高可用、服务高可靠、双机房容灾部署等平台特性。
基于系统丰富数据和强大功能,可以支撑容灾巡检、故障重放、弹性扩缩、微服务治理和全链路压测等场景。
应用监控
系统能同时监控容器应用和经典应用,并通过 LDC、IDC 和单机实例等多视角、多维度逐层下钻分析,实时展现服务实例、依赖的中间件和基础资源运行状态、使用趋势和告警信息,发掘应用故障所在的层级和对象,保证应用的流畅运行。
业务监控
系统提供了灵活的、基于业务场景的自定义业务监控,通过业务监控可将不同监控图表展示到同一个屏幕上,通过不同的大盘模板、统计模板等形式来展示可观测数据,例如,分钟级多 Key、TopN 等,让用户可以全面、深入地掌握业务数据。
中间件监控
系统默认集成了对消息、Mesh、数据库等中间件的监控,并支持在应用监控中查看应用所调用各中间件的情况。
基础资源监控
支持对物理机、虚拟机、Kubernetes 集群和原生容器等资源的监控。
分布式链路
分布式链路帮助运维人员、开发人员和架构师看清楚复杂的大规模微服务架构下的应用及服务之间的复杂调用关系、性能指标、出错信息与关联日志,从而实现故障根因分析、服务治理、应用开发调试、性能管理、性能调优、架构管控、故障定责等运维开发工作。
告警管理
针对各资源对象,系统允许用户灵活地配置自定义告警规则,并支持多种订阅方式,如邮件、短信、钉钉等。当监控数据满足阈值条件时,第一时间通知对应的运维人员,帮助其发现异常及原因。
企业级特性
在企业级特性层面,RMS 包含的能力如下:
提供多层级业务和资源隔离机制,比如租户、workspace 等,保证监控数据的安全性。
支持监控具有多 VPC 服务实例的应用,并以应用中心视角展示监控数据。
支持监控配置模板导入与导出,使测试环境的应用监控配置可在生产环境一键激活,避免了重复配置,也保证了发布流程的标准化和可控性。