应用监控概述

应用监控提供应用分析能力,通过一个入口总览分析应用相关的所有监控数据。当应用通过 SOFAStack CAFE(Cloud Application Fabric Engine)云应用引擎部署成功后,RMS 会自动监控应用,并以各种维度和视角的监控大盘展示,满足应用研发或运维人员对应用的监控,进而保证应用运行稳定性。

背景信息

应用监控支持容器应用和经典应用,并将应用的指标由内而外分为如下维度。

维度

示例

说明

服务指标

Error、Service、SAL、CAL、DAL

  • 框架配置

    基于 SOFA/SOFABoot 框架开发的应用,PV、Service、SAL、SQL、Cal、CE Thread 等监控项会自动基于默认框架下的日志路径采集指标,只需开启监控即可。

    具体框架日志路径可参考 服务指标

  • 自定义监控配置

    • 对于非 SOFA/SOFABoot 框架开发的应用:需要为每个监控项配置采集日志路径和列值,比如 Error、Dal。

    • 对于基于 SOFA/SOFABoot 框架开发的应用:如果不希望使用默认日志路径监控的,也可以切换为 自定义监控配置

系统指标

CPU、内存、磁盘

容器应用的系统指标通过 asar 采集主机上容器的指标是容器的指标,经典应用的系统指标通过 asar 采集主机上进程的指标。

JVM 指标

GC、线程

Java 应用启动后,默认会在 /tmp/hsperfdata_${username} 目录下以该进程的 id 为文件名新建文件,并在该文件中存储 jvm 运行的相关信息,其中 userName 为当前的用户名,/tmp/hsperfdata_${username} 目录会存放该用户所有已经启动的 Java 进程信息。

JVM 指标通过解析 /tmp/hsperfdata_${username}/${pid} (例如 /tmp/hsperfdata_admin/1234)来实现。

端口探测

/

端口探活是从 Agent 发起对应用服务的端口检测。

例如,某一服务暴露 12200 端口,正常情况下通过运行 ping 命令即可连通,但如果服务出现宕机,则该端口无法连通。

通过端口探测,可周期性判断应用服务的存活状态,从而保证应用可提供对外服务。

为了保证应用高可用,一般是多实例部署或是单元化部署,不同应用实例(单机)可能会分布在不同的 IDC(Internet Data Center)机房以及不同 LDC(Logic Data Center)逻辑机房,所以RMS 将每个维度的指标数据都分成三个视角(即单机视角、IDC 视角、LDC 视角)进行聚合,从 IDC、LDC 或单机的空间分布和时间分布上对数据进行对比分析。

功能入口

  1. 登录控制台。

  2. 在左侧导航栏上,单击 应用监控 进入应用监控页面。

    应用监控页面提供 我的应用全部应用 两个类别的应用汇总信息。目前仅展示在当前 workspace 下具有实例的应用。

    • 全部应用:在 CAFE 中创建并发布应用后,RMS 会将所有发布的应用同步到 全部应用 中。

    • 我的应用:在 全部应用 页签下,选择某个应用,单击 更多 > 收藏应用 即可将该应用添加到 我的应用

全部应用

单击 全部应用 页签,可以查看以下信息:

类别

说明

概述信息

  • 应用总数

  • 告警应用数

列表信息

  • 应用名称

  • 告警指标告警情况

  • 告警规则数

  • 未配置告警指标

  • 告警开关

  • 操作:

    • 编辑:单击 编辑 会跳转到应用的配置界面。

    • 更多:收藏应用、订阅告警、查看告警历史、查看告警规则、暂停告警。

我的应用

单击 我的应用 页签,可以查看以下信息:

类别

说明

概述信息

  • 关注总数

  • 健康应用数

  • 异常应用数

  • 健康度:健康应用占总应用的比例。

列表信息

  • 应用名称

  • 告警指标告警情况

  • 告警规则数

  • 未配置告警指标

  • 告警开关

  • 操作:订阅告警、查看告警历史、查看告警规则。

在该页面上,您还可以执行如下操作:

  • 批量添加关注:支持批量添加关注应用。

  • 批量取消关注:支持批量取消对部分应用的关注。

  • 复制关注的应用:可以复制关注的应用,便于后续处理,例如发送给好友。