Agent 管理

RMS 提供全局设置管理功能,帮助运维人员可通过界面白屏自定义配置,以及更好的排查监控问题,比如哪些资源对象被监控,采集多少个监控配置项,采集、存储时间等是否可修改。

监控运维遇到挑战

1
  • 运维人员不清楚到底哪些主机部署了 PontusAgent,需要在各节点上通过命令查看。

  • 用户无法感知 PontusAgent 版本,可能存在一个集群中有多个版本,需要手动进行升级。

Agent 管理帮您解决

2

RMS 提供 PontusAgent 查看和管理功能,帮助您全面掌握主机上的 PontusAgent 部署情况、PontusAgent 版本信息等。

PontusAgent 状态

PontusAgent 状态说明详见下表。

状态

说明

健康

为主机安装 PontusAgent 且状态正常运行。

未安装

主机未安装 PontusAgent。

安装中

正在为主机安装 PontusAgent。

说明

安装 PontusAgent 预计需要 3 分钟左右,请耐心等待。

安装失败

主机 PontusAgent 安装失败。

异常

主机 PontusAgent 功能异常。

时钟偏差

服务运行的机器与监控服务器时钟偏差大于 3s。

部署 PontusAgent

RMS 自动部署容器应用所在节点的 PontusAgent。对于经典应用所在节点的 PontusAgent,如果存在未安装或者安装失败的情形,可通过 Agent 管理进行部署。部署完成后,可查看主机的 PontusAgent 状态。

  1. 在左侧导航栏上,单击 设置 > Agent 管理

  2. Agent 管理 页,选择应用类型:

    • 经典:经典应用运行在 ECS 上,RMS 通过定时任务检查 ECS 是否安装 PontusAgent,如果无则自动安装。

    • 容器:容器应用运行在 K8s 集群上,RMS 通过 Daemonset 方式自动部署 ,保证所有新增主机都会有 PontusAgent。

  3. 选择主机节点,单击 部署 > 确定。

    说明
    • 对于 容器 类型的应用,RMS 会自动部署容器应用所在节点的 PontusAgent。

    • 部署预计需要 3 分钟左右,请耐心等待。

开启告警

Agent 管理模块现提供异常告警能力,当 Agent 异常时,比如未安装、失联等情况出现时,系统会针对异常 Agent 提供对应的告警通知,让运维人员快速感知到异常问题。

  1. 左侧导航栏上,单击 设置 > Agent 管理

  2. Agent 管理 页,选择应用类型 容器经典

  3. 单击 全局开启告警

订阅告警

成功开启告警后,可以根据需要添加订阅。添加订阅后,后续的告警消息即可通过设定的方式(例如钉钉机器人或邮件)进行发送。

  1. Agent 管理 页,单击 订阅告警

  2. 订阅 面板,选择通知对象。

  3. 单击 确定

关闭告警

如需关闭告警,单击 全局关闭告警