RMS 提供全局设置管理功能,帮助运维人员可通过界面白屏自定义配置,以及更好的排查监控问题,比如哪些资源对象被监控,采集多少个监控配置项,采集、存储时间等是否可修改。
监控运维遇到挑战
运维人员不清楚到底哪些主机部署了 PontusAgent,需要在各节点上通过命令查看。
用户无法感知 PontusAgent 版本,可能存在一个集群中有多个版本,需要手动进行升级。
Agent 管理帮您解决
RMS 提供 PontusAgent 查看和管理功能,帮助您全面掌握主机上的 PontusAgent 部署情况、PontusAgent 版本信息等。
PontusAgent 状态
PontusAgent 状态说明详见下表。
状态 | 说明 |
健康 | 为主机安装 PontusAgent 且状态正常运行。 |
未安装 | 主机未安装 PontusAgent。 |
安装中 | 正在为主机安装 PontusAgent。 说明 安装 PontusAgent 预计需要 3 分钟左右,请耐心等待。 |
安装失败 | 主机 PontusAgent 安装失败。 |
异常 | 主机 PontusAgent 功能异常。 |
时钟偏差 | 服务运行的机器与监控服务器时钟偏差大于 3s。 |
部署 PontusAgent
RMS 自动部署容器应用所在节点的 PontusAgent。对于经典应用所在节点的 PontusAgent,如果存在未安装或者安装失败的情形,可通过 Agent 管理进行部署。部署完成后,可查看主机的 PontusAgent 状态。
在左侧导航栏上,单击 设置 > Agent 管理。
在 Agent 管理 页,选择应用类型:
经典:经典应用运行在 ECS 上,RMS 通过定时任务检查 ECS 是否安装 PontusAgent,如果无则自动安装。
容器:容器应用运行在 K8s 集群上,RMS 通过 Daemonset 方式自动部署 ,保证所有新增主机都会有 PontusAgent。
选择主机节点,单击 部署 > 确定。
说明对于 容器 类型的应用,RMS 会自动部署容器应用所在节点的 PontusAgent。
部署预计需要 3 分钟左右,请耐心等待。
开启告警
Agent 管理模块现提供异常告警能力,当 Agent 异常时,比如未安装、失联等情况出现时,系统会针对异常 Agent 提供对应的告警通知,让运维人员快速感知到异常问题。
左侧导航栏上,单击 设置 > Agent 管理。
在 Agent 管理 页,选择应用类型 容器 或 经典。
单击 全局开启告警。
订阅告警
成功开启告警后,可以根据需要添加订阅。添加订阅后,后续的告警消息即可通过设定的方式(例如钉钉机器人或邮件)进行发送。
在 Agent 管理 页,单击 订阅告警。
在 订阅 面板,选择通知对象。
单击 确定。
关闭告警
如需关闭告警,单击 全局关闭告警。