如何监控起搏器是否仍在工作?所有节点是否都在线,而不是处于待机状态,甚至离线/关闭状态?
监控服务不是问题,可以直接进行监控。但我仍然不确定是否应该监控 crm 的状态,如果应该,该怎么做。
答案1
默认情况下,如果 crm 出现故障,您会知道,因为机器会重新启动。我们在工作中运行 Nagios 检查,它会对 Pacemaker 配置进行各种检查(确保 is-managed-default 不为假,没有资源具有非零故障计数,诸如此类的事情)——我不知道我们从哪里得到它,但大概它就漂浮在某个管道周围。