我们有一个服务,通过监听心跳来监控我们的服务器群,如果服务器没有响应,就会发送电子邮件通知。当这种情况发生时,我们中的一个人会 ssh 登录并重新启动服务器。
我认为一定有一些软件工具可以自动执行手动重启,最好是开源工具。如果有,你能推荐一些吗?
答案1
SSH 可以做你想做的事(通过无密码密钥登录,以及远程命令重启机器)。
如果你需要这样的工具,那你就有更严重的问题了——你应该调查一下为什么这些机器需要重新启动并解决该问题。
答案2
与 voretaq 所说的类似,您应该真正研究重启的根本原因,但大多数监控系统允许您根据操作执行本地脚本。我只需创建一个 shell 脚本并发出“shutdown -r now”即可重新启动该框。您还可以包含定时倒计时而不是“now”。
答案3
您应该通过运行 /etc/init.d 中的相应脚本或“service [servicename] start”来重新启动未能响应的服务,而不是重新启动整个服务器。