我有一个异地服务器,如果我开车去办公室就可以亲自到达,但最近它遇到了一些稳定性问题。
所以我不必等到星期一才重新启动服务器,有没有办法让服务器在崩溃时自动重新启动?
这是一个好主意吗?
答案1
Xserve 是最后一款配备控制芯片的 Mac 硬件,可使用专用硬件来监控系统。
Mac OS X Server 一直有一个类似看门狗的软件进程(最初称为 watchdog - 现在称为 launchd),所以最好的选择是将其打开。
如果您发现内置挂起检测功能不足,那么下一步就是购买一个可由互联网控制的电源插座,然后简单设置监视器/响应时间测量并触发重新启动或警报,以查看人们是否可以登录来解决所提出的任何问题。
答案2
Mac OS X 和 Mac 硬件没有任何类型的看门狗功能,无法在崩溃后重新启动。所有 Mac 都可以设置为在崩溃后重新启动。电源(检测)失败通过“节能器系统偏好设置”面板,但不适用于崩溃。
基于 Intel 的 Xserves 支持遵循事实上的标准智能平台管理接口 (IPMI) 的 Lights Out 管理 (LOM) 实施,它允许您为内置以太网接口上的微控制器分配单独的 IP 地址,以及远程重启(以及关闭和冷启动)Xserve 等操作。
由于两个主要问题,设置起来有点麻烦:
你必须使用分离LOM 功能的 IP 地址。不要错误地尝试使用主机 Mac OS X 的 IP 地址,因为这将发生冲突,并且以太网接口将吞噬所有本应发送到 Mac OS X 的 IP 数据报。
由于某些无法解释的原因,以太网微控制器的 LOM/IPMI 功能无法使用 ARP 来查找默认网关的 MAC 地址,因此您必须静态配置接口以了解其默认网关的 MAC 地址,并且只是希望您的默认网关路由器不会在您不注意的时候故障转移到不同的 MAC 地址或被具有不同 MAC 地址的新盒子取代。
服务器监视器应用程序 (/Applications/Server/Server Monitor.app) 为您提供了一个 GUI 来设置其中的一些内容,但配置静态 MAC 地址必须从 中完成ipmitool(1)
。
...
嗯,您可能能够使用该pmset(1)
命令安排定期关机事件,然后安排开机事件,然后使用 cron 或 launchd 作业取消它,并在机器未崩溃的情况下将其重新安排到将来的某个时间。我知道计划的开机事件由系统管理控制器处理,但我不知道关机事件是如何处理的。如果它们也以某种方式由 SMC 处理,那么我想它们即使在崩溃/冻结/挂起/崩溃/停止的系统上也有可能工作。我自己从未尝试过。我认为它只有 10% 的成功率。