我有一台远程服务器,无需 24x7 全天候值守。但有时我会因为网络相关问题或断电而遇到停机。
但因为我离服务器很远,所以无法在停机时确定是因断电导致的处理时间损失还是网络断开。因此,在这两种情况下,我都无法通过 SSH 进入我的服务器。
只有在几个小时后,当服务器重新连接或重新启动时,我才知道出了什么问题。
有什么方法可以让我了解我面临的停机类型?例如,如果网络停机,可能会有一个应用程序向我发送短信警报。但我猜它仍然需要互联网才能工作。
任何建议都会对此有帮助。
答案1
如果你在远程服务器上托管重要内容,那么你应该注意获取具有某种带外管理。这通常采用基板管理控制器的形式,它实际上是服务器内部的一台独立计算机,您可以通过 Web 或 SSH 连接到它。
如今,它们通常还支持行业标准 IPMI,该标准有一个名为 openipmi 的开源客户端实现。
通过这种方式,即使服务器关闭,您也可以连接到管理控制台并查看机器的电源和网络状态。
但是,这只能让你诊断特定服务器的问题。如果发生更大范围的断电,比如整个机架的所有电源插座都断电了,那么 OOB 管理服务也无法运行,也无法判断断电的程度。你的服务器将没有网络,因为它使用的所有网络设备也将关闭。
同样,如果存在影响服务器及其管理端口的网络问题,那么您将无法判断其严重程度
最终,对于服务器之外的问题,您需要依靠托管服务提供商来告诉您发生了什么。如果没有,那么您就需要更好的托管服务提供商。