为什么我的 VPS 崩溃了(我该如何自己找出原因)?

为什么我的 VPS 崩溃了(我该如何自己找出原因)?

编辑:虽然这似乎是由于 Linode 弗里蒙特工厂停电造成的,但我过去也遇到过这个问题。如能得到任何帮助,我将不胜感激。


我希望你教我钓鱼。

是的,我在问“为什么我的 VPS 崩溃了?”我敢肯定,如果我给你我的服务器的 root 访问权限,你可以在 2 分钟内找到答案。我敢肯定,你可以告诉我发布我的错误日志,我会毫不犹豫地找到它们。但这不是我想要的。

我希望你教我钓鱼。

我遇到了一个问题,但我不知道根本原因。查看我的 Linode 图表可以了解我的意思。崩溃发生在网络流量和磁盘 IO 最低的时候。

替代文本

替代文本

当这种情况发生时,我应该首先查看哪些最常见、最基本的地方,我应该寻找什么?

当这种情况发生时我如何才能收到警报(这样我不会在服务器宕机的 8 小时内错过它)?

答案1

如果您的整个服务器由于与服务器无关的事件而崩溃,我会选择更好的提供商。停电导致机器停机的事实表明他们没有任何备用提供商——这很令人不安,尤其是因为他们似乎直到事后才提醒您。我很惊讶,因为 Linode 以相当可靠而闻名。

当这种情况发生时,我应该首先查看哪些最常见、最基本的地方,我应该寻找什么?

你在说什么? /var/log/*或类似的东西是当你不知道发生了什么时开始常规调试的好地方。不幸的是,对于未知的服务器崩溃,并没有真正的万能方法。你可能想要调查在你的许多服务中启用更详细的日志记录,但要事先警告——这可能会导致你的日志文件膨胀!

How can I be alerted when this happens (so I don't miss it for 8 hours while the server's down)?

对于这一点,我发现最简单的解决方案就是使用外部服务。对于我公司的面向前端的网站,我们使用以下实用程序:平多姆以及一些内部托管的工具,例如纳吉奥斯神经节. 全方位攻克这一难题才是最佳选择——拥有多个来源以及多个地理位置来检查您的正常运行时间是监控的标准做法。

请记住,虽然维护自己的版本很诱人,但拥有 (a) 超出您的网络和控制范围,并且 (b) 在全国和/或世界各地拥有多个服务器的东西会给您带来更好的回报。此外,大多数这些服务一点也不贵。

我希望这会有所帮助,或者至少让你走上正确的道路!

相关内容