我有一个运行 Ubuntu 14.04 的 Linode,其堆栈由 ServerPilot.io 管理。
唯一真正的修改是我以有限的方式运行 HHVM。
今晚我们遇到了一件奇怪的事情。我收到网站已关闭的通知。经过调查,我根本无法通过 SSH 连接到服务器,并且未返回 ping。
我通过 Linode 供应的控制台登录,一切看起来都很正常。所有预期的服务均已启动,但我无法通过 ping、telnet 等连接到任何外部主机。
基本上,网络似乎已关闭。
自从我完成 *nix 系统管理以来已经有好几年了,所以在搜索了我能找到的所有日志之后,我放弃并重新启动了服务器,一切又恢复正常了。
我很好奇是否有人可以向我指出下次发生这种情况时应该查看的日志,以便我可以确定发生这种情况的原因、修复它并防止它再次发生
PS 唯一值得注意的是 CPU 和网络流量在中断之前大幅飙升。图表在这里:http://cl.ly/image/2L0n1Y3A2v3h
答案1
在你的情况下,我会尝试通过发出以下命令来获取网络备份:
ifdown eth0
ifup eth0
并且只有重启后才行不通。
由于我无法看到网络流量是流出还是流入,也无法指示服务器上实际运行的内容,所以很难说发生了什么。
您能否从日志中看到是否正在执行一些昂贵的(CPU 方面的)http 请求?
可能是由于流量过多,系统被您的提供商“摆脱困境”,并且网络在重新建立互联网连接后没有尝试重新连接。
当然,系统有可能受到损害。我希望您已及时更新安全补丁。