我有一台运行了 5 个多月的服务器,突然它停止响应。我无法通过 ssh 进入它或执行其他任何操作,所以我决定重新启动它,然后问题就解决了。
我正在试图弄清楚发生了什么,但我不知道该去哪里找。我开始查看,/var/log
但里面有大量文件,我不确定我应该关注哪一个。我正在慢慢地浏览每一个文件,但如果有人能给我指明正确的方向,那就太好了。
谢谢!
答案1
我将首先从 开始/var/log/messages
,这是大多数通用输出的默认位置。它将包括启动消息和任何内核警告。根据问题的类型,可能没有剩余的取证数据。例如,RAM 可能不会产生错误。磁盘错误将记录在日志中。
SSH 可能只是坏了。如果不知道控制台的状态,很难确切地说。通常,一个稳定的、没有改变的 Linux 机器突然锁定可能是硬件问题。大多数硬件问题都需要进一步的故障排除和诊断。
如果您能提供更多详细信息,我可能会给您进一步的建议。
答案2
也许只有 sshd 宕机了?PING 服务器有响应吗?如果您想让您的服务(如 ssh、ftp、apache 等)始终正常运行,请使用“monit”。
答案3
您可以粘贴服务器重新启动之前 /var/log/messages 的输出吗?
如果不检查日志文件,就不可能找出锁定的原因。
锁定现象是反复发生的还是一次性事件?