RHEL + 如何验证 dmesg 日志以找到意外重启的根本原因

RHEL + 如何验证 dmesg 日志以找到意外重启的根本原因

我们有 RHEL 7.6 服务器(VM 服务器)

执行了两次意外重启(我们可以从最后一个命令看到重启)

查看 dmesg 输出后,我们可以看到以下消息,

Jul  3 09:56:42 server_MA02 kernel: ata12: SATA link down (SStatus 0 SControl 300)
Jul  3 09:56:42 server_MA02 kernel: ata5: SATA link down (SStatus 0 SControl 300)
Jul  3 09:56:42 server_MA02 kernel: ata11: SATA link down (SStatus 0 SControl 300)
Jul  3 09:56:42 server_MA02 kernel: ata4: SATA link down (SStatus 0 SControl 300)
Jul  3 09:56:42 server_MA02 kernel: ata10: SATA link down (SStatus 0 SControl 300)
Jul  3 09:56:42 server_MA02 kernel: ata14: SATA link down (SStatus 0 SControl 300)
Jul  3 09:56:42 server_MA02 kernel: ata13: SATA lin

k down (SStatus 0 SControl 300)
Jul  3 09:56:42 server_MA02 kernel: ata15: SATA link down (SStatus 0 SControl 300)
Jul  3 09:56:42 server_MA02 kernel: ata16: SATA link down (SStatus 0 SControl 300)
Jul  3 09:56:42 server_MA02 kernel: ata20: SATA link down (SStatus 0 SControl 300)
Jul  3 09:56:42 server_MA02 kernel: ata21: SATA link down (SStatus 0 SControl 300)
Jul  3 09:56:42 server_MA02 kernel: ata26: SATA link down (SStatus 0 SControl 300)
Jul  3 09:56:42 server_MA02 kernel: ata19: SATA link down (SStatus 0 SControl 300)
Jul  3 09:56:42 server_MA02 kernel: ata29: SATA link down (SStatus 0 SControl 300)
Jul  3 09:56:42 server_MA02 kernel: ata32: SATA link down (SStatus 0 SControl 300)
Jul  3 09:56:42 server_MA02 kernel: ata28: SATA link down (SStatus 0 SControl 300)
Jul  3 09:56:42 server_MA02 kernel: ata31: SATA link down (SStatus 0 SControl 300)
Jul  3 09:56:42 server_MA02 kernel: ata25: SATA link down (SStatus 0 SControl 300)
Jul  3 09:56:42 server_MA02 kernel: ata30: SATA link down (SStatus 0 SControl 300)
Jul  3 09:56:42 server_MA02 kernel: ata22: SATA link down (SStatus 0 SControl 300)
Jul  3 09:56:42 server_MA02 kernel: ata18: SATA link down (SStatus 0 SControl 300)
Jul  3 09:56:42 server_MA02 kernel: ata17: SATA link down (SStatus 0 SControl 300)
Jul  3 09:56:42 server_MA02 kernel: ata23: SATA link down (SStatus 0 SControl 300)
Jul  3 09:56:42 server_MA02 kernel: ata24: SATA link down (SStatus 0 SControl 300)
Jul  3 09:56:42 server_MA02 kernel: ata27: SATA link down (SStatus 0 SControl 300)

上述消息是否可能是虚拟机执行意外重启问题的一部分?

答案1

当您说“VM 服务器”时,您的意思是服务器是托管 VM 的物理机,还是服务器是虚拟机?

如果日志来自物理机,则似乎大量SATA链路同时失效;也许是电源问题,或者SATA控制器问题?

如果服务器是虚拟机,这可能意味着主机突然停止向虚拟机提供虚拟磁盘:您应该检查物理主机的日志(或者联系其管理员,如果它由其他人托管)以查看主机是否有某种硬件问题。

相关内容