我有一个运行 CentOS 7.2.1511 (Core) 的 EC2 实例,它今天早些时候停机了 7 个小时,没有任何内部事件日志记录导致它停机(关机、重启等)。然后,7 小时后它恢复了,并且完全正常。我检查了 中的每个文件/var/log/
,全面审核显示没有采取任何此类措施,但该实例在那 7 个小时里没有记录任何内容,证实了停机。亚马逊的 EC2 系统日志也没有提供任何关于此的见解。我没有设置任何警报以在运行状况检查失败时自动重启我的实例。以前有人遇到过类似的 Amazon EC2 问题吗?我有什么办法可以深入挖掘吗?
答案1
我肯定会进一步调查。话虽如此,你现在使用的是 CentOS 7,万岁!这也意味着日志文件通常不会再在 中找到/var/log
。它们已移至journald
。你可以journalctl
在此处阅读有关该命令的更多信息 (https://www.digitalocean.com/community/tutorials/how-to-use-journalctl-to-view-and-manipulate-systemd-logs) 和这里 (https://www.atlantic.net/community/howto/managing-system-logs-journalctl/) 和这里 (https://access.redhat.com/documentation/en-US/Red_Hat_Enterprise_Linux/7/html/System_Administrators_Guide/s1-Using_the_Journal.html),但您应该使用该命令来查找有关服务器如何/为何重新启动的更多信息。 停止的 ec2 实例是不正常的,我肯定会进一步调查。
此外,您还必须审核 AWS,以确保没有有权访问您的 AWS 控制台的任何人意外重新启动或关闭实例。