rhel 7.x 机器意外故障和消息文件

rhel 7.x 机器意外故障和消息文件

今天我们的 Linux 服务器 rhel 7.6 出现了奇怪的行为

由于某种原因服务器宕机了

从消息文件中我们可以看到服务器停止可用 Oct 16 18:17:22

一段时间后,我们在 - 处启动服务器 Oct 18 04:42:46(开机)

Oct 16 18:17:22 linux avahi-daemon[1140]: Invalid response packet from host 45.52.7.60.
Oct 16 18:17:22 linux avahi-daemon[1140]: Invalid response packet from host 45.52.91.79.
Oct 16 18:17:22 linux avahi-daemon[1140]: Invalid response packet from host 45.52.56.84.
Oct 16 18:17:22 linux avahi-daemon[1140]: Invalid response packet from host 45.52.84.118.
Oct 16 18:17:22 linux avahi-daemon[1140]: Invalid response packet from host 45.52.46.210.
Oct 16 18:17:22 linux avahi-daemon[1140]: Invalid response packet from host 45.52.81.152.
Oct 16 18:17:22 linux avahi-daemon[1140]: Invalid response packet from host 45.52.84.119.
Oct 16 18:17:22 linux avahi-daemon[1140]: Invalid response packet from host 45.52.130.225.
Oct 16 18:17:22 linux avahi-daemon[1140]: Invalid response packet from host 45.52.81.103.
Oct 16 18:17:22 linux avahi-daemon[1140]: Invalid response packet from host 45.52.92.110.
Oct 16 18:17:22 linux avahi-daemon[1140]: Invalid response packet from host 45.52.236.182.
Oct 16 18:17:22 linux avahi-daemon[1140]: Invalid response packet from host 45.52.77.79.
Oct 16 18:17:22 linux avahi-daemon[1140]: Invalid response packet from host 45.52.73.52.
Oct 16 18:17:22 linux avahi-daemon[1140]: Invalid response packet from host 45.52.88.172.
Oct 16 18:17:22 linux avahi-daemon[1140]: Invalid response packet from host 45.52.61.224.
Oct 16 18:17:22 linux avahi-daemon[1140]: Invalid response packet from host 45.52.98.223.
Oct 16 18:17:22 linux avahi-daemon[1140]: Invalid response packet from host 45.52.78.250.
Oct 18 04:42:46 linux rsyslogd: [origin software="rsyslogd" swVersion="7.4.7" x-pid="1122" x-info="http://www.rsyslog.com"] start
Oct 18 04:42:42 linux kernel: Initializing cgroup subsys cpuset
Oct 18 04:42:42 linux kernel: Initializing cgroup subsys cpu
Oct 18 04:42:42 linux kernel: Initializing cgroup subsys cpuacct
Oct 18 04:42:42 linux kernel: Linux version 3.10.0-327.el7.x86_64 ([email protected]) (gcc version 4.8.3 20140911 (Red Hat 4.8.3-9) (GCC) ) #1 SMP Thu Oct 29 17:29:29 EDT 2015
Oct 18 04:42:42 linux kernel: Command line: BOOT_IMAGE=/vmlinuz-3.10.0-327.el7.x86_64
Oct 18 04:42:42 linux kernel: Disabled fast string operations
Oct 18 04:42:42 linux kernel: e820: BIOS-provided physical RAM map:

由于我们没有太多详细信息,为什么服务器会意外停机,

那么我们唯一看到的是avahi-daemon

所以我的问题是 - 剂量 avahi-daemon 服务可能是机器意外关闭的原因?

尽管这不合逻辑,但只有avahi-daemon 消息是机器停机之前的消息

答案1

如果是真正的服务器,它就有一个 BMC。您至少应该检查 BMC 事件日志。这至少会告诉您一些有关服务器消失原因的信息。 (考虑到 syslog 只是一个由守护进程创建的普通文件 - 这意味着除了硬件问题之外,守护进程可能已经死亡,或者文件系统变得混乱。这就是 BMC 如此有价值的原因。)

还有一些事件不会进入系统日志(出于明显的原因,大多数内核恐慌)。这些将显示在控制台上 - 真正的服务器应该将其控制台定向到 BMC 正在侦听的串行端口。这意味着您可以通过网络从另一台服务器连接到控制台,并查看显示的内容。有时物理控制台会显示相同的信息(但请记住关闭屏幕消隐)。有些程序将通过 IPMI 连接到控制台并记录出现的所有内容(例如 conman)。

答案2

根据公开的 Whois 查询信息,45.52.*.*该网段属于 Frontier Communications of America, Inc.。由于您收到来自该网段的所有无效响应,因此 avahi-daemon 似乎并未被限制接受来自您自己网络之外的数据包,并且它是响应来自您的互联网服务提供商的所有其他客户的随机查询。

正如 Artem S. Tashkinov 所说,如果你不需要avahi-daemon,你应该禁用它。即使您这样做,您也应该将其限制为仅响应来自您自己网络的查询。

如果您的服务器有硬件管理处理器(有时也称为 BMC 或底板管理控制器),它可能记录了有关崩溃的一些信息。如果管理处理器存在并且与 IPMI 兼容,则ipmitool sel elist可能会显示硬件日志事件列表;这些可能表示断电(例如停电,或管理员拔掉插头来运行楼层缓冲区?)、内存故障(如果使用 ECC 内存)或其他硬件故障,具体取决于服务器硬件的实际功能。

答案3

那些avahi-daemon服务可能是机器意外关闭的原因?

不,100%。

考虑到服务器宕机之前没有记录任何内容,这很可能表明硬件故障、断电或有人只是按下了重置按钮。

如果您的服务器包含 IPMI/BMC 芯片,您可以使用 检查其硬件日志ipmitool

另外,您不必在服务器上安装 avahi-daemon。

相关内容