如何最好地监控/记录 eth0 上的问题？

Question 1

如果它不在 /var/log/messages 或内核的 dmesg 中，那么我不确定哪个实用程序会为您提供解决问题的信息。我会尝试在 /etc/rsyslog.conf 中将日志记录设置为调试，查找包含 /var/log/messages 的行并将信息更改为调试。

根据我的经验，CentOS 中 eth0 消失与 NetworkManager 有关。请确保禁用 networkmanager，然后启用网络。我曾看到这种情况发生在我通过创建/修改手动配置网络/etc/sysconfig/network-scripts/ifcfg-eth0但忘记了chkconfig networkmanager off之后chkconfig network on。

下次发生故障时，最好的办法可能是通过 KVM 实时排除故障。我可能会尝试的另一件事是循环运行类似ethtool每 30 - 60 秒获取链接状态的操作，以获取故障发生的时间范围。当您有时间戳或非常小的时间范围需要关注时，阅读日志会容易得多。:)

最后，如果确实发生了某些事情，/etc/sysconfig/network-scripts/ifcfg-eth0那么您可以创建并审核策略来监视该文件是否有任何更改。

Answer

如果它不在 /var/log/messages 或内核的 dmesg 中，那么我不确定哪个实用程序会为您提供解决问题的信息。我会尝试在 /etc/rsyslog.conf 中将日志记录设置为调试，查找包含 /var/log/messages 的行并将信息更改为调试。

根据我的经验，CentOS 中 eth0 消失与 NetworkManager 有关。请确保禁用 networkmanager，然后启用网络。我曾看到这种情况发生在我通过创建/修改手动配置网络/etc/sysconfig/network-scripts/ifcfg-eth0但忘记了chkconfig networkmanager off之后chkconfig network on。

下次发生故障时，最好的办法可能是通过 KVM 实时排除故障。我可能会尝试的另一件事是循环运行类似ethtool每 30 - 60 秒获取链接状态的操作，以获取故障发生的时间范围。当您有时间戳或非常小的时间范围需要关注时，阅读日志会容易得多。:)

最后，如果确实发生了某些事情，/etc/sysconfig/network-scripts/ifcfg-eth0那么您可以创建并审核策略来监视该文件是否有任何更改。

Question 2

仅供将来参考，我终于发现了问题所在。

这实际上是由于 CentOS 内核的 timesync tx 控制寄存器未按预期设置所致。

参考： https://groups.google.com/forum/#!topic/springdale-users/bBqrE545sYo http://bugs.centos.org/view.php?id=6810

最后，在我升级到新服务器后，这个问题就自行解决了。

Answer

仅供将来参考，我终于发现了问题所在。

这实际上是由于 CentOS 内核的 timesync tx 控制寄存器未按预期设置所致。

参考： https://groups.google.com/forum/#!topic/springdale-users/bBqrE545sYo http://bugs.centos.org/view.php?id=6810

最后，在我升级到新服务器后，这个问题就自行解决了。

如何最好地监控/记录 eth0 上的问题？

答案1

答案2

相关内容