Linux Centos 6 时常不可用 - 操作系统和网络问题

Question 1

这是一个长远的打算，但我最近遇到了一个问题，在随机时间间隔内，某些系统会经历非常高的“系统” CPU 时间，这非常糟糕，以至于集群工具会认为系统已死并发出暂停等指令。

在出现问题时，请尝试top扩展1CPU，并查看是否有一个或多个处理器显示出奇怪的行为。

如果此问题确实存在，则可能看起来是这样的。请注意较高的“sy”值。

Cpu0  : 16.7%us, 25.0%sy,  0.0%ni, 50.0%id,  0.0%wa,  0.0%hi,  8.3%si,  0.0%st
Cpu1  : 28.6%us, 42.9%sy,  0.0%ni, 28.6%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu2  :  6.0%us, 11.3%sy,  0.0%ni, 80.5%id,  0.0%wa,  0.0%hi,  2.3%si,  0.0%st
Cpu3  : 20.0%us, 60.0%sy,  0.0%ni, 20.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st

您还可以运行dstat -talm（可能将其放在后台并重定向到文件）以获取每秒的统计数据，这可能有助于诊断问题，以防您无法在启动时查看它。

请注意，对于我的问题，我最终与 Red Hat 支持部门合作了数周，最终只是尝试安装较新的内核补丁版本，这就是解决方案。

Answer

这是一个长远的打算，但我最近遇到了一个问题，在随机时间间隔内，某些系统会经历非常高的“系统” CPU 时间，这非常糟糕，以至于集群工具会认为系统已死并发出暂停等指令。

在出现问题时，请尝试top扩展1CPU，并查看是否有一个或多个处理器显示出奇怪的行为。

如果此问题确实存在，则可能看起来是这样的。请注意较高的“sy”值。

Cpu0  : 16.7%us, 25.0%sy,  0.0%ni, 50.0%id,  0.0%wa,  0.0%hi,  8.3%si,  0.0%st
Cpu1  : 28.6%us, 42.9%sy,  0.0%ni, 28.6%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu2  :  6.0%us, 11.3%sy,  0.0%ni, 80.5%id,  0.0%wa,  0.0%hi,  2.3%si,  0.0%st
Cpu3  : 20.0%us, 60.0%sy,  0.0%ni, 20.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st

您还可以运行dstat -talm（可能将其放在后台并重定向到文件）以获取每秒的统计数据，这可能有助于诊断问题，以防您无法在启动时查看它。

请注意，对于我的问题，我最终与 Red Hat 支持部门合作了数周，最终只是尝试安装较新的内核补丁版本，这就是解决方案。

Question 2

CentOS 或任何 Linux 变体都不会为了好玩而这样做。这里面有一个潜在的硬件问题。

我猜测您的服务器是 VMware 或其他虚拟化客户机，并且在拍摄客户机快照时会出现问题。

您的要点列表很长，但没有提到日志。dmesg输出中或下方有什么有趣的内容/var/log吗？

Answer

CentOS 或任何 Linux 变体都不会为了好玩而这样做。这里面有一个潜在的硬件问题。

我猜测您的服务器是 VMware 或其他虚拟化客户机，并且在拍摄客户机快照时会出现问题。

您的要点列表很长，但没有提到日志。dmesg输出中或下方有什么有趣的内容/var/log吗？

Linux Centos 6 时常不可用 - 操作系统和网络问题

答案1

答案2

相关内容