我们最近发现生产服务器中有两个应用程序的 CPU 使用率很高(一个应用程序占用了 900% 的 CPU,另一个应用程序占用了 700% 的 CPU),同时还发现平均负载高达 22、17、10,因此我们将 CPU 资源从 12 核增加到了 24 核。现在我们仍然看到平均负载明显偏高,17 15 10但总体来说 CPU 使用率非常低(即 4%/)。
注意:1. 当我们的生产服务器的平均负载较高时,我们的 UI 搜索引擎需要很长时间来获取请求的信息。2.我们还发现 I/O 速度(特别是磁盘写入速度)从 700MB/s 大幅降低到 4.8MB/s.当平均负载较高时,我们经常会看到以下错误。
错误:来自 syslogd@nabu 的消息,时间:11 月 2 日 19:06:21 ... 内核:NMI 看门狗:BUG:软锁定 - CPU#0 卡住 22 秒![kworker/0:2:17931]
来自 syslogd@nabu 的消息,时间:11 月 2 日 19:06:49 ... kernel:NMI watchdog:BUG:软锁定 - CPU#0 卡住 22 秒![kworker/0:2:17931]
来自 syslogd@nabu 的消息,时间:11 月 2 日 19:07:18 ... kernel:NMI watchdog:BUG:软锁定 - CPU#0 卡住 22 秒![kworker/0:2:17931]
我们将非常感激您的帮助。