高负载,低 CPU 利用率 - 系统定期崩溃

高负载,低 CPU 利用率 - 系统定期崩溃

我刚刚安装了新版本的 Ubuntu 16.04。系统经常崩溃,并在系统日志中显示以下消息。

INFO: rcu_sched detected stalls on CPUs/tasks: 
    2-...: (1 GPs behind) idle=363/1/0 softirq=167130/167130 fqs=7845837 
    (detected by 0, t=7845872 jiffies, g=197552, c=197551, q=225464)

正常运行时间显示以下负载:

 09:10:42 up 22:36,  1 user,  load average: 4.04, 4.02, 4.00

尽管闲置使用率很高,但 Top 仍显示类似

top - 09:11:17 up 22:37,  1 user,  load average: 4.12, 4.05, 4.01
Tasks: 214 total,   2 running, 212 sleeping,   0 stopped,   0 zombie
%Cpu0  :  0.0 us,  0.0 sy,  0.0 ni, 97.3 id,  2.7 wa,  0.0 hi,  0.0 si,  0.0 st
%Cpu1  :  0.0 us,  0.0 sy,  0.0 ni,100.0 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
%Cpu2  :  0.0 us,  0.0 sy,  0.0 ni,100.0 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
%Cpu3  :  0.0 us,  0.0 sy,  0.0 ni,100.0 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem :  8112956 total,  4986392 free,  1399292 used,  1727272 buff/cache
KiB Swap:  8325628 total,  8325628 free,        0 used.  6313608 avail Mem

免费信息显示有大量可用 RAM。

total        used        free      shared  buff/cache   available
Mem:           7922        1366        4865          35        1690        6161
Swap:          8130           0        8130

我没有从 iotop 看到任何 I/O 问题:

Total DISK READ :       0.00 B/s | Total DISK WRITE :       0.00 B/s
Actual DISK READ:       0.00 B/s | Actual DISK WRITE:       0.00 B/s

唯一一致的是,似乎是 cpu2 导致了停顿。我还应该查看什么来确定崩溃的原因?

答案1

这似乎是由于缺少显卡驱动程序造成的。在本例中是 nvidia。我安装了这些驱动程序并禁用了 UEFI 安全启动,并且已经过了一天多的时间,没有出现崩溃。

相关内容