将 Linux 内核从 4.4.0-83 降级至 4.4.0-31

将 Linux 内核从 4.4.0-83 降级至 4.4.0-31

最近,几乎每次我运行 Ubuntu 时,操作系统都会遇到内部错误。我相信我当前的 xorg 版本应该对此负责,但我收到了很多kerneloops错误,而当我使用 内核时,这些错误都没有出现4.4.0-31。因此,我希望将内核从 降级4.4.0-834.4.0-31

我按照

将“较旧”的内核设置为默认 grub 条目

但启动时4.4.0-83仍然使用内核。

升级到 12.10 后,Grub 不会自动启动默认选项

并没有解决问题(尽管我使用的是 14.04)。现在,在 grub 中选择“高级选项”时,4.4.0-31 内核是默认选择。但如果我使用高级选项启动,我会进入一个tty1无法退出的屏幕。我尝试了

我怎样才能离开 tty?

但未收到任何响应或收到错误消息。以下是我的 grub 文件(减去注释掉的行):

GRUB_DEFAULT="Advanced options for Ubuntu>Ubuntu, with Linux 4.4.0-31-generic"
GRUB_HIDDEN_TIMEOUT_QUIET=true
GRUB_TIMEOUT=10
GRUB_DISTRIBUTOR=`lsb_release -i -s 2> /dev/null || echo Debian`
GRUB_CMDLINE_LINUX_DEFAULT="quiet splash"
GRUB_CMDLINE_LINUX=""
GRUB_RECORDFAIL_TIMEOUT=0

请让我知道是否有任何我应该运行的命令行可以识别问题。

编辑1

以下是输入的输出ls -alt /var/crash

total 71060
-rw-r-----  1 root     whoopsie  1512336 Jul 24 19:47 _usr_bin_Xorg.0.crash
drwxrwsrwt  2 root     whoopsie     4096 Jul 24 19:47 .
-rw-------  1 whoopsie whoopsie        0 Jul 24 16:36 _usr_bin_Xorg.0.uploaded
-rw-r--r--  1 root     whoopsie        0 Jul 24 16:36 _usr_bin_Xorg.0.upload
-rw-rw----  1 root     whoopsie        0 Jul 24 01:55 .lock
-rw-r-----  1 kernoops whoopsie     8445 Jul 24 00:55 linux-image-4.4.0-83-generic.233306.crash
-rw-------  1 whoopsie whoopsie        0 Jul 23 23:37 _opt_google_chrome_chrome.1000.uploaded
-rw-rw-r--  1 zachary  whoopsie        0 Jul 23 23:37 _opt_google_chrome_chrome.1000.upload
-rw-r-----  1 zachary  whoopsie 58735028 Jul 23 23:37 _opt_google_chrome_chrome.1000.crash
-rw-------  1 whoopsie whoopsie        0 Jul 23 21:59 linux-image-4.4.0-83-generic.285645.uploaded
-rw-r--r--  1 root     whoopsie        0 Jul 23 21:59 linux-image-4.4.0-83-generic.285645.upload
-rw-r-----  1 kernoops whoopsie     8789 Jul 23 21:55 linux-image-4.4.0-83-generic.285645.crash
-rw-r-----  1 kernoops whoopsie     7976 Jul 23 15:07 linux-image-4.4.0-83-generic.220593.crash
-rw-r-----  1 kernoops whoopsie     8746 Jul 23 15:06 linux-image-4.4.0-83-generic.255332.crash
-rw-------  1 whoopsie whoopsie        0 Jul 23 15:06 ttf-mscorefonts-installer.0.uploaded
-rw-r--r--  1 root     whoopsie        0 Jul 23 15:06 ttf-mscorefonts-installer.0.upload
-rw-r-----  1 root     whoopsie   153662 Jul 23 15:06 ttf-mscorefonts-installer.0.crash
-rw-r--r--  1 kernoops whoopsie     3484 Jul 23 03:10 linux-image-4.4.0-83-generic.245092.crash
-rw-r-----  1 zachary  whoopsie 12051671 Jul 19 01:52 _usr_bin_compiz.1000.crash
-rw-r-----  1 zachary  whoopsie   238085 Jul 18 10:44 _usr_lib_dconf_dconf-service.1000.crash
-rw-r--r--  1 kernoops whoopsie     2823 Jul 16 14:03 linux-image-4.4.0-83-generic.215830.crash
drwxr-xr-x 14 root     root         4096 May 21 23:22 ..

free -h

             total       used       free     shared    buffers     cached
Mem:           62G       1.8G        61G        16M        40M       626M
-/+ buffers/cache:       1.1G        61G
Swap:          29G         0B        29G

swapon -s

Filename                Type        Size    Used    Priority
/dev/sda6                               partition   31250428    0   -1

另外,GRUB_CMDLINE_LINUX_DEFAULT="quiet splash nomodeset"我的安装已经完全损坏,但在我撰写原始帖子时我还没有重新启动。不过,我通过将其改回GRUB_CMDLINE_LINUX_DEFAULT="quiet splash"恢复模式修复了这个问题。我在阅读了一些帖子后做出了这个更改,但我再也找不到它了。

编辑2

MemTest 运行的图像

记忆测试

编辑3

回应:

(heynnema) 看起来你遇到了硬件问题,正如我所怀疑的那样。它正在数据总线上拾取一个高位。首先要做的是将内存条重新安装到当前插槽中。关闭计算​​机电源,从交流电源上拔下电源插头,按住电源按钮 5 秒钟,松开并重新插入每个内存条,然后重新运行 memtest。你当前的 RAM 配置是什么?有多少根内存条,大小如何?报告。附言:你安装了英特尔微码吗?

我只能重新安装两个内存条,因为 CPU 和水冷器线完全覆盖了其他两个,而且我不太愿意移除这些组件。我重新运行 MemTest,尝试了两个单独的核心和所有核心的并行测试,结果像以前一样在测试 2 上冻结了。

我的台式机内存是DDR4 海盗船复仇者.它包含四根内存条,每根内存条有 16GB,总共 64GB。

以下是输入的输出dmesg | grep microcode

[    8.808196] microcode: CPU0 sig=0x406f1, pf=0x4, revision=0xb00001c
[    8.808205] microcode: CPU1 sig=0x406f1, pf=0x4, revision=0xb00001c
[    8.808217] microcode: CPU2 sig=0x406f1, pf=0x4, revision=0xb00001c
[    8.808252] microcode: CPU3 sig=0x406f1, pf=0x4, revision=0xb00001c
[    8.808289] microcode: CPU4 sig=0x406f1, pf=0x4, revision=0xb00001c
[    8.808326] microcode: CPU5 sig=0x406f1, pf=0x4, revision=0xb00001c
[    8.808338] microcode: CPU6 sig=0x406f1, pf=0x4, revision=0xb00001c
[    8.808350] microcode: CPU7 sig=0x406f1, pf=0x4, revision=0xb00001c
[    8.808363] microcode: CPU8 sig=0x406f1, pf=0x4, revision=0xb00001c
[    8.808375] microcode: CPU9 sig=0x406f1, pf=0x4, revision=0xb00001c
[    8.808388] microcode: CPU10 sig=0x406f1, pf=0x4, revision=0xb00001c
[    8.808399] microcode: CPU11 sig=0x406f1, pf=0x4, revision=0xb00001c
[    8.808445] microcode: Microcode Update Driver: v2.01 <[email protected]>, Peter Oruba

根据 Easy Linux Tips Project 中的步骤 F(我还不能包含超过两个链接),我相信这意味着安装了英特尔微码。

编辑4

回复 heynnema:

好的,有一些进展。没有办法接触到另外两个 Simm,是吗?那么接下来试试这个。移除你可以接触到的两个 Simm,看看你是否还能启动,和/或运行内存测试。如果它运行,它会告诉我们,两个拉出的 Simm 中的一个可能有缺陷

ps:我们可以进行的另一项测试是在内存测试期间运行不同的单个 CPU。因此...如果它在 CPU #0 上失败,但在 CPU 1-11 上运行,则可能是 CPU 存在缺陷。

我首先在每个不同的 CPU 上运行 MemTest。第二次测试都导致死机。然后我移除了两个容易接触的内存条,启动后,就可以运行 MemTest。我没有尝试启动任何安装。

但是,将两个内存条重新插入后,我无法启动 Windows 或 Ubuntu。Windows 显示我的桌面背景,但带有蓝色滤镜,而 Ubuntu 仅显示默认的 Unity 背景。不过在 Ubuntu 中,计算机并没有完全冻结,因为我可以通过键盘命令输入 tty1。

我运行了 MemTest,希望它能指出哪里出了问题,但现在第一次测试失败了。它说[CPU Error] Could not start CPU 0。我再次尝试重新安装内存条,但它仍然完全坏了。

Could not start CPU 0如果我移除两个可访问的内存条并运行 MemTest,就会出现错误。

编辑5

我重新安装了内存条,有时我可以启动我的 Ubuntu 安装,但 Windows 更糟糕。它只会显示蓝屏,并显示修复计算机的选项。当我成功启动 Ubuntu 时,系统通常会在尝试打开任何应用程序时冻结。

编辑6

回复 heynnema:

您可能确实发现了问题,但错过了线索。移除 2 个可访问的 SIMMS 后,memtest 运行,但此时您应该尝试启动 Ubuntu 和 Windows 以查看它们的运行情况。但相反,您重新插入两个 SIMMS,memtest 失败,并且两个操作系统都出现问题。再次移除相同的两个 SIMMS,使用 memtest 重新测试以确认它仍然有效,然后启动操作系统并查看它们的运行情况!测试后还有更多步骤。祝你好运!附言:移除 2 个 SIMMS 后,确认操作系统认为您有 32G RAM。

我移除了可访问的 SIMMS 并启动了 PC。我在登录屏幕上进入终端并使用命令free -m检查可用 RAM。它是 32GB。第一次登录尝试成功,但打开谷歌浏览器时它冻结了。第二次尝试导致黑屏,提示找不到显卡。在 grub 中选择 Ubuntu 后,在登录屏幕出现之前,第三次尝试导致冻结。

我发现在登录屏幕上输入 tty1 相当稳定,并且可以执行许多基本命令而不会像实际登录时那样冻结。虽然我不确定这是否有任何相关性。

编辑7

回复 heynnema:

您很可能遇到不止一个问题。关闭计算​​机并重新安装显卡。您可能需要松开固定支架的螺丝,并且可能需要松开卡下部/前部的卡扣,或者为了能够移除/重新安装它。就内存而言,您需要做什么才能找到另外两个?您需要技术人员来帮助您吗?您能看到四个内存插槽的颜色吗?有时它们是白色或黑色。主板上蚀刻的每个插槽旁边都有一个标记,如 J0/J1/J2/J4... 您能看到这些吗?

ps2:给我看看sudo dmidecode -t memory

ps3:您是否对 CPU 或内存进行了超频?

明天我会找人看看我的电脑。不过,我检查了内存插槽的颜色,四个都是灰色的。其他四个可能的内存插槽都是黑色的。由于目前没有时间,我无法打开我的电脑查看插槽名称。

我运行后sudo dmidecode -t memory,它显示了我所有内存设备的信息。我无法复制文本,而且它占用了好几个屏幕,所以我没有拍照,但值得注意的是,只有两个设备有可识别的尺寸或制造商。两者都是 SIMMS,因为它们是 Corsair 品牌和 16GB,但我当时在内存插槽中安装了所有四个 SIMMS。除此之外,unknown还有NA针对其他设备的所有详细信息。

我没有对我的 CPU 或内存进行超频。

编辑8

我请了个人检查我的电脑。发现硬件有两个问题:

1) 只有两个内存插槽可以工作。内存条本身都可以工作,但主板有故障。奇怪的是,MemTest 最初检测到 64GB RAM,但无论主板上的 SIMMS 如何配置,情况都不再如此。

2) 我的 GPU 对主板来说有点太长,无法完全锁定在插槽中。它们有一个“最佳工作点”,但在重新安装内存条时,我一定撞到了它们。

虽然将 GPU 重新调整到更好的状态并仅使用两个工作内存插槽已经停止了错误消息(到目前为止),但这不是一个永久的解决方案。我仍然不知道为什么升级到 4.4.0-83 后会出现问题。

答案1

来自评论...

让我们先收集一些数据...

terminal...

ls -alt /var/crash
free -h
swapon -s

系统非常不稳定。建议我们运行 memtest。转到http://www.memtest86.com并下载免费内存诊断程序并运行它。

果然,内存测试失败......正如我所怀疑的......它在数据总线上选择一个高位......进一步排除故障......重新安装 SIMMS......移除可疑的 SIMMS......

更新#1:

我们移除了仅有的 2 个可访问的 SIMMS,现在开始运行 memtest。这台计算机可能存在不止一个硬件问题,因为在我们启动 Ubuntu 后,它抱怨找不到视频卡。我们将尝试重新安装它。我们需要访问其他 2 个难以访问的 SIMMS。这可能需要技术人员的帮助。

取出 2 个拆下的 SIMMS,用箔纸包好,然后将电脑连同内存测试光盘一起送到您最喜欢的电脑维修店。让他们解决硬件问题,然后汇报。如果需要,我们可以继续测试任何剩余的软件问题。

更新 #2:

最终结果...正如我所想的那样...有 2 个内存 SIMM 插槽有缺陷,并且 GPU 需要重新安装。建议向主板制造商登记保修单以获得更换。

相关内容