在 15.04 上使用 Nvidia 驱动程序时出现机器检查错误

在 15.04 上使用 Nvidia 驱动程序时出现机器检查错误

哈特,

硬件规格:CPU:AMD FX 8350 8 核 GPU:Nvidia GeForce GT 630 主板:ASUS M5A78L-M/USB3

几周前,在 Trusty Tahr 下,我开始遇到图形问题。在尝试了几种糟糕的解决方案之后,我最终重新安装了 Vivid。随着时间的推移,我越来越相信这是硬件问题(尽管我仍然坚决否认)。以下是发生的情况:

  1. 在 nouveau 图形下,机器可以正常工作一段时间,然后冻结。只能通过硬重置来修复。所有其他输入均无响应。
  2. 切换到 nvidia 驱动程序(尝试过各种版本建议这里) 导致登录后不久就崩溃。/var/log/syslog 记录:

    [Hardware Error]: System Fatal error.
    [Hardware Error]: CPU:0 (15:2:0) MC4_STATUS[Over|UE|MiscV|PCC|AddrV|-|-]: 0xfe00000000070f0f
    [Hardware Error]: MC4 Error Address: 0x000000fdfc000cfc
    [Hardware Error]: MC4 Error (node 0): Watchdog timeout due to lack of progress.
    [Hardware Error]: cache level: L3/GEN, mem/io: GEN, mem-tx: GEN, part-proc: GEN (timed out)
    
  3. 已尝试使用 nomodeset 选项 /opt/default/grub 的 nvidia 驱动程序。

再次强调,这确实看起来像是一个坏 CPU。但事实是,机器在使用 nouveau 驱动程序和使用 nvidia 驱动程序时崩溃的方式不同,这让我看到了一丝可以保住钱包的希望。

因此,我想知道以下事情:

  1. 如果仅仅通过安装新的软件包或者配置其他软件包就能解决这个问题,那么后世的诗人都会对你赞不绝口。
  2. 如果像我担心的那样,这是一个无法修复的硬件问题,我可以采取任何额外的诊断步骤来查看哪些组件有故障:只有 CPU,也许是主板或其他部件。我想节省购买不会造成问题的部件的资金,但也不想让有故障的部件闲置。

相关内容