过去几周(随着时间的推移情况慢慢变得更糟),我一直遇到应用程序崩溃/关闭、奇怪的看似与内存相关的错误、几个 BSoD 和 Nvidia 驱动程序 CRC 错误。
所有浏览器都会随机崩溃。有时打开后会立即崩溃,尝试 10 次以上,有时它会设法保持打开状态一段时间。有时只是一个选项卡会崩溃,有时整个应用程序会突然关闭而没有错误。有时会出错。其他应用程序会随机静默关闭。有时它们会白屏。有时它们会黑屏。当尝试更新到最新的 Nvidia 驱动程序时,在提取时,我不断收到 7zip CRC 错误。
每个人都说这是一个文件或下载问题(考虑到 CRC 错误,我通常会同意这个说法,但在另一台计算机上提取工作正常,即使我尝试下载最后 10 个 Nvidia 驱动程序,它们都有 CRC 错误,有时出现在提取的不同点,但通常在 24% 左右。
我知道你们中的很多人已经在想你们知道哪里出了问题,但让我先继续向你们展示我已经排除的可能性。可能存在一些问题。其中一些问题可能已经修复。其中一些问题很可能是由主要问题导致的文件损坏。请参阅下面的故障排除部分。还应注意,这是一个不到一年的定制系统。
电脑规格
CPU - 13th Gen Intel i9-13900K
PSU - Corsair HX1500i 1500W
GPU - Nvidia 4090 founders edition
RAM - CORSAIR Vengeance 128GB (4 x 32GB) DDR5 5600 (PC5 44800)
MOBO - ASUS ROG Maximus Z790 Hero
HDD - WD_BLACK 1TB SN850X NVMe (Main OS - Direct on motherboard & heatsinked)
COOL - Noctua NH-D15 CPU cooler
OS - Windows 11 Pro (Installed from OEM disk)
不太重要的规格仅供参考
2 additional (for storage) WD_BLACK 2TB SN850X NVMe (Direct on motherboard & heatsinked)
Noctua NT-H1 3.5g, Pro-Grade Thermal Compound
No other fancy gadgets, RGB, etc.
No normally connected (outside of troubleshooting) spinning or solid state HDD
No CD or DVD drives connected (I use a USB DVD drive when needed)
No WiFi used. Only use onboard LAN.
No other PCIE addon cards except the primary GPU
Only the basic peripherals connected at the moment. (Mouse and keyboard)
Single monitor connected with DisplayPort.
已采取的故障排除步骤
- 移除了 4090,并尝试使用已知可以正常工作的卡。应用程序仍然崩溃,驱动程序仍然出现 CRC 错误
- 运行了不同供应商(第三方、主板、微软等)的大量耗时的 RAM 测试,得到了很多不同的结果,但总体来说没有错误。
- 仍然决定购买相同的全新 RAM,以 100% 替换旧 RAM,并尝试主板上的不同插槽组合以排除 RAM 插槽问题。没有变化。仍然崩溃。
- 我没有更换电源,但我觉得没必要这么做。系统没有负载。没有任何与电源问题有关的指示。这里提到这一点只是为了表明我忽略了这个问题的潜在根源。
- 也没有移除或将任何 NVMe 存储视为潜在问题。它们不以任何其他方式与系统相关联。它们上没有安装任何应用程序。它们只是文件存储,目前相对空旷。
- 我将主板的 BIOS 更新为最新版本,因为我第一次安装所有东西时忘记这样做了。
- 我没有进行任何超频。我最初启用了 XMP,但目前我使用的是默认主板 UEFI 配置。
- 我彻底删除了主 1TB NVMe 上的操作系统,连接了一个较旧的 90GB SATA 固态硬盘,并从 OEM 磁盘安装了全新的 Windows 10,但我遇到了驱动程序问题,主板的所有驱动程序软件 msi 包都无法打开。此外,开始菜单的某些部分也奇怪地消失了。没有开始按钮或时钟。底部只有空白的开始菜单栏。这是在全新的 Windows 10 上安装的。大约 5 分钟前。
- 我擦除了 90GB 驱动器,并再次尝试使用 Windows 11。我再次从 OEM 磁盘安装。操作系统安装成功。我目前正在这个临时的 90GB SSD 上使用 Windows 11 安装来输入这篇 StackExchange 帖子。到目前为止,浏览器似乎很稳定。这包括 Chrome、Edge 和 Firefox。它们都很稳定。Discord 也可以打开而不会崩溃。我还没有尝试安装其他程序。部分原因是需要安装 Nvidia 驱动程序。
- 我把 4090 放回系统,它的工作方式与临时卡 (Nvidia 1050) 一样。仍然无法安装任何 Nvidia 驱动程序。即使在全新的操作系统上也是如此。不断出现
7zip: CRC error
。即使我从另一台计算机下载驱动程序(此外,我还在另一台计算机上测试它以确认它已正确下载并正常工作),一旦我将其带到损坏的系统,我就会收到 CRC 错误。 - 我刚买了一个一模一样的 1TB NVMe,几天后就可以拿到,因为我当时想可能是操作系统驱动器出了问题。也许 Nvidia 驱动程序试图解压到磁盘(可能是 TEMP 空间)并出现错误,也许随着时间的推移,操作系统积累了文件损坏,导致大量错误/不稳定/与其他应用程序崩溃???考虑到我现在使用的是完全隔离的 SATA HDD 和全新的操作系统,我现在不再相信这是事实。
- 我尝试更改操作系统临时目录以指向已知工作的硬盘空间(我尝试将它们指向其中一个存储 NVMe)。没有变化。
- 项目清单
此时,我不知道哪里出了问题。我还没有确认两件事。我没有测试过 CPU,但如果测试过,我觉得我会遇到更多的 BSoD 和更多奇怪且无法解释的行为。我还没有更换主板,原因我想是显而易见的。这很耗时,而且这是我最不想尝试测试的事情,因为必须把所有东西都拿出来。此外,系统在其他方面都很稳定。
我正在输入上面的段落,Firefox 崩溃了(这个新版本第一次出现这种情况)!这又是在全新的操作系统上,不同的硬盘上。主板肯定出了问题。也许是 RAM 和系统其余部分之间的接口?实际上,在某种程度上,我有点高兴它再次崩溃了。我觉得我现在可以排除更多变量了。不是 NVMe,也不是操作系统。至少不是以前的操作系统。它仍然可能与 Windows 11 兼容性和我的硬件有关。
仍然不确定驱动程序 7zip CRC 错误是否与更大的问题有关或独立。但似乎相关,因为驱动程序安装在其他计算机上有效。最后说明...我目前没有在此系统上安装 7zip。Nvidia 必须在其驱动程序安装程序中打包部分 7zip 软件。
我刚刚尝试安装除浏览器之外的第一个应用程序,但安装失败,出现文件损坏错误,这与 Nvidia 故障非常相似。尽管这是一次失败,但我很高兴看到这个错误,因为它让我更多地了解可能发生的情况。
我刚刚在两个地方下载了同一个文件。一次是在坏掉的电脑上,一次是在我用作备份的已知正常工作的电脑上。然后我运行了 MD5 检查,这样我们就可以平息其他论坛上所有人说我遇到下载问题并且需要使用其他浏览器的所有愚蠢的 CRC 评论……文件下载正常,在两个系统上都是相同的!当文件在坏掉的系统上开始解压时,就是错误开始的时候。我仍然倾向于认为是与内存或 CPU 相关的主板问题。请记住,RAM 是 1 天前的。我刚刚更换了我认为可能损坏的 RAM。
另外,这是 Nvidia 安装给出的 7zip CRC 错误。
我付钱将价值 600 美元的主板寄回华硕,因为他们的 RMA 流程太糟糕,让人无法放心。他们明确表示,如果主板出现问题,他们会寄送一块新主板。我等了几个星期,终于刚刚收到 FedEx 寄来的包裹。他们寄回了与我一模一样的主板,并附上一张纸,上面写着无法复制问题,并要求我尝试更新 BIOS。
由于主板出现故障,我冲动购买了一款全新的廉价第 13 代 i5 CPU,因为这是我要尝试的清单上最后一项。请允许我发泄一下,提醒您此时我基本上已经购买了整台第二台计算机来试图找出这个问题...我刚刚将新的 i5 放入系统,目前看来问题可能已经解决,但我还不确定,因为情况一开始似乎有所好转(比如在安装操作系统之后),但问题又再次出现。因此,我将让这台电脑开机一会儿,并多次打开和提取 Nvidia 驱动程序,看看新处理器是否出现 CRC 错误。到目前为止还没有出现。我继续与英特尔合作,开始了 i9 的 RMA 流程。我将在几天后再次更新结果。
答案1
我忘了回来发布解决方案。最终还是我的 CPU 出了问题。i5 温度过高证明系统再次稳定。我更换了坏的 i9,英特尔寄来了一个新的。从那以后,系统一直运行良好。