2 年的内存损坏和 BSOD...但没有坏 RAM?

2 年的内存损坏和 BSOD...但没有坏 RAM?

这是我的 Dropbox 文件夹的链接,我会在其中添加生成的内存转储。它与下面提供的链接相同。此外,最新的编辑位于此帖子的顶部。https://www.dropbox.com/sh/vw7zkiwbq7hh05p/AABxLOaKIc8V5djSgyy3sUWja?dl=0

编辑:使用 Chrome 观看 Netflix 时又出现一次 BSOD。已添加到 Dropbox 链接。

编辑:最后又出现了一次 BSOD,而且这次实际上产生了一个完整的内存转储(1.07GB)。它应该在上传完成后在下面的同一链接中可用。我用 7zip 将它压缩到 181MB,这会有所帮助。最近一次崩溃是在使用新的 Edge 浏览器观看 Vimeo 时发生的,但在使用 Chrome 观看 YouTube 时也发生过这种情况。如果有人能提供任何见解,我将不胜感激。提醒一下,这是使用新的 PSU 和所有 16GB 内存时发生的。我还没有完全更换的唯一电子硬件是 CPU、硬盘和可能的 GPU(这种情况已经持续了很长时间,这个特定问题可能比我的 GPU 更新)。非常感谢!

编辑:所以我对我的 PSU 进行了 RMA,得到了新的,两天前安装了它,一切都很好,直到现在。出现了 IRQL_not_less_or_equal BSOD。最糟糕的消息是,Windows 似乎也没有保存内存转储 :-( 我唯一的转储是前一段时间的。可能是因为该磁盘上的磁盘空间不足,所以我会尝试清除一些。唯一没有完全更换的剩余组件是硬盘和 CPU。

编辑:这是我的 RAM 转储的链接。完整转储为 800MB,因此仍在上传中。我会在生成更多转储后在此处添加。它将在可预见的未来上线。 https://www.dropbox.com/sh/vw7zkiwbq7hh05p/AABxLOaKIc8V5djSgyy3sUWja?dl=0

看起来很像这个问题:频繁出现与内存损坏有关的 BSoD ...但运行 SFC 从未发现任何坏文件。

我要讲的内容很多,所以请耐心听完。我会尽量系统化。

在过去的 2 年左右的时间里,我一直遇到间歇性的 BSOD 崩溃。错误包括:

  • IRQL_NOT_LESS_OR_EQUAL
  • 内存管理
  • PAGE_FAULT_IN_NONPAGED_AREA
  • 错误池标头
  • 和别的。

  • 操作系统这个问题从 Windows 7 开始,一直延续到 Windows 10。有一次崩溃甚至需要全新安装 Windows 7,这样我才能重新升级到 Windows 10,所以自从这些问题开始以来,我已经完全重新安装了操作系统至少 4 次。

  • 图形处理器该问题始于一对非 SLI NVIDIA GPU,并一直持续到另一对非 SLI NVIDIA GPU。

  • 主板该问题始于一块华硕主板,并一直延续到较新型号的华硕主板。

  • 内存这个问题始于一组 RAM,并一直持续到更换了一组全新的 RAM。在升级主板的同时,我还将 RAM 从 16GB DDR3 1066 升级为 16GB DDR3 1333,均为 G.Skill。(GPU 升级是在主板升级前一年左右进行的)

  • 磁盘我有四个硬盘,其中两个是固态硬盘。一个固态硬盘是我的启动盘,另外三个是存储盘。我在所有四个磁盘上运行过页面文件,完全没有页面文件,只在固态硬盘上运行,只在传统磁盘上运行,以及介于两者之间的所有磁盘,每种配置都会出现 BSOD。操作系统磁盘在安装过程中被格式化了几次,但其他磁盘基本没有变化。我思考当我的操作系统仍在传统磁盘上时,这个问题就开始了,但我记不清了。

  • 力量我有一个 750 瓦的 PSU,已经用了 3-4 年了,似乎从来没有出过问题……但这可能是问题所在。我还用的是无间断电源,但自从几个月前安装以来,没有报告切换到电池供电。

我已经运行了 MemTest 六次,从来没有出现过任何故障,但只在第一组 RAM 上出现过。最近,我对所有四个模块运行了 Windows 内存诊断程序,并出现了一些故障。然后我只在两个模块上运行了它,没有故障,然后在另外两个模块上运行了它,也没有故障。每次测试都是“扩展”测试集的 3 次通过。

我已经运行了 verifier.exe,但它相当不透明,所以我不知道它是否给了我任何有用的信息。

我一直在使用 WhoCrashed 的家庭版查看小型转储,但最近我发现了 WinDBG(为什么这不是标准操作系统功能?!?!?!),但自从发现它以来,我只生成了两个转储,因此没有太多新信息。一个转储指向“memory_corruption”,这促使我运行了 WMD。

我有两个小型转储和一个memory.dmp,我可以通过 Dropbox 分享,如果有人认为它们有用的话,但它们只是最近两天的。

谢谢您的任何建议。

答案1

好的,我查看了您的 memory.dmp 文件。看来属于某个 Chrome 进程的线程已接近完成写入“命名管道”对象的“最后阶段”,该对象由 npfs.sys(“命名管道文件系统”驱动程序)实现。

以下是有关命名管道/npfs.sys 的相关内容:它是一种作为伪设备实现的进程间通信机制。它是非常成熟的稳定代码。它一直存在于 Windows 中。它被许多内部 Windows 进程使用。Chrome 使用它(用于 Chrome 各个进程之间的通信)并不奇怪。

而且,作为伪设备,它不特定于任何硬件。因此,每台运行相同版本操作系统的 Windows 计算机都运行相同的 npfs.sys 二进制文件。这不像无线网卡或视频卡,那里有许多不同的“WiFi”或“视频”驱动程序。

因此,我们可以相当肯定问题不在 npfs.sys 中。而且肯定不在 IopCompleteRequest 中(该例程通过尝试写入未定义的地址引发了无法处理的异常,这是崩溃的最终“原因”)。这两个都是非常常用且值得信赖的代码。堆栈上的其他内核模式例程是 NtWriteFile 和 KiSystemServiceCopyEnd - 同样不太可能是嫌疑人。(NtWriteFile 为每个文件或设备的每个写入函数调用;KiSystemServiceCopyEnd 为从用户模式到内核模式的绝大多数调用调用 - 顺便说一句,它与服务无关进程

正如我在上面的评论中所说 - 我会更换电源。我以前见过 PSU 导致类似的“广泛变体”BSOD。确保您购买的是带有一个大 12 伏导轨的电源,而不是多个导轨 - 这可以提供最佳保护,防止瞬时电压下降和峰值。考虑到您有两个 GPU,这一点尤其重要。

相关内容