解决方案

解决方案

我的电脑出现了一系列非常奇怪的崩溃,我想知道我还能做些什么来查明问题所在。

崩溃几乎只发生在少数 GPU 密集型应用程序中,并且在以下软件中,它们在持续运行 2 分钟内就会出现(我无法让应用程序运行超过 5 分钟),而其他应用程序(也是 GPU 密集型)似乎完全不受影响。

到目前为止,我观察到以下崩溃:

  • FilterForge 13(程序艺术生成器,不是 AI 生成)- 错误“Kernel::SystemException。访问冲突”
  • Unity(游戏引擎),但仅限于最终应用程序的着色器编译步骤期间(“IPC 错误:无法与着色器编译器进程通信。原因:着色器编译器崩溃。请报告错误”
  • 奇迹时代 4(电子游戏) -“游戏客户端崩溃。”

这些崩溃在运行 2 分钟内出现,每次都是这个应用程序。对于 Unity,我在五个不同版本的 Unity Editor 中都观察到了这种情况。

我还观察到偶尔出现的 BSoD,上次是在 12 月 1 日,WinDBG 输出如下:

SYSTEM_SERVICE_EXCEPTION (3b)
An exception happened while executing a system service routine.
Arguments:
Arg1: 00000000c0000005, Exception code that caused the BugCheck
Arg2: fffff8054d2d7dc7, Address of the instruction which caused the BugCheck
Arg3: ffffbe84e5c1da70, Address of the context record for the exception that caused the BugCheck
Arg4: 0000000000000000, zero.

STACK_TEXT:  
ffffbe84`e5c1e490 fffff805`4d2d7d83     : 00000000`00000000 ffff8000`a4802000 00000000`00000001 ffffffff`ffffffff : nt!ExpWakePushLock+0x37
ffffbe84`e5c1e4d0 fffff805`4d25c124     : 00000000`00000000 00000000`00000000 00000000`00000001 00000000`00000002 : nt!ExfTryToWakePushLock+0x23
ffffbe84`e5c1e500 fffff805`4d25bb0a     : fffff805`4dc69880 00000000`00000111 00000000`00000000 00000000`000000ff : nt!RtlpHpSegPageRangeAllocate+0x4c4
ffffbe84`e5c1e570 fffff805`4d2802f0     : 00000000`00000002 00000000`00001000 fffff8fc`7e3f1800 fffff805`4dc69880 : nt!RtlpHpSegAlloc+0x5a
ffffbe84`e5c1e5d0 fffff805`4d27fb3f     : 00000000`00001001 ffff9a0e`a62df0c0 00000000`6274624f 00000000`00000000 : nt!ExAllocateHeapPool+0x780
ffffbe84`e5c1e6f0 fffff805`4daac78d     : 00000000`00000100 00000000`00000001 00000000`00000401 00000000`00000000 : nt!ExpAllocatePoolWithTagFromNode+0x5f
ffffbe84`e5c1e740 fffff805`4d7160dd     : 00000000`00035000 fffff805`4d7160a0 00000000`00000010 00000000`00050286 : nt!ExAllocatePool2+0xdd
ffffbe84`e5c1e7f0 fffff805`4d71609b     : 00000000`00035000 00000000`000000d4 00000000`00000000 ffff9a0e`97ddc0c0 : nt!ExpAllocateTablePagedPoolNoZero+0x25
ffffbe84`e5c1e820 fffff805`4d715db2     : 00000000`00034c00 00000000`000000d3 ffff8000`6d1a5040 ffff9a0e`97ddc0c0 : nt!ExpAllocateLowLevelTable+0x17
ffffbe84`e5c1e850 fffff805`4d713adf     : 00000000`00000000 ffff9a0e`a62df0c0 00000000`0005b400 ffff9a0e`97ddc0c0 : nt!ExpAllocateHandleTableEntrySlow+0x56
ffffbe84`e5c1e890 fffff805`4d76f709     : ffff9a0e`97ddc0c0 ffff8000`53fad040 00000000`00000000 00000000`00000000 : nt!ExDupHandleTable+0xbf
ffffbe84`e5c1e960 fffff805`4d76d288     : ffff8000`6d1a5040 00000000`0002a800 ffffbe84`e5c1f270 00000000`00000000 : nt!ObInitProcess+0xa5
ffffbe84`e5c1e9c0 fffff805`4d774158     : 00000000`00000000 ffffbe84`e5c1f270 00000000`00000000 00000000`00000000 : nt!PspAllocateProcess+0xd98
ffffbe84`e5c1f1f0 fffff805`4d42b6e5     : 00000000`00000000 00000000`00000000 ffff9a0e`4a64e440 fffff805`4d6ee876 : nt!NtCreateUserProcess+0x778
ffffbe84`e5c1f9b0 00007ff9`eb9f0d44     : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!KiSystemServiceCopyEnd+0x25
0000009b`17d5d788 00000000`00000000     : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : 0x00007ff9`eb9f0d44


SYMBOL_NAME:  nt!ExpWakePushLock+37

MODULE_NAME: nt

IMAGE_NAME:  ntkrnlmp.exe

IMAGE_VERSION:  10.0.22621.2715

STACK_COMMAND:  .cxr 0xffffbe84e5c1da70 ; kb

BUCKET_ID_FUNC_OFFSET:  37

FAILURE_BUCKET_ID:  AV_nt!ExpWakePushLock

OSPLATFORM_TYPE:  x64

OSNAME:  Windows 10

FAILURE_ID_HASH:  {936a9116-626d-ff5b-6e91-6d53301ce50c}

我已经运行 MemTest (Windows 11) 6 个小时,并且 vRAM MemTest (https://github.com/GpuZelenograd/memtest_vulkan) 均未给出错误。

硬件规格:

  • Win11专业版,
  • 英特尔第 13 代,i9
  • 华硕 Prime 主板
  • nVidia GeForce RTX 系列,
  • 64 GB 内存

答案1

好的。

经过漫长的三个月寻找,我终于找到了解决方案。

一些英特尔 CPU 存在硬件不稳定(最明显的是英特尔 13900K 和 14900K,较少见的是 13700、14700),这种行为将大多在进行一些非常具体的计算时出现(比如提到的着色器编译),所以它会不是在 Prime95 上以及我所知的任何压力测试仪上都没有显示。

解决方案

英特尔提出的解决方案是将 CPU 上的多核性能从 55 倍降低到 53 倍。全功率运行会使 CPU 犯下非常轻微的错误,这些错误会在着色器编译时迅速累积。他们建议使用自己的软件,Intel XTU为此而呼吁。

如果您碰巧有华硕主板(像我一样),那么Intel XTU每次重启后都会继续将您的更改恢复为多人游戏,因为它无法检测到主板上的故障安全看门狗。华硕主板上的问题有很多主题,华硕支持仍未解答(请注意,其中一些主题是几天前的)。

可以肯定能解决问题的方法是直接进入 BIOS,将 P-Core Multiplayer 更改为Auto比默认值低 2 个值(检查 XTU,它将显示您的标准值),然后重新启动 PC。

性能下降可以忽略不计,稳定性已完全恢复。

允许我追踪此事的来源

相关内容