可能存在 NVME M.2 和 GPU 通信通道问题

可能存在 NVME M.2 和 GPU 通信通道问题

我刚刚组装了一台新电脑。通过将 RAM 插槽从 A1 更改为 B1 解决了一些初始问题后,我又遇到了更多问题。

首先,我终于成功安装了 Windows 10,一切运行良好。但我担心可能存在潜在问题。在安装 Windows 时遇到一些问题(这些问题不是 PC 的问题,而是旧的不准确/不精确的指南的问题),我尝试通过 USB 安装 Ubuntu(如前所述,Windows 现已成功安装)。这让我进入了 Ubuntu 的安装屏幕,但一切进展都非常缓慢,最终会冻结并且无法交互。这些是安装程序的标准输出中出现的错误:

图像

这让我想到了这里:

https://unix.stackexchange.com/questions/327730/what-c​​auses-this-pcieport-00000003-0-pcie-bus-error-aer-bad-tlp#369090

添加用于从 USB 启动的内核选项pci=nommconf实际上解决了这种迟缓然后冻结的问题,我能够从 USB 安装 Ubuntu。我还必须在安装后添加pci=nommconf/etc/default/grub否则最终Ubuntu 会完全冻结,需要通过机箱按钮进行硬关机。即使使用此选项,我也遇到了几次崩溃,但它仍能正常运行,包括运行《文明 5》和其他一些程序,大约 30 分钟。我强调美好的:与 Windows 安装后最终可能出现的情况相比,这确实很糟糕。

UNIX Stack Exchange 答案中所说的内容可能指出了我的问题:

它可能是设备中的硬件错误,主板上的 PCIe 根控制器中的错误,这两者之间的特定交互中的错误,或者其他什么错误。

这个问题的答案中建议的三个潜在解决方案对我来说都不起作用。首先:

X99 Deluxe II 主板在 PCIE16_3 插槽和 M.2/U.2 之间共享带宽。根据 @Nic 的评论,我在 BIOS 中将板载设备配置 | U.2_2 带宽从自动更改为 U.2_2。这为我解决了问题。

据我所知,我的 BIOS 中没有“U.2_2 带宽”选项,所以这没有帮助。M.2 有一个模式选项,我将其从“自动”更改为“PCI”(另一种选择是 SATA),但这并没有解决任何问题。

我将 x99-E 上 BIOS 中的 PCIE16_3 插槽配置更改为静态设置为 x8 模式,而不是 M.2 设备支持的默认自动模式。现在,通过 PCIe 1x 到 16x 扩展板连接的两张 1070GTX 卡均运行良好,没有出现 TLP 错误。

我在 BIOS 中找不到该设置。我无法将 GPU 物理移至另一个插槽,因为我安装了 WiFi 卡,它挡住了路,而我需要它。

某处提到了视频卡的 PCI 生成,但我不想反复尝试所有可能的相关 BIOS 设置,以防它有帮助;希望有充分的理由去尝试,尤其是现在一切在 Windows 上运行良好。

在主板手册中搜索“AER”。您可以通过纠正特定的不兼容性或完全禁用 AER 来消除问题根源。仅当所有错误垃圾邮件都涉及已纠正的错误时才使用这种方法,否则您可能会掩盖实际问题。

我在手册中找不到任何提及“AER”的地方。您可以在此处找到主板手册:

https://dlcdnets.asus.com/pub/ASUS/mb/LGA1200/PRIME_B560M-A/E18905_PRIME_B560M-A_v2_UM_WEB.pdf?model=PRIME%20B560M-A

输出inxi -F

System:
  Host: <deleted for privacy> Kernel: 5.15.0-58-generic x86_64 bits: 64
    Desktop: GNOME 42.5 Distro: Ubuntu 22.04.1 LTS (Jammy Jellyfish)
Machine:
  Type: Desktop System: ASUS product: N/A v: N/A serial: <superuser required>
  Mobo: ASUSTeK model: PRIME B560M-A v: Rev 1.xx
    serial: <superuser required> UEFI: American Megatrends v: 1601
    date: 05/07/2022
CPU:
  Info: quad core model: Intel Core i3-10100F bits: 64 type: MT MCP cache:
    L2: 1024 KiB
  Speed (MHz): avg: 4195 min/max: 800/4300 cores: 1: 4172 2: 4209 3: 4200
    4: 4202 5: 4196 6: 4187 7: 4201 8: 4200
Graphics:
  Device-1: NVIDIA TU117 [GeForce GTX 1650] driver: nouveau v: kernel
  Display: wayland server: X.Org v: 1.22.1.1 with: Xwayland v: 22.1.1
    compositor: gnome-shell driver: gpu: nouveau resolution: 1920x1080~144Hz
  OpenGL: renderer: NV167 v: 4.3 Mesa 22.0.5
Audio:
  Device-1: Intel driver: snd_hda_intel
  Device-2: NVIDIA driver: snd_hda_intel
  Sound Server-1: ALSA v: k5.15.0-58-generic running: yes
  Sound Server-2: PulseAudio v: 15.99.1 running: yes
  Sound Server-3: PipeWire v: 0.3.48 running: yes
Network:
  Device-1: Intel Ethernet I219-V driver: e1000e
  IF: eno1 state: down mac: c8:7f:54:5a:fd:ee
  Device-2: Realtek RTL8192EE PCIe Wireless Network Adapter
    driver: rtl8192ee
  IF: wlp3s0 state: up mac: 14:eb:b6:44:4d:27
Drives:
  Local Storage: total: 476.94 GiB used: 108.25 GiB (22.7%)
  ID-1: /dev/nvme0n1 vendor: Patriot model: M.2 P300 512GB size: 476.94 GiB
Partition:
  ID-1: / size: 467.89 GiB used: 108.24 GiB (23.1%) fs: ext4
    dev: /dev/nvme0n1p2
  ID-2: /boot/efi size: 511 MiB used: 5.2 MiB (1.0%) fs: vfat
    dev: /dev/nvme0n1p1
Swap:
  ID-1: swap-1 type: file size: 2 GiB used: 4.5 MiB (0.2%) file: /swapfile
Sensors:
  System Temperatures: cpu: 27.8 C mobo: N/A gpu: nouveau temp: 26.0 C
  Fan Speeds (RPM): N/A
Info:
  Processes: 281 Uptime: 26m Memory: 15.48 GiB used: 3.51 GiB (22.7%)
  Shell: Bash inxi: 3.3.13

编辑:我将此文本添加到帖子中,以便其他人在进行网络搜索时更容易找到此帖子:

PCIe 总线错误:严重性=已更正,类型=物理层,(接收器 ID)设备 [8086:43bd] 错误状态/掩码=00000001/00002000 [ 0] RxErr AER:收到已更正的错误:000:00:1c.5

相关内容