pcieport 0000:00:1d.0: AER: 收到更正错误:0000:04:00.0

pcieport 0000:00:1d.0: AER: 收到更正错误:0000:04:00.0

我正在运行 Kubuntu 20.04。我最近将我的系统从 2.5 英寸 SSD 克隆到新的 2280(通过 dd - 也就是说它是之前安装的精确副本)。一切都运行顺利,但我注意到有时在启动或关闭期间会看到以下情况:

[  125.110891] pcieport 0000:00:1d.0: AER: Corrected error received: 0000:04:00.0
[  125.110895] nvme 0000:04:00.0: AER: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
[  125.110898] nvme 0000:04:00.0: AER:   device [10ec:5762] error status/mask=00000001/00006000
[  125.110899] nvme 0000:04:00.0: AER:    [ 0] RxErr                 
[  125.118946] pcieport 0000:00:1d.0: AER: Corrected error received: 0000:04:00.0
[  125.118950] nvme 0000:04:00.0: AER: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
[  125.118952] nvme 0000:04:00.0: AER:   device [10ec:5762] error status/mask=00000001/00006000
[  125.118954] nvme 0000:04:00.0: AER:    [ 0] RxErr
...repeating

这种情况大概只会在 10 次重启中发生 1 次,而且我从未见过任何实际的行为问题(例如崩溃等)。顺便提一下,自从换到新的 SSD 以来,我注意到的唯一其他区别是系统音频非常微妙地断断续续(如这里所述)。

我发现其他一些帖子pci=nomsi建议通过在 中添加和pci=noaer来消除“PCIe 总线错误” /etc/default/grub,但这些似乎都在解决其他问题(即 Ubuntu 无法安装或其他行为问题)。一些帖子表明操作系统或内核可能对于特定硬件来说太过时了,所以既然我一直想切换到 Neon,我尝试全新安装 Neon 5.24(不同的分区)。不幸的是,行为是一样的:100% 正常运行的操作系统,只是非常有时在启动或关机时会显示上述消息的页面。

  1. 实际的物理 SSD 是否有可能有故障?它是新买的。
  2. 如果不是,上述情况是否值得关注?
  3. 有什么好的解决方案吗?我的理解是,这pci=noaer只是告诉它禁用高级错误报告,但这似乎并不是最好的解决方案。

系统是戴尔 Latitude 5490,BIOS 是最新的。SSD 是十铨 MP34 4TB(如果相关的话)。

答案1

解决方案是添加pci=nommconf到内核启动参数中,禁用内存映射 PCI 配置空间并恢复到传统的配置空间处理方式

已找到解决方案这里

答案2

为我:

pcie_aspm=off

修复了错误(但对我来说,这与 GTX 660 有关,而不是 SSD)。但听说它适用于 SSD,实际上取自: https://forums.unraid.net/topic/118286-nvme-drives-throwing-errors-filling-logs-instantly-how-to-resolve/?do=findComment&comment=1165150

来自上述链接:

您可以尝试 pcie_aspm=off 吗?这似乎会禁用引发错误的电源管理模式。我已将其放入配置中,以便下次重新启动时使用。

相关内容