RTL810xE PCI Express 快速以太网在架构上产生多个日志错误

RTL810xE PCI Express 快速以太网在架构上产生多个日志错误

我的日记里充斥着这样的内容:

    journalctl -r
    2024-01-10T20:07:01.947911-08:00 dell kernel: pci 0000:01:00.0:    [ 0] RxErr                  (First)
    2024-01-10T20:07:01.947686-08:00 dell kernel: pci 0000:01:00.0:   device [10ec:8136] error status/mask=00000001/00006000
    2024-01-10T20:07:01.947423-08:00 dell kernel: pci 0000:01:00.0: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
    2024-01-10T20:07:01.946988-08:00 dell kernel: pcieport 0000:00:1d.0: AER: Multiple Corrected error received: 0000:01:00.0
    2024-01-10T20:07:01.694824-08:00 dell kernel: pci 0000:01:00.0:    [ 0] RxErr                  (First)
    2024-01-10T20:07:01.694573-08:00 dell kernel: pci 0000:01:00.0:   device [10ec:8136] error status/mask=00000001/00006000
    2024-01-10T20:07:01.694279-08:00 dell kernel: pci 0000:01:00.0: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
    2024-01-10T20:07:01.693781-08:00 dell kernel: pcieport 0000:00:1d.0: AER: Multiple Corrected error received: 0000:01:00.0
    2024-01-10T20:07:01.601284-08:00 dell kernel: pci 0000:01:00.0:    [ 0] RxErr                  (First)
    
    

该卡是RTL810xE PCI Express Fast Ethernet controller根据https://linux-hardware.org/index.php?id=pci:10ec-8136-1028-056a想要 Realtek r8169 驱动程序。

https://wiki.archlinux.org/title/Network_configuration/以太网页面中有一个部分Realtek no link / WOL problem表明该驱动程序在 Windows 双启动中存在问题。这不是双启动机器。这是arch linux 6.6.10-arch1-1

我可以使卡片栩栩如生,modprobe r8169但这不会影响该设备的日志错误消息。

答案1

您的内核配置了 PCI Express 根端口高级错误报告 ( CONFIG_PCIEAER) 功能,并且芯片组正在检测与总线位置 0000:01:00.0 中的 RTL810xE NIC 通信的可纠正的轻微 PCIe 链路错误,并且自动纠正它们。

这不是网络通信错误:这是计算机内的 PCIe 链接错误。

如果此网络接口是附加卡,请确保该卡未损坏、牢固地固定在插槽中,并且卡边缘连接器表面干净。如果可能的话,用另一块同型号的网卡进行测试。

否则,特别是如果该网络接口集成到主板上,这些错误可能是该特定芯片和/或主板设计的“已知问题”,并且您可能无法消除根本原因。但是,只要错误属于该severity=Corrected类型,就不会造成任何问题。

如果以前正常工作的组件突然开始产生多个severity=Corrected错误,这可能是即将发生硬件故障的早期迹象。内核正在报告它们,以便系统管理员可以判断主动维护是否合适。

换句话说:如果系统以前在没有这些警告的情况下工作,那么最好在手边准备一块备用网卡,以防万一出现故障。

使用错误级别(= 数字 4)severity=Corrected发出消息。KERN_WARNING要删除日记中的这些消息,您可以调整systemd-journald为仅存储高于该优先级的消息:

/etc/systemd/journald.conf.d/silence-kernel-warnings.conf创建一个包含以下内容的文件:

[Journal]
MaxLevelKMsg=err

这不会影响 的错误severity=Uncorrected,该错误将指示相应 PCIe 链路中的实际数据损坏。此类错误以KERN_ERR错误级别(= 数字 3)报告。

如果您正在构建自己的自定义内核,请考虑禁用CONFIG_PCIEAER内核配置选项。

相关内容