PCIe 总线错误快速填充日志

PCIe 总线错误快速填充日志

我的系统出了问题,这个错误以每秒数千次的速度出现在 syslog 和 kern.log 中。它被列为已纠正的事实让我认为它是短暂的并且没有任何问题,但事实上它以如此令人讨厌的频率填充根的事实是有问题的(你见过 250+ GB 的 kern.log 吗?)。

pcieport 0000:00:03.0: PCIe Bus Error: severity=Corrected, type=Physical Layer, id=0018(Receiver ID)
pcieport 0000:00:03.0:   device [8086:2f08] error status/mask=00000001/00002000
pcieport 0000:00:03.0:    [ 0] Receiver Error         (First)
pcieport 0000:00:03.0: AER: Multiple Corrected error received: id=0018

有时,还有另一句话说can't find device of ID0018也混在一起。除了这些日志条目填满根目录之外,没有其他症状。对于我用它进行的最小浏览/视频播放/编码,该系统表现良好。使用 nvidia-343 驱动程序通过 HDMI 将图形输出到 4k 显示器。

我真正能从中看出的是“设备 [8086:2f08]”是 CPU 之外的根 PCIe 集线器之一。 GPU 是我插入的唯一 PCIe 设备,但我不知道主板上的任何板载功能是否也可能脱离 PCIe 总线。

系统信息:

mnemosyne ~ # inxi -Fxz
System:    Host: mnemosyne Kernel: 3.13.0-24-generic x86_64 (64 bit, gcc: 4.8.2) Console: tty 5 Distro: Linux Mint 17 Qiana
Machine:   System: ASUS product: All Series
           Mobo: ASUSTeK model: X99-A version: Rev 1.xx Bios: American Megatrends version: 0216 date: 08/29/2014
CPU:       Hexa core Intel Core i7-5820K CPU (-HT-MCP-) cache: 15360 KB flags: (lm nx sse sse2 sse3 sse4_1 sse4_2 ssse3 vmx) bmips: 40398.7
           Clock Speeds: 1: 1200.00 MHz 2: 1200.00 MHz 3: 1200.00 MHz 4: 3301.00 MHz 5: 1200.00 MHz 6: 1200.00 MHz 7: 3301.00 MHz 8: 1200.00 MHz 9: 1200.00 MHz 10: 1200.00 MHz 11: 1200.00 MHz 12: 1200.00 MHz
Graphics:  Card: NVIDIA GM107 [GeForce GTX 750] bus-ID: 01:00.0
           X.org: 1.15.1 drivers: nvidia (unloaded: fbdev,vesa,nouveau) tty size: 175x51 Advanced Data: N/A out of X
Audio:     Card: NVIDIA Device 0fbc driver: snd_hda_intel bus-ID: 01:00.1 Sound: ALSA ver: k3.13.0-24-generic
Network:   Card: Intel Ethernet Connection (2) I218-V driver: e1000e ver: 2.3.2-k port: f020 bus-ID: 00:19.0
           IF: eth0 state: up speed: 1000 Mbps duplex: full mac: <filter>
Drives:    HDD Total Size: 36519.2GB (13.7% used) 1: id: /dev/sda model: WDC_WD60EFRX size: 6001.2GB
           2: id: /dev/sdb model: WDC_WD60EFRX size: 6001.2GB 3: id: /dev/sdc model: WDC_WD60EFRX size: 6001.2GB
           4: id: /dev/sdd model: WDC_WD60EFRX size: 6001.2GB 5: id: /dev/sde model: Crucial_CT512MX1 size: 512.1GB
           6: id: /dev/sdf model: WDC_WD60EFRX size: 6001.2GB 7: id: /dev/sdg model: WDC_WD60EFRX size: 6001.2GB
Partition: ID: / size: 454G used: 342G (80%) fs: ext4 ID: swap-1 size: 17.08GB used: 0.93GB (5%) fs: swap
RAID:      No RAID devices detected - /proc/mdstat and md_mod kernel raid module present
Sensors:   System Temperatures: cpu: 32.0C mobo: N/A
           Fan Speeds (in rpm): cpu: N/A
Info:      Processes: 318 Uptime: 9 days Memory: 4353.6/15950.5MB Runlevel: 2 Gcc sys: 4.8.2 Client: Shell inxi: 1.8.4

任何有关可能导致此问题的原因的建议,或任何缩小选项范围的方法将不胜感激。这是我拥有的所有计算机硬件,因此无法更换部件。

答案1

您可以使用以下命令确定连接到该根端口的设备

lspci -v -s 3.0 | grep Bus:

你应该看到这样一行:

Bus: primary=00, secondary=04, subordinate=04, sec-latency=0

次要和从属通常是相同的,因此您可以使用以下命令

lspci -s 4:0

查看该总线上有哪些设备。对于我的系统来说,它看起来像这样:

lspci -v -s 4:0            
04:00.0 SATA 控制器:Marvell Technology Group Ltd. 88SE9123 PCIe SATA 6.0 Gb/s 控制器(修订版 11)
04:00.1 IDE 接口:Marvell Technology Group Ltd. 88SE912x IDE 控制器(修订版 11)

相关内容