我在使用板载 nvidia 千兆网络时遇到了问题,在网络负载很大的时候,我看到记录了以下错误:
“nv_nic_irq 中的迭代次数过多 (6)”
我正在这些 NIC 上运行 Hadoop DFS,我发现校验和错误不断累积,直到整个系统失败。
我正在运行 2.6.26-2-amd64 内核,我的初步研究似乎表明它是 forcedeth 驱动程序的问题。
以前有人遇到过这个问题吗?
如果有人能帮忙,请提前致谢!Ryan
答案1
是的,这显然很常见。这个问题已经有几个星期了,所以你可能已经找到了答案,但如果没有,解决办法似乎是添加:
最大中断工作=否
到 modprobe.conf,如下所示:
options forcedeth max_interrupt_work=15
即使进行了这样的更改,我在进行大型网络传输时仍然会遇到一些间歇性的 forcedeth 问题,但我再也没有收到您列出的错误消息。