Centos 7 + ESXi 6:sd 0:0:0:0 间歇性冻结:[sda] 任务在主机 0 上中止

Centos 7 + ESXi 6:sd 0:0:0:0 间歇性冻结:[sda] 任务在主机 0 上中止

我刚刚安装了 ESXi 6 并且正在准备 Centos 7 VM,但它遇到了一些奇怪的问题。

它随机冻结正在执行的任何 I/O 操作并在 dmesg 中不断显示以下消息:

[  656.996856] sd 0:0:0:0: [sda] Failed to abort cmd ffff883d6ccf79c0
[  656.996861] sd 0:0:0:0: [sda] task abort on host 0, ffff883d6ccf5a40
[  656.996862] sd 0:0:0:0: [sda] Failed to abort cmd ffff883d6ccf5a40
[  656.996865] sd 0:0:0:0: [sda] task abort on host 0, ffff883d6ccf4fc0
[  656.996866] sd 0:0:0:0: [sda] Failed to abort cmd ffff883d6ccf4fc0
[  656.996868] sd 0:0:0:0: [sda] task abort on host 0, ffff883d6ccf5340
[  656.996870] sd 0:0:0:0: [sda] Failed to abort cmd ffff883d6ccf5340
[  656.996872] sd 0:0:0:0: [sda] task abort on host 0, ffff883d6ccf7100
[  656.996873] sd 0:0:0:0: [sda] Failed to abort cmd ffff883d6ccf7100

几秒钟后,它终于恢复 I/O 操作并显示:

[  656.996960] sd 0:0:0:0: [sda] SCSI device reset on scsi0:0

一些要点:

  • 这不太可能是由硬件问题引起的。这台服务器很新,我之前运行 Centos 7(裸机)时没有出现问题。

  • RAID 卡 (LSI MegaRAID 9361-8i) 没有显示任何问题。所有 SSD 均在线且无 SMART 错误。

以防万一,我正在使用准虚拟 SCSI 控制器。它由 ESXi 自动选择。

还有其他人遇到过这个问题吗?

答案1

看起来这个问题是由 lsi-mr3 驱动程序引起的。

我下载了以下驱动程序并且错误消失:https://my.vmware.com/web/vmware/details?downloadGroup=DT-ESXI60-LSI-LSI-MR3-66090800-1OEM&productId=491

相关内容