我刚刚安装了 ESXi 6 并且正在准备 Centos 7 VM,但它遇到了一些奇怪的问题。
它随机冻结正在执行的任何 I/O 操作并在 dmesg 中不断显示以下消息:
[ 656.996856] sd 0:0:0:0: [sda] Failed to abort cmd ffff883d6ccf79c0
[ 656.996861] sd 0:0:0:0: [sda] task abort on host 0, ffff883d6ccf5a40
[ 656.996862] sd 0:0:0:0: [sda] Failed to abort cmd ffff883d6ccf5a40
[ 656.996865] sd 0:0:0:0: [sda] task abort on host 0, ffff883d6ccf4fc0
[ 656.996866] sd 0:0:0:0: [sda] Failed to abort cmd ffff883d6ccf4fc0
[ 656.996868] sd 0:0:0:0: [sda] task abort on host 0, ffff883d6ccf5340
[ 656.996870] sd 0:0:0:0: [sda] Failed to abort cmd ffff883d6ccf5340
[ 656.996872] sd 0:0:0:0: [sda] task abort on host 0, ffff883d6ccf7100
[ 656.996873] sd 0:0:0:0: [sda] Failed to abort cmd ffff883d6ccf7100
几秒钟后,它终于恢复 I/O 操作并显示:
[ 656.996960] sd 0:0:0:0: [sda] SCSI device reset on scsi0:0
一些要点:
这不太可能是由硬件问题引起的。这台服务器很新,我之前运行 Centos 7(裸机)时没有出现问题。
RAID 卡 (LSI MegaRAID 9361-8i) 没有显示任何问题。所有 SSD 均在线且无 SMART 错误。
以防万一,我正在使用准虚拟 SCSI 控制器。它由 ESXi 自动选择。
还有其他人遇到过这个问题吗?
答案1
看起来这个问题是由 lsi-mr3 驱动程序引起的。
我下载了以下驱动程序并且错误消失:https://my.vmware.com/web/vmware/details?downloadGroup=DT-ESXI60-LSI-LSI-MR3-66090800-1OEM&productId=491