搭载三星 850 Pro SSD 的 LSI 9207-9i (SAS2308) 上出现 ZFS cksum 错误

搭载三星 850 Pro SSD 的 LSI 9207-9i (SAS2308) 上出现 ZFS cksum 错误

我正在测试一个 LSI 9207-8i 控制器,该控制器上连接了 8 个三星 850 Pro 256GB SSD。SSD 运行的是最新固件 EXM02B6Q,控制器运行的是 P17,并且出现了与 P19 相同的问题。服务器 RAM 是 ECC,并且一直在镜像模式下进行测试。

我已经使用 ZFS-On-Linux 和 FreeBSD 进行了测试,并且在这两个操作系统上尝试了 LSI 的驱动程序。

磁盘表现正常,但在大量 IO 期间,它们似乎正在写入坏块。在磁盘上运行清理时,会出现校验和错误。为了模拟大量 IO,我使用 16k 的记录大小,其中 primarycache=metadata 和 secondarycache=none。我生成一个 4gb 的随机文件,并在 4 个线程中将其 dd 到另一个文件中。循环几次就足以让清理显示校验和错误。

尚未确认这是否是控制器、SSD 或电缆的问题。我怀疑是 SSD 的问题,但下次有机会时会用 9211-8i 进行测试。

有没有人遇到过类似的问题,或者除了更换控制器/ SSD 之外,有人对下一步该做什么有什么建议吗?

更新:在完全不同的服务器上使用板载 SATA 控制器测试了另一台带有 EXM01B6Q 固件的三星 850 Pro 256GB。校验和也出现了同样的问题。

答案1

我以前也遇到过三星 850 Evo 的这个问题。驱动器在 OmniOS/OpenSol 中显示为 512K 对齐,由于缺少 ashift 参数,所以会出现此问题。这似乎是磁盘本身的某种垃圾收集问题,我写入了大量数据,然后清理——然后看到错误。

我们最终强制磁盘在 sd.conf 中显示为 4K 对齐,然后 ZFS 开始正常运行。

我想我应该提起这件事以防其他人遇到同样的问题。

答案2

我已经设法通过在创建池时设置 ashift=12(4k 对齐)来解决该问题。

答案3

我怀疑面向消费者的三星 850 SSD 或驱动器背板,假设在此配置中有一个。

这主要是因为您在两个不同的操作系统上都遇到了错误。您能提供有关硬件配置的其他详细信息吗?

相关内容