确认硬盘写入错误

Question 1

硬盘错误往往会被内核捕获。您的服务器是否有 ECC RAM（应该有）...如果没有它，内存错误可能会被忽略。RAID 适配器等上的任何缓存 RAM 也是如此。拔出 DIMM，清洁触点并重试，或尝试运行 Memtest。

检查驱动器上的 SMART 错误可能会有所帮助。驱动器可能会在没有 SMART 错误的情况下发生故障，但通常边缘驱动器会有这些错误。“smartctl -a /dev/sd[x]”或 smartctl --test=long /dev/sd[x] 应该会提供更多信息。

Answer

硬盘错误往往会被内核捕获。您的服务器是否有 ECC RAM（应该有）...如果没有它，内存错误可能会被忽略。RAID 适配器等上的任何缓存 RAM 也是如此。拔出 DIMM，清洁触点并重试，或尝试运行 Memtest。

检查驱动器上的 SMART 错误可能会有所帮助。驱动器可能会在没有 SMART 错误的情况下发生故障，但通常边缘驱动器会有这些错误。“smartctl -a /dev/sd[x]”或 smartctl --test=long /dev/sd[x] 应该会提供更多信息。

Question 2

您是否在内核日志中看到 HD 写入错误？请务必检查驱动器的 SMART 统计数据，例如：http://www.captain.at/howto-linux-smartmontools-smartctl.php

此外，损坏的内存可能会导致文件损坏。您是否有对机器的远程 KVM 访问权限？在这种情况下，您应该运行 memtest 或类似程序（http://www.memtest.org/）

Answer

您是否在内核日志中看到 HD 写入错误？请务必检查驱动器的 SMART 统计数据，例如：http://www.captain.at/howto-linux-smartmontools-smartctl.php

此外，损坏的内存可能会导致文件损坏。您是否有对机器的远程 KVM 访问权限？在这种情况下，您应该运行 memtest 或类似程序（http://www.memtest.org/）

相关内容