是否有任何“本机”方法来检查磁盘错误/故障?

是否有任何“本机”方法来检查磁盘错误/故障?

目前,我使用一种大杂烩式的方法检查磁盘故障,包括检查系统日志中的文件系统错误、RAID 控制器/HBA burp 错误,以及主动将文件写入磁盘、检查其内容并删除它。这些方法的结果适用于我们现有的任何监控解决方案,但通常这是一种糟糕的做法。XFS 报告错误的方式与 ext4 或 zfs 等不同。

我觉得现在应该存在类似的东西/sys/block/sdc/write_error_count,即只要块写入因任何原因失败,计数器就会递增。read_error_count那边也会存在类似的东西。文件系统(而不是原始块设备)也可能存在类似的东西。

Linux 中现在真的存在类似的东西吗?如果没有,是否有任何真正规范的方法来检查存储故障?

答案1

怎么样智能工具具体来说smartctl,该命令会smartctl向您报告硬盘的 SMART 统计信息,您将看到错误数、设备运行的小时数等等。

相关内容