如何在本地分析来自服务器的 SMART 日志?

如何在本地分析来自服务器的 SMART 日志?

我家里的台式机上运行着 Ubuntu 10.04 服务器。我重启了电脑,大约 10 分钟后电脑就无法访问了。此时我应该连接一个控制台(使用 VGA 电缆连接显示器)。但我却关闭了电脑(按住电源按钮三秒钟)。这次我做过连接控制台,并且 fsck 正在运行。我猜第一次无法访问该框是因为 fsck 当时也在运行。无论如何,在下次重新启动时,我无法在两个 1.5TB 驱动器之一 (/dev/sdb1) 上安装分区。

fsck /dev/sdb1发现了一些错误(短读?类似的东西)但fsck -Cy /dev/sdb1修复了它们,然后我能够安装和使用该分区。

我已经安装了 smartmontools 并将其配置为守护进程运行,如下所示本指南如果我运行sudo service smartmontools restartroot用户将收到四封电子邮件,并出现以下错误:

Device: /dev/sda, 366 Currently unreadable (pending) sectors
Device: /dev/sdb, 13 Currently unreadable (pending) sectors
Device: /dev/sdb, 28 Offline uncorrectable sectors
Device: /dev/sda, 90 Offline uncorrectable sectors

两个驱动器(所有分区)看起来都很好:我没有在 /var/log/{syslog,messages} 中看到任何应用程序错误、奇怪的行为或错误/警告。

最后,还有几个问题:

  1. 有没有办法从盒子中获取 SMART 日志并在本地使用以下方法进行分析智能控制
  2. 中途终止 fsck 是否真的会损坏硬件?
  3. 如果驱动器确实没有问题,我能以某种方式消除/重置 SMART 错误吗?

谢谢,-亚当

更新:驱动器显然是健康的:

# smartctl -H /dev/sda
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

# smartctl -H /dev/sdb
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

答案1

对于您的第一个问题:这是我使用 3Ware 控制器上的磁盘执行此操作的方法:

server $ smartctl -d 3ware,0 -a /dev/twa0 > smart.0
server $ smartctl -d 3ware,1 -a /dev/twa1 > smart.1
server $ smartctl -d 3ware,2 -a /dev/twa2 > smart.2
wks $ scp server:smart.* .
wks $ gsmartcontrol -q --no-scan --add-virtual smart.0 --add-virtual smart.1 --add-virtual smart.2

相关内容