如何检查 14.04 及更高版本下的驱动器的 SMART 状态?我见过检查全新安装的 HD SMART 状态但它似乎不适用于 14.04 及更高版本。
答案1
磁盘实用程序
启动磁盘实用程序(如果您还没有,您可以通过软件中心安装磁盘或打开终端并发出命令sudo apt-get install gnome-disk-utility
。
选择感兴趣的驱动器,然后单击右上角的菜单按钮并选择智能数据和自我测试
请注意,在 18.10 和 20.04 之间的某个时间,菜单选项已从“汉堡菜单”移至 3 个垂直点菜单,如下所示。
自我检测类型
- 短的:检查磁盘的电气和机械性能以及读取性能。电气测试可能包括缓冲 RAM 测试、读/写电路测试或读/写磁头元件测试。机械测试包括数据轨道上的寻道和伺服。扫描驱动器表面的一小部分(区域特定于供应商,并且测试有时间限制)。检查可能存在读取错误的待处理扇区列表,通常需要不到两分钟的时间。
- 长/延长:短自检的更长更彻底的版本,扫描整个磁盘表面,没有时间限制。此测试通常需要几个小时,具体取决于驱动器的读/写速度及其大小。
- 输送:旨在快速测试以确定设备从驱动器制造商运输到计算机制造商期间发生的损坏。仅适用于 ATA 驱动器,通常需要几分钟。
如何解读 SMART 属性
就故障率而言,最重要的属性可能是196 - 重新分配的扇区数,但考虑到谷歌研究论文: _“……仅基于 SMART 参数的故障预测模型的预测准确性可能会受到严重限制,因为我们的大部分故障驱动器都没有显示任何 SMART 错误信号。”但是,研究中大多数发生故障的驱动器(超过 60%)确实表现出智能故障,因此尽管它可能不完善,但它仍然是有效的指标。
请注意,虽然大多数最新驱动器都支持 SMART,但并非所有驱动器都支持,并且实现方式可能有所不同。有关 SMART 的更多详细信息,请参阅https://en.wikipedia.org/wiki/SMART。
答案2
libatasmart
Gnome Disks 使用的库的命令行版本被skdump
称为libatasmart-bin
默认情况下未安装的软件包。使用以下命令安装:
sudo apt install libatasmart-bin
接下来运行以下命令,通过在终端中运行以下命令(替换/dev/sda
为驱动器的路径)来查看 SMART 信息:
sudo skdump /dev/sda
作为替代方案smartctl
,smartmontools
可以使用软件包。使用以下命令安装:
sudo apt install smartmontools
然后,您将能够通过在终端中运行以下命令(替换/dev/sda
为驱动器的路径)来获取有关 SMART 的信息:
sudo smartctl --all /dev/sda
请注意,这smartctl
往往过于冗长。使用-q errorsonly
参数仅显示错误:
sudo smartctl --quietmode=errorsonly --all /dev/sda
答案3
Ubuntu 16.04
这个答案是从此处关闭的重复问题迁移而来的(SMART 数据(磁盘自检选项)发生了什么)。
上述问题已更改为需要 Ubuntu 14.04 之后的版本,但答案没有改变,也不适用于 Ubuntu 16.04。因此,它引起了如封闭式问题中所述的混乱。
选择Dash
第一个选项Launcher
并输入disks
。选择出现的图标。如果该disks
程序不可用,您需要先使用以下命令安装它:
sudo apt-get install gnome-disk-utility
主disks
屏幕如下所示:
注意右上角的“汉堡”菜单。选择它会显示一个下拉菜单,您可以在其中选择如下所示的 SMART 屏幕:
如果您需要进一步解释,请在下面评论。
SMART 选项变灰
在评论中提到 SMART 选项是灰色的。NVMe SSD 可能会发生这种情况。在这种情况下参考这个答案:
您需要首先安装 NVMe SSD 特定的 SMART 工具:
sudo apt install nvme-cli
然后运行程序来报告驱动器的健康状况:
$ sudo nvme smart-log /dev/nvme0
Smart Log for NVME device:nvme0 namespace-id:ffffffff
critical_warning : 0
temperature : 40 C
available_spare : 100%
available_spare_threshold : 10%
percentage_used : 0%
data_units_read : 28,167,888
data_units_written : 19,397,424
host_read_commands : 561,183,142
host_write_commands : 171,788,833
controller_busy_time : 1,354
power_cycles : 2,385
power_on_hours : 1,363
unsafe_shutdowns : 133
media_errors : 0
num_err_log_entries : 608
Warning Temperature Time : 0
Critical Composite Temperature Time : 0
Temperature Sensor 1 : 40 C
Temperature Sensor 2 : 51 C
最重要的数据点是:
percentage_used : 0%
当它达到 100% 时,你就该担心更换你的硬盘了。也就是说,这个硬盘已经两年了,而且仍然0%