NVMe 错误日志增加,但没有提供更多信息

NVMe 错误日志增加,但没有提供更多信息

几天以来,我收到硬盘健康警告,错误日志从 X 增加到 Y(见下面的代码)。每次重新启动笔记本电脑或从休眠状态唤醒后,错误日志都会增加。由于发生此错误,硬盘会在启动期间自动扫描。

This message was generated by the smartd daemon running on:

   host name:  Latitude-5590
   DNS domain: [Empty]

The following warning/error was logged by the smartd daemon:

Device: /dev/nvme0, number of Error Log entries increased from 71 to 74

Device info:
PM981 NVMe Samsung 512GB, S/N:S3ZHNY0K908914, FW:EXA73D1Q, 512 GB

For details see host's SYSLOG.

You can also use the smartctl utility for further investigation.
The original message about this issue was sent at Mon May 16 12:09:35 2022 CEST
Another message will be sent in 24 hours if the problem persists.

不幸的是syslog没有包含任何详细信息:

sudo grep smartd /var/log/syslog
May 20 20:58:23 Latitude-5590 smartd[686]: Device: /dev/nvme0, number of Error Log entries increased from 74 to 75
May 20 20:58:23 Latitude-5590 smartd[686]: Sending warning via /usr/share/smartmontools/smartd-runner to root ...
May 20 20:58:23 Latitude-5590 smartd[686]: Warning via /usr/share/smartmontools/smartd-runner to root produced unexpected output (183 bytes) to STDOUT/STDERR: 
May 20 20:58:23 Latitude-5590 smartd[686]: /etc/smartmontools/run.d/10mail:
May 20 20:58:23 Latitude-5590 smartd[686]: Your system does not have /usr/bin/mail.  Install the mailx or mailutils package
May 20 20:58:23 Latitude-5590 smartd[686]: run-parts: /etc/smartmontools/run.d/10mail exited with return code 1
May 20 20:58:23 Latitude-5590 smartd[686]: Warning via /usr/share/smartmontools/smartd-runner to root: failed (32-bit/8-bit exit status: 256/1)

使用该工具进一步调查nvme-cli也无济于事:

manu@Latitude-5590:~$ sudo nvme error-log -e 1 /dev/nvme0
Error Log Entries for device:nvme0 entries:1
.................
 Entry[ 0]   
.................
error_count  : 75
sqid         : 0
cmdid        : 0xa012
status_field : 0x4004(INVALID_FIELD: A reserved coded value or an unsupported value in a defined field)
parm_err_loc : 0xffff
lba          : 0
nsid         : 0
vs           : 0
cs           : 0
.................

/var/log/boot.log.1发现启动时检查了文件系统,但找不到检查结果。我甚至不知道哪个程序在执行检查。

manu@Latitude-5590:~$ sudo grep disk /var/log/boot.log.1
Starting File System Check…/dev/disk/by-uuid/D812-3DF4...
[  OK  ] Finished File System Check on /dev/disk/by-uuid/D812-3DF4.

能否获取有关该错误的更多详细信息?由于此硬盘包含有价值的数据,我想知道它到底出了什么问题。我正在使用 Ubuntu 20.04。

答案1

我遇到了同样的问题。我找到了一些相关信息这里这里。通过阅读第一个参考资料,我相信这是一个错误,它出现在一些平台上,这些平台会向 SSD 发送无效命令,从而增加机器每次启动时的错误日志计数。第二个参考资料是与此问题相关的对 smartmontools 的错误报告。

答案2

以下是此错误信息的解释:

驱动程序只是在尝试执行设备不支持的可选命令。驱动程序无法在不尝试的情况下知道设备是否支持该命令,所以它正在这样做。如果愿意,驱动器可以记录错误,但在我看来,这对于该命令来说是不必要的,但我们对此无能为力。我只会忽略这些错误。

https://bugzilla.kernel.org/show_bug.cgi?id=217445

相关内容