磁盘报告“磁盘正常,5439488 个坏扇区”

磁盘报告“磁盘正常,5439488 个坏扇区”

在我看来,这似乎是一大堆坏扇区。这是一块 SATA M.2 SSD,但我认为这些东西可以隐藏坏扇区,而操作系统不必为此操心。Ubuntu 20.04 似乎能够计算这些坏扇区,但仍然宣布磁盘“正常”。

磁盘“正常”吗?我一直收到神秘的错误消息,提示“Ubuntu 20.04 遇到内部错误”,/var/crash 报告表明问题出在 gnome-control-center(被检测到?)。出现此错误后,系统运行良好 — 直到我重新启动。有两次,此错误后的重新启动完全失败,需要完全重新安装 20.04。

为什么磁盘会将能够检测到 5439488 个坏扇区的驱动器声明为“正常”?我原以为磁盘是在告诉我“您的 SSD 已经老化,但一切尽在掌控之中”。但如果坏扇区数量是导致重启失败的原因(这是我的假设,不是事实),那么为什么磁盘似乎对 SSD 不予理睬?

我最初的假设是 SSD 故障速度太快。这篇帖子的早期回复(现在似乎已经消失了)肯定 5439488 个坏扇区肯定表明驱动器需要更换。

我现在认为这是错误的。

首先,即使现在,几天后,坏扇区数量仍然稳定在 5439488。我认为处理坏扇区的过度配置(这将成为 SSD 的现实问题)是 SSD 控制器对操作系统不可见的功能,这似乎是一种误解。过度配置必须是可见的,因为驱动器向外界发布的容量是 256GB。我认为内部过度配置只能提供 240GB。

我原来的问题可以归结为:过度配置是否会向操作系统隐藏坏扇区,直到过度配置用完为止,在这种情况下,5439488 个坏扇区将会溢出,从而吞噬可用容量;或者操作系统实际上是否会报告每个故障扇区,包括那些通过过度配置处理的扇区?

但是,现在我很清楚,过度配置(可能由 SSD 控制器处理,对吗?)正在报告给 SMART,并且 Gnome Disks 和 GSmartControl 必须从 SMART 读取该信息。

顺便说一句,使用 GSmartControl 进行了两次简短测试和一次扩展测试,全部无错误完成。与 Gnome Disks 一样,GSmartControl 报告驱动器“正常”

据我估计,目前(稳定的)坏扇区数量约为 2.8GB。秘密超额配置的 SSD 会宣布 240GB,提供约 16GB 的储备。我们完全在这个限制之内。

我首先假设以下三者之间存在联系:1. Gnome Disks 的坏扇区数、2. “Ubuntu 20.04 遇到内部错误”消息和 3. 两次启动失败。

但我可能完全错了。上一条 Ubuntu 内部错误消息之后并没有出现启动失败。正如我所说,坏扇区数量保持稳定,系统似乎运行良好。

这篇文章的初稿最初被版主否决为仅代表个人观点。我不确定这是什么意思——是的,经过多次试验和深思熟虑后,我现在认为,有问题的 SSD 仍然状况良好,可以使用,不需要更换(并且与无法启动的问题无关)。

那么,这里的底线问题是:这是一个公平的评估吗?我遗漏了什么。

次要问题:我是否可以假设,宣布其容量已满的 SSD 仍在内部处理坏扇区,但会将其报告给 SMART?例如,以 240GB 出售的 SSD 是否会在内部处理 16GB 的过度配置而不向 SMART 报告?

在网上显然很难找到答案。这里有人能帮忙吗?

- 克里斯

答案1

如果有 5439488 个坏扇区,我会更换驱动器,因为坏扇区太多了。备份并更换驱动器,它很有可能很快出现故障。

了解什么是坏扇区:https://www.howtogeek.com/173463/bad-sectors-explained-why-hard-drives-get-bad-sectors-and-what-you-can-do-about-it/

希望这能有所帮助。乔纳森·斯特德曼。

答案2

十六进制(5439488)'0x530000'

这个数字更有可能是一个位模式。smartctl 列出的许多原始值都是位模式。如何解释它们通常取决于相关制造商。

答案3

大量坏扇区不一定是个问题。但如果坏扇区数量不断增加(尤其是在旋转生锈的情况下),或者您已经用完了替换扇区(无论是机械还是 SSD),故障可能很快就会发生。(写入均衡应该可以解决这个问题,但如果您频繁写入大部分磁盘,它可能会使情况变得更糟。您应该在进行全盘重写之前使用 trim 来缓解这种情况。)

还要记住,SSD 每个块的写入次数是有限的;SSD 使用耗损均衡来尝试为每个块提供相同数量的写入,以延长驱动器的使用寿命。如果 SMART 信息列出它,则应显示为 Wear_Leveling_Count,当前值下的数字是剩余的百分比。当它达到零时,驱动器将死亡,可能是因为不再接受写入。

答案4

这里得到的回复是“是的,需要更换 SSD”。

我无法完全否认这一点。但根据我掌握的证据,我现在认为这不是最好的建议。

自从两周前第一次发布这篇文章以来,系统一直很稳定。我确实遇到过一次我提到的 Ubuntu 内部错误消息,但之后系统重新启动时没有发生任何意外。而且——我认为,重要的是——自从出现这种情况以来,坏扇区数一直保持在 5439488。

因此,我根据所有这些得出的假设是:如果 Gnome Disks(或真正的 SMART)说您的驱动器没有问题,那它就没有问题。不要被表面上的高坏扇区数量所左右。这就是 SSD 的运作方式。

(我确实认为,如果使用 SMART 数据的应用程序能够将坏扇区数显示为磨损百分比,那将会更加 SMART。但 SMART 可能无法访问过度配置总数。)

-
克里斯

相关内容