SSD 搞砸了 - 不知道如何在 Linux 上修复它

SSD 搞砸了 - 不知道如何在 Linux 上修复它

我被我的上网本 (Dell Latitude 3380) 困住了。使用一年了:效果很好。我购买并安装了新的 SSD,并在其上安装了 Kubuntu 18.04。几个小时以来,效果非常好。然后,当我从外部硬盘复制文件并执行一些操作时,它冻结了。然后它运行得非常慢,所以我想尝试一下 19.04。现在,我想,这是一个很大的错误:我手动更改了分区表。以前有一个 ext4 分区安装为 /,第二个安装为 /home 和 swap。我删除了第一个,一开始创建了200MB EFI,剩下的再次格式化为ext4,/。我离开 /home 并交换而没有格式化。

系统安装时没有错误或警告,但重新启动后只有 grub rescue。我可以用它从 Live USB 启动 Linux(这就是我写的方式)——所以模块文件就在那里并且可以读取。 (当然,我可以通过 BIOS 直接从 USB 启动)。 GRUB 看到该磁盘上的分区。 /dev/sda1(EFI 分区)设置为 BOOT,但系统本身和 GRUB 文件位于 /dev/sda7 上。我想这是一个问题。

但是,任何从 Ubuntu Live 或 System Rescue CD Live 在我的 /dev/sda 上使用 gparted、fdisk、wipefs 或 fsck 的尝试都会以奇怪的错误结束。每隔两分钟我就会收到如下消息:

INFO: task fsck.ext2:6081 blocked for more than 120 seconds.
Not tainted 4.19.34-1-lts #1

ctrl+c 没有帮助。我必须进行硬重置。 Kubuntu 安装程序向我显示错误消息,"/dev/sda1/" cannot be accessed因此我无法继续进行时区设置。我的 BIOS 有一个擦除内部磁盘的选项。我运行它,但它以错误结束并且没有详细信息。我做到了

dd if=/dev/zero of=/dev/sda

并离开电脑过夜。工作没有错误,写入了大约 512GB 的零,但没有真正改变;P 分区仍然在那里,正如我从 grub 救援中看到的那样。我能够运行 fdisk -l 一次并看到分区表。然后我尝试 fsck /dev/sda ,它再次产生“未污染”的情况。

这里发生了什么事?这是SSD故障吗?似乎不是,因为在我第一次安装时,我能够正常使用它。 SMART 也没有显示任何错误。显然,我不关心磁盘上的任何数据。我只想尽一切努力来全新安装新的 Kubuntu(或 Mint 或其他)。

这是blkid输出:

/dev/sda1: UUID="D66B-BF6C" TYPE="vfat" PARTUUID="b9d3b90b-01"
/dev/sda5: UUID="eec4f953-b9ba-4579-95f4-8f9a8d6821a3" TYPE="ext4" PARTUUID="b9d3b90b-05"
/dev/sda7: UUID="8b9d60f7-fa03-459a-9d34-784d4259338a" TYPE="ext4" PARTUUID="b9d3b90b-07"

一些附加信息:我的上网本在 Kubuntu 16.04 上工作正常一年了,只是偶尔会因一些 I/O 错误而挂起,消息还包含 HDD 的扇区号。 (如果您认为相关,我可以提供更详细的描述)

我的新 SSD 是 Goodram CX400 512GB。

每当我使用 Kubuntu 18.04、19.04、Mint 19.1 或 Fedora 30 KDE 启动 USB 时,我都会看到这样的消息(在 Kubuntu 16.04 上没有看到它们):

May 28 06:38:22 kubuntu kernel: mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 6: ee2000000040110a
May 28 06:38:22 kubuntu kernel: mce: [Hardware Error]: TSC 0 ADDR fef1ce80 MISC 43880014086 
May 28 06:38:22 kubuntu kernel: mce: [Hardware Error]: PROCESSOR 0:806e9 TIME 1559025486 SOCKET 0 APIC 0 microcode 9a
May 28 06:38:22 kubuntu kernel: mce: [Hardware Error]: Machine check events logged
May 28 06:38:22 kubuntu kernel: mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 7: ee2000000040110a
May 28 06:38:22 kubuntu kernel: mce: [Hardware Error]: TSC 0 ADDR fef1cec0 MISC 47880014086 
May 28 06:38:22 kubuntu kernel: mce: [Hardware Error]: PROCESSOR 0:806e9 TIME 1559025486 SOCKET 0 APIC 0 microcode 9a

我发现人们在戴尔笔记本电脑上遇到类似问题,并声称这些是误报(例子1,例子2)。

几次通过后的 Memtest 根本不会产生任何错误。

答案1

由于所有写入操作都会失败并且数据会被保留,因此听起来好像驱动器已将自身设置为只读,这可能是由于错误情况(过热、电涌等)造成的。

向制造商技术支持发送邮件并解释问题。他们可能会帮助修复/重置或可能更换驱动器。

[电子邮件受保护]

相关内容