drive-failure

如果 LTO-6 驱动器的所有 LED 均闪烁,这意味着什么?
drive-failure

如果 LTO-6 驱动器的所有 LED 均闪烁,这意味着什么?

半高 LTO-6 驱动器的所有 LED 以约 4 Hz 的频率闪烁。LTO-5 磁带仍在驱动器中,驱动器对命令没有反应,电源循环后继续闪烁。 我在 Tandberg 手册中找不到错误代码。该驱动器已使用约 3 年,只有约 15 次完整备份的历史记录,磁带已写入两次。因此,我认为不是机械磨损,而是电子问题。 这款 Tandberg LTO-6 驱动器是采用单独外壳的 LTO-6 HP 驱动器,因此了解此代码对于 HP LTO-6 驱动器的含义也会有所帮助。 谁知道该代码的含义以及记录在哪里? ...

Admin

如何检测硬盘故障?
drive-failure

如何检测硬盘故障?

我负责管理大量 Windows 服务器。最近,许多服务器报告硬盘错误,事件代码为 11 和 55。CHKDSK 表示硬盘大多数时候都正常。我可以使用哪些其他诊断工具来更准确地检测硬盘故障?这些 Windows 事件可能是误报吗?我已经评估了 SMART,它似乎存在严重的敏感性和特异性问题。 ...

Admin

拍摄失败的启动驱动器的图像
drive-failure

拍摄失败的启动驱动器的图像

好的,我的 Ubuntu 12.10 安装似乎有点不对劲。它目前从 Compactflash 卡启动,我原本计划很快更换它,但幸运的是,它现在已经坏了。启动过程到达某个点,然后就停在那里,如果我从闪存驱动器启动发行版,然后挂载 LVM 分区,实时发行版会在几分钟后冻结。现在我并不反对安装并重新启动,但我很想删除我的所有配置文件等(所有用户数据都存储在单独的 ZFS 池中)。 我是否值得先尝试对驱动器进行 fsck,或者我是否最好避免对其进行进一步的操作? 如果是的话,那么如何导入 ZFS 池,然后将文件系统 DDing 到池上的映像中?这样我就可以访问它...

Admin

了解 Synology 1812+ 设备的 SMART 值
drive-failure

了解 Synology 1812+ 设备的 SMART 值

我有一台 Synology 1812+ NAS,其中有 8 个 3TB 硬盘,配置为 RAID 5。它运行的是 DSM 4.1。购买它是为了更换 USB 硬盘、整合存储并使用 Time Machine 进行短期 OS X 备份。该设备和硬盘才使用 2 个月。 每隔一周,我就会从两个驱动器中收到 IO 错误。日志中有以下错误: Read error at internal disk [3] sector 2586312968. 后来 Bad sector at md2 disk3 sector 250049936 has been corrected...

Admin

在一个分区上检测到 mdadm 故障
drive-failure

在一个分区上检测到 mdadm 故障

今天我收到一封相当不错的电子邮件,提示 RAID1 阵列中的一个驱动器出现故障。 A Fail event had been detected on md device /dev/md4. It could be related to component device /dev/sdc2. Faithfully yours, etc. P.S. The /proc/mdstat file currently contains the following: Personalities : [raid1] md4 : active raid1 sdd...

Admin

我是不是刚刚看到我的 NVMe 驱动器坏了?或者可能是我的主板坏了?
drive-failure

我是不是刚刚看到我的 NVMe 驱动器坏了?或者可能是我的主板坏了?

更新:已解决 看来问题出在驱动器上。通过保留它非常冷静下来,慢慢地移动,休息片刻,我就能一次恢复一个文件的所有数据。感谢大家的帮助! 我的系统包含一个 Mushkin MKNSSDPE2TB-D8 系统驱动器(2TB NVMe SSD)和两个 SATA 驱动器,它们位于镜像 RAID 阵列中。Ubuntu Server 22.04 于 4 周前(10 月 7 日,前后几天)安装,没有出现问题。 我最近开始向系统驱动器写入文件,在过去 48 小时内写入了约 200GB。注意到多次系统崩溃,系统变得无响应,每次都需要硬重启。为了诊断,我开始监控内核消息缓冲区 ...

Admin

HDD 出现故障,但更换 PCB 能修复吗?
drive-failure

HDD 出现故障,但更换 PCB 能修复吗?

我的 WD RED WD80EFAX HDD 上周突然坏了:我关闭了 Proxmox 服务器,重新启动后,驱动器开始“咔嗒”作响。它咔嗒作响了一会儿,然后停止了,不再发出这种声音。我事先没有收到任何 SMART 警告,回头看看 /var/lib/smartmontools/ attrlog,我认为那里没什么可担心的: 日期 SMART 属性 ID 当前的 生的 2023-10-24 09:34:51 1 100 0 2023-10-24 09:34:51 2 128 116 2023-10-24 09:34:51 3 253 2031...

Admin

RAID1 驱动器消失了,但重启后可以重新添加。我应该担心吗?
drive-failure

RAID1 驱动器消失了,但重启后可以重新添加。我应该担心吗?

我正在运行 Debian 12,带有 MD RAID1 阵列(2 个驱动器),用于存储我的个人数据(阵列上没有系统文件)。 今天,我收到了一封来自 mdadm 的关于 DegradedArray 事件的邮件,当时我的驱动器通常不使用: This is an automatically generated mail message from mdadm running on hostname A DegradedArray event had been detected on md device /dev/md0. Faithfully yours, et...

Admin

在 RAID 6 中更换故障硬盘后,企鹅服务器无法启动
drive-failure

在 RAID 6 中更换故障硬盘后,企鹅服务器无法启动

我有一台 Penguin Relion 1900 1U 机架式服务器,运行 CentOS 7,最近硬盘出现故障。它有 4 个硬盘,配置为 RAID 6。为了更换故障硬盘,我关闭了机器,用相同大小(4TB)的新硬盘替换了故障硬盘,然后再次打开机器。 系统启动到 EFI shell 而不是加载操作系统。我退出 shell 并进入 BIOS,发现 BIOS 高级设置中 RAID 菜单下的 RAID 阵列状态正在重建。 6-7 小时后,我注意到重建已完成,并且 RAID 状态处于“最佳”状态,一切看起来都很好。我保存并退出 BIOS,但它进入了 EFI shell,...

Admin

从 3 个工作驱动器恢复 raid5,其中一个出现读取错误
drive-failure

从 3 个工作驱动器恢复 raid5,其中一个出现读取错误

我有 4 个驱动器,之前丢失了一个驱动器,现在 qnap web gui 报告另一个驱动器有读取错误(我进行了坏块扫描)。 现在我想在丢失的驱动器的位置插入一个新驱动器,并从剩余的 3 个驱动器中获取数据。 但是,3 个驱动器中有一个有读取错误。 具体来说,这个读取错误发生在坏块扫描为 98% 或 99% 时,所以我认为不是有很多坏块? 因此,即使这些块无法读取,如果我们不能恢复坏块上的数据,我认为不可读的块只代表将要丢失的数据的一小部分。 我该怎么做呢?我读到过即使一次读取失败,RAID 重建也会终止? 请记住,我看到文件夹和文件结构完好无损,和以前一样,...

Admin

当 USB HDD 出现故障时,dmesg 中消息的正常顺序是什么?
drive-failure

当 USB HDD 出现故障时,dmesg 中消息的正常顺序是什么?

我有一个连接到 Debian GNU/Linux 服务器上的 USB 硬盘。我尝试使用以下命令将其格式化 (NTFS): # mkntfs -v /dev/sdd1 这需要几个小时,因为它还要检查磁盘。检查时,dmesg -T显示以下内容: [Wed Jan 12 15:22:53 2022] sd 9:0:0:0: [sdd] Attached SCSI disk [Wed Jan 12 18:03:26 2022] usb 1-4: USB disconnect, device number 5 [Wed Jan 12 18:03:26 2022] b...

Admin

驱动器出现故障还是仍可使用?
drive-failure

驱动器出现故障还是仍可使用?

我有以下 WD 驱动器(3TB),它给我带来了问题(我无法访问任何文件:甚至ls对其执行命令也会导致无休止的等待)。 以下是有关磁盘的一些详细信息: Disk /dev/sda: 2.7 TiB, 3000592982016 bytes, 5860533168 sectors Disk model: EZRX-00D8PB0 Units: sectors of 1 * 512 = 512 bytes Sector size (logical/physical): 512 bytes / 4096 bytes I/O size (minimum/optimal...

Admin

磁盘问题:irq_stat 0x20000000,主机总线错误
drive-failure

磁盘问题:irq_stat 0x20000000,主机总线错误

将大文件(50+GB)从 NVMe 磁盘复制到 SATA 7200rpm HDD 磁盘时,我在完全修补的 Ubuntu 20.04 上的日志中看到以下错误: Aug 08 00:45:59 host kernel: ata6.00: exception Emask 0x20 SAct 0x0 SErr 0x0 action 0x6 frozen Aug 08 00:45:59 host kernel: ata6.00: irq_stat 0x20000000, host bus error Aug 08 00:45:59 host kernel: ata6....

Admin

拼命尝试避免 RAID 0 故障,我可以用 dd 复制磁盘吗?
drive-failure

拼命尝试避免 RAID 0 故障,我可以用 dd 复制磁盘吗?

一位同事一直在使用 10TB RAID 0 阵列编辑电影。他突然意识到它已满 98%。阵列开始严重出问题,但如果您关闭可能索引此阵列的所有进程并仅与终端命令交互,它就会勉强配合。根据 98% 的满度导致驱动器速度变慢和出现问题的理论,我们将大约 300GB 的数据从阵列复制到单独的驱动器,然后从 RAID 阵列中删除这些文件。阵列对命令的响应不佳rm,并且系统日志表明其中一个驱动器可能出现故障。RAID 阵列仍有大约 95% 的容量。 是的,我知道“RAID 不是备份”,我也知道由于条带化,单个驱动器故障通常意味着 RAID 0 出现灾难,但故障驱动器仍在运...

Admin

如何理解此特定于供应商的 SMART 属性?
drive-failure

如何理解此特定于供应商的 SMART 属性?

这个问题有两种背景,一种是一般背景,一种是具体背景。 一般来说,如何找到特定于供应商的 SMART 属性的含义?我在网上搜索了好多地方,但只找到了部分信息。是否有难以找到的存储库记录了这些信息? 具体来说,对于下图所示的西部数据硬盘 ( WDC WD4003FZEX-00Z4SA0),我应该如何解释特定于供应商的 SMART 属性 ID 10(10 十六进制,16 十进制)? 据我所知,值越低表示问题越严重,但我找不到有关此特定 ID 的信息。 ...

Admin