诊断 Windows / HDD / RAID0 故障

诊断 Windows / HDD / RAID0 故障

我的机器如下:

  • RAID0 中的一对硬盘,ATA Hitachi HDT72505
  • nVidia 主板,“M51”?

Windows XP 拒绝启动:

  • 启动通常会导致 Windows 加载屏幕期间挂起
  • 安全模式启动后,可以进入登录界面,登录后就卡死。

使用 Windows XP 安装 CD:

  • 未检测到任何硬盘
  • 如果插入了外部硬盘,则 CD 将在使用恢复控制台时安装该硬盘

幸运的是,我有一张 Kubuntu 9.10 的 DVD。

fdisk -l显示此输出:

磁盘 /dev/sda:500.1 GB,500107862016 字节
255 个磁头、63 个扇区/磁道、60801 个磁柱
单位 = 16065 * 512 = 8225280 字节的柱面
磁盘标识符:0xc0cfc0cf

   设备启动开始结束块ID系统
/dev/sda1 * 1 60801 488384001 7 HPFS/NTFS

磁盘 /dev/sdb:500.1 GB,500107862016 字节
255 个磁头、63 个扇区/磁道、60801 个磁柱
单位 = 16065 * 512 = 8225280 字节的柱面
磁盘标识符:0xfff7fff7

   设备启动开始结束块ID系统
注意:扇区大小为 4096(不是 512)

请注意,/dev/sdb 下没有显示任何设备。Kubuntu 没有自动挂载硬盘。

尝试做:mount -t ntfs-3g /dev/sda1 /mnt/windows结果导致抱怨ntfs-3g: Failed to access volume '/dev/sda1': No such file or directory

Kubuntu 安装程序也无法确定 NTFS 分区使用了多少硬盘空间。

我目前正在运行:smartctl --test=long /dev/sda但不确定输出意味着什么

更新:

这是输出dmraid -ay -vvvv -dddd

警告:锁定 /var/lock/dmraid/.lock
错误:/dev/sdc 上不支持扇区大小 4096。
注意:跳过可移动设备 /dev/sdd      
注意:跳过可移动设备 /dev/sde      
注意:跳过可移动设备 /dev/sdf      
注意:跳过可移动设备 /dev/sdg      
注意:/dev/sdh:asr 发现           
注意:/dev/sdh:ddf1 正在发现           
注意:/dev/sdh:hpt37x 发现           
注意:/dev/sdh:hpt45x 发现           
注意:/dev/sdh:isw 发现           
调试:不在 -522494976                    
调试:isw 尝试硬编码 -2115 偏移。
调试:不在 -523576832 处
注意:/dev/sdh: jmicron 发现
注意:/dev/sdh:lsi 发现
注意:/dev/sdh:nvidia 发现
注意:/dev/sdh:pdc 发现
注意:/dev/sdh:sil 发现
注意:/dev/sdh:通过发现
注意:/dev/sdb:asr 发现
注意:/dev/sdb:ddf1 发现
注意:/dev/sdb:hpt37x 发现
注意:/dev/sdb:hpt45x 发现
注意:/dev/sdb:isw 发现
调试:1891654656 处没有 isw
调试:isw 尝试硬编码 -2115 偏移。
调试:1890572800 处没有 isw
注意:/dev/sdb:jmicron 发现
注意:/dev/sdb:lsi 发现
注意:/dev/sdb:nvidia 发现
注意:/dev/sdb:发现 nvidia 元数据
注意:/dev/sdb:pdc 发现
注意:/dev/sdb:sil 发现
注意:/dev/sdb:通过发现
注意:/dev/sda:asr 发现
注意:/dev/sda:ddf1 发现
注意:/dev/sda:hpt37x 发现
注意:/dev/sda:hpt45x 发现
注意:/dev/sda:isw 发现
调试:1891654656 处没有 isw
调试:isw 尝试硬编码 -2115 偏移。
调试:1890572800 处没有 isw
注意:/dev/sda: jmicron 发现
注意:/dev/sda:lsi 发现
注意:/dev/sda:nvidia 发现
注意:/dev/sda:发现 nvidia 元数据
注意:/dev/sda:pdc 发现
注意:/dev/sda:sil 发现
注意:/dev/sda:通过发现
调试:_find_set:搜索 nvidia_ijdbffag
调试:_find_set:未找到 nvidia_ijdbffag
调试:_find_set:搜索 nvidia_ijdbffag
调试:_find_set:未找到 nvidia_ijdbffag
注意:将 /dev/sdb 添加到 RAID 集“nvidia_ijdbffag”
调试:_find_set:搜索 nvidia_dacifgcg
调试:_find_set:搜索 nvidia_dacifgcg
调试:_find_set:未找到 nvidia_dacifgcg
调试:_find_set:未找到 nvidia_dacifgcg
调试:_find_set:搜索 nvidia_dacifgcg
调试:_find_set:未找到 nvidia_dacifgcg
注意:将 /dev/sda 添加到 RAID 集“nvidia_dacifgcg”
调试:检查 nvidia 设备“/dev/sdb”
调试:将“nvidia_ijdbffag”的状态设置为 16
调试:检查 nvidia 设备“/dev/sda”
调试:将“nvidia_dacifgcg”的状态设置为 16
RAID 集“nvidia_ijdbffag”已激活
信息:激活线性 raid 集“nvidia_ijdbffag”
RAID 设置“nvidia_dacifgcg”已处于活动状态
信息:激活线性 raid 设置“nvidia_dacifgcg”
注意:在“nvidia_ijdbffag”上发现分区
注意:/dev/mapper/nvidia_ijdbffag:dos 发现
注意:/dev/mapper/nvidia_ijdbffag:发现 dos 元数据
注意:为 /dev/mapper/nvidia_ijdbffag 创建了分区 RAID 集
注意:发现“nvidia_dacifgcg”上的分区
注意:/dev/mapper/nvidia_dacifgcg:dos 发现
注意:/dev/mapper/nvidia_dacifgcg:发现 dos 元数据
调试:_find_set:搜索 nvidia_dacifgcg1
调试:_find_set:未找到 nvidia_dacifgcg1
注意:为 /dev/mapper/nvidia_dacifgcg 创建了分区 RAID 集
RAID 集“nvidia_dacifgcg1”已激活
信息:激活分区 raid 设置“nvidia_dacifgcg1”
警告:解锁 /var/lock/dmraid/.lock
调试:释放 RAID 集“nvidia_ijdbffag”的设备
调试:释放设备“nvidia_ijdbffag”,路径“/dev/sdb”
调试:释放 RAID 集“nvidia_dacifgcg”的设备
调试:释放设备“nvidia_dacifgcg”,路径“/dev/sda”
调试:释放 RAID 集“nvidia_dacifgcg1”的设备
调试:释放设备“nvidia_dacifgcg1”,路径“/dev/mapper/nvidia_dacifgcg”

这是输出dmraid -r

/dev/sdb:nvidia,“nvidia_ijdbffag”,线性,ok,976773166 个扇区,数据@ 0
/dev/sda: nvidia, “nvidia_dacifgcg”, 线性, ok, 976773166 个扇区, 数据@ 0

这是输出smartctl -a /dev/sda

smartctl 版本 5.38 [i686-pc-linux-gnu] 版权所有 (C) 2002-8 Bruce Allen
主页是 http://smartmontools.sourceforge.net/                        

Smartctl 打开设备:/dev/sda1 失败:没有此文件或目录
root@ubuntu:~# smartctl --all /dev/sda
smartctl 版本 5.38 [i686-pc-linux-gnu] 版权所有 (C) 2002-8 Bruce Allen
主页是 http://smartmontools.sourceforge.net/                        

=== 信息部分开始 ===
型号系列:日立 Deskstar T7K500
设备型号:Hitachi HDT725050VLA360
序列号:VFK401R424LAJK         
固件版本:V56OA7EA               
用户容量:500,107,862,016字节  
设备位于:在 smartctl 数据库中 [有关详细信息,请使用:-P show]
ATA 版本为:7                                              
ATA 标准为:ATA/ATAPI-7 T13 1532D 修订版 1               
当地时间是: 2010 年 11 月 2 日星期二 02:39:57 UTC                   
SMART 支持:可用 - 设备具有 SMART 功能。
SMART 支持:已启用

=== 开始读取智能数据部分 ===
SMART整体健康自我评估测试结果:失败!
预计驱动器将在 24 小时内发生故障。保存所有数据。
请参阅供应商特定的属性列表以了解失败的属性。

一般 SMART 值:
离线数据收集状态:(0x00)离线数据收集活动
                                        从未开始。
                                        自动离线数据收集:已禁用。
自检执行状态:(117)上次自检已完成
                                        测试的读取元素失败。
完成离线的总时间
数据收集:(8389)秒。
离线数据收集
功能:(0x5b)SMART 立即执行离线。
                                        支持自动离线数据收集开启/关闭。
                                        暂停离线收集新
                                        命令。
                                        支持离线表面扫描。
                                        支持自我测试。
                                        不支持传输自检。
                                        支持选择性自我测试。
SMART 功能:(0x0003)输入前保存 SMART 数据
                                        省电模式。
                                        支持 SMART 自动保存定时器。
错误日志记录功能:(0x01)支持错误日志记录。
                                        支持通用日志记录。
简短的自检程序
建议投票时间:(1)分钟。
扩展自检程序
建议投票时间:(140)分钟。
SCT 功能:(0x003f)支持 SCT 状态。
                                        支持 SCT 功能控制。
                                        支持SCT数据表。

SMART 属性数据结构修订号:16
供应商特定的 SMART 属性及阈值:
ID# ATTRIBUTE_NAME 标志值 最差阈值类型 已更新 WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x000b 097 097 016 始终预失败 - 196612
  2 Throughput_Performance 0x0005 100 100 050 故障前离线 - 0
  3 Spin_Up_Time 0x0007 137 137 024 始终预故障 - 287(平均 441)
  4 启动停止计数 0x0012 100 100 000 Old_age 始终 - 1086
  5 Reallocated_Sector_Ct 0x0033 001 001 005 预失败 始终 FAILING_NOW 1885
  7 Seek_Error_Rate 0x000b 099 099 067 预失败始终 - 1
  8 Seek_Time_Performance 0x0005 100 100 020 故障前离线 - 0
  9 通电时间 0x0012 099 099 000 Old_age 始终 - 12937
 10 Spin_Retry_Count 0x0013 100 100 060 始终预失败 - 0
 12 Power_Cycle_Count 0x0032 100 100 000 Old_age 始终 - 1075
192 Power-Off_Retract_Count 0x0032 099 099 000 Old_age 始终 - 1797
193 Load_Cycle_Count 0x0012 099 099 000 Old_age 始终 - 1797
194 Temperature_Celsius 0x0002 187 187 000 Old_age 始终 - 32(生命周期最小值/最大值 18/43)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age 始终 - 2120
197 Current_Pending_Sector 0x0022 100 100 000 Old_age 始终 - 2
198 Offline_Uncorrectable 0x0008 100 100 000 Old_age 离线 - 0
199 UDMA_CRC_Error_Count 0x000a 200 253 000 Old_age 始终 - 0

SMART 错误日志版本:1
未记录任何错误

SMART 自检日志结构修订号 1
编号 测试描述 状态 剩余寿命(小时) LBA_of_first_error
#1 扩展离线完成:读取失败 50% 12937 621063894

SMART 选择性自检日志数据结构修订号 1
 跨度 最小 LBA 最大 LBA 当前测试状态
    1 0 0 未测试
    2 0 0 未测试
    3 0 0 未测试
    4 0 0 未测试
    5 0 0 未测试
选择性自检标志(0x0):
  扫描选定的范围后,请勿读取扫描磁盘的剩余部分。
如果开机时选择性自检正在等待,则在 0 分钟延迟后恢复。

这是 smartctl -a /dev/sdb 的输出

smartctl 版本 5.38 [i686-pc-linux-gnu] 版权所有 (C) 2002-8 Bruce Allen
主页是 http://smartmontools.sourceforge.net/                        

=== 信息部分开始 ===
设备型号:Hitachi HDP725050GLA360
序列号:GEB531RE00M21B         
固件版本:GM4OA50E               
用户容量:500,107,862,016字节  
设备:不在 smartctl 数据库中 [有关详细信息,请使用:-P showall]
ATA 版本为:8                                                     
ATA 标准为:ATA-8-ACS 修订版 4                                  
当地时间是: 2010 年 11 月 2 日星期二 02:41:11 UTC
SMART 支持:可用 - 设备具有 SMART 功能。
SMART 支持:已启用

=== 开始读取智能数据部分 ===
SMART 整体健康自我评估测试结果:通过

一般 SMART 值:
离线数据收集状态:(0x80)离线数据收集活动
                                        从未开始。
                                        自动离线数据收集:已启用。
自检执行状态:(0)上一次自检程序已完成
                                        没有错误或没有自检过
                                        已运行。
完成离线的总时间
数据收集:(7854)秒。
离线数据收集
功能:(0x5b)SMART 立即执行离线。
                                        支持自动离线数据收集开启/关闭。
                                        暂停离线收集新
                                        命令。
                                        支持离线表面扫描。
                                        支持自我测试。
                                        不支持传输自检。
                                        支持选择性自我测试。
SMART 功能:(0x0003)输入前保存 SMART 数据
                                        省电模式。
                                        支持 SMART 自动保存定时器。
错误日志记录功能:(0x01)支持错误日志记录。
                                        支持通用日志记录。
简短的自检程序
建议投票时间:(1)分钟。
扩展自检程序
建议投票时间:(131)分钟。
SCT 功能:(0x003d)支持 SCT 状态。
                                        支持 SCT 功能控制。
                                        支持SCT数据表。

SMART 属性数据结构修订号:16
供应商特定的 SMART 属性及阈值:
ID# ATTRIBUTE_NAME 标志值 最差阈值类型 已更新 WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x000b 100 100 016 预失败始终 - 0
  2 Throughput_Performance 0x0005 131 131 054 故障前离线 - 147
  3 Spin_Up_Time 0x0007 161 161 024 始终预故障 - 222(平均 256)
  4 启动停止计数 0x0012 100 100 000 Old_age 始终 - 1011
  5 Reallocated_Sector_Ct 0x0033 100 100 005 预故障始终 - 0
  7 Seek_Error_Rate 0x000b 100 100 067 预失败始终 - 0
  8 Seek_Time_Performance 0x0005 131 131 020 故障前离线 - 29
  9 通电时间 0x0012 099 099 000 老化时间 始终 - 12930
 10 Spin_Retry_Count 0x0013 100 100 060 始终预失败 - 0
 12 Power_Cycle_Count 0x0032 100 100 000 Old_age 始终 - 1008
192 Power-Off_Retract_Count 0x0032 099 099 000 Old_age 始终 - 1747
193 Load_Cycle_Count 0x0012 099 099 000 Old_age 始终 - 1747
194 Temperature_Celsius 0x0002 214 214 000 Old_age 始终 - 28(生命周期最小值/最大值 17/39)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age 始终 - 0
197 Current_Pending_Sector 0x0022 100 100 000 Old_age 始终 - 0
198 Offline_Uncorrectable 0x0008 100 100 000 Old_age 离线 - 0
199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age 始终 - 0

SMART 错误日志版本:1
未记录任何错误

SMART 自检日志结构修订号 1
未记录任何自检。[要运行自检,请使用:smartctl -t]


SMART 选择性自检日志数据结构修订号 1
 跨度 最小 LBA 最大 LBA 当前测试状态
    1 0 0 未测试
    2 0 0 未测试
    3 0 0 未测试
    4 0 0 未测试
    5 0 0 未测试
选择性自检标志(0x0):
  扫描选定的范围后,请勿读取扫描磁盘的剩余部分。
如果开机时选择性自检正在等待,则在 0 分钟延迟后恢复。

答案1

几乎可以登录 WindowsXP,这听起来不像是 raid0 中的驱动器发生故障。当我看到发生故障的 raid0 阵列时,没有启动(硬件)。

对于 Kubuntu 的 liveCD,raid0 的正确驱动程序(模块)没有加载,Kubuntu 尝试将 sda 和 sdb 读取为单独的驱动器。Sda 正在“工作”,因为它有 MBR,而 sdb 则失败,因为它没有。您无法挂载 /dev/sda1,因为 NTFS 卷的一半数据都在 sdb 上,而 sdb 未被读取。

Raid0 是如何完成的?(软件还是硬件)

答案2

在阵列上运行 chkdsk,将 sata 驱动程序插入 XP 安装 CD,然后启动恢复并从命令提示符运行 chkdsk /r。

我使用它将“大容量存储控制器”集成到 XP CD 中,这样就不需要他们提供的其他驱动程序包了。

http://driverpacks.net/about

如何使用 DPsBASE 工具 http://users.telenet.be/jtdoom/basetute/Eng_tut6b.htm

答案3

显然其中一个驱动器出现故障。您无法只安装其中一个驱动器,因为它仅包含部分数据;您必须安装整个阵列,即 /dev/mapper/nvidia_ijdbffag1。

答案4

您的驱动器 /dev/sda 出现故障。已有 1885 个重新分配的扇区,这显然是驱动器即将报废的迹象。请检查 /dev/sdb 的运行状况。

使用 ddrescue 复制您的驱动器以避免进一步恶化。请注意,复制驱动器很可能会进一步恶化驱动器的状态。可能还需要复制 /dev/sdb。对于 RAID0 阵列的条带布局,您需要两个工作驱动器才能进行数据恢复。


SMART 属性数据结构修订号:16 供应商特定的具有阈值的 SMART 属性:ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000b 097 097 016 预失败始终 - 196612

5 Reallocated_Sector_Ct 0x0033 001 001 005 预失败 始终 FAILING_NOW1885

196 Reallocated_Event_Count 0x0032 100 100 000 Old_age 始终 - 2120

197 Current_Pending_Sector 0x0022 100 100 000 Old_age 始终 - 2

相关内容