如何将 ata4.00 与适当的 /dev/sdX 或实际物理磁盘匹配?

如何将 ata4.00 与适当的 /dev/sdX 或实际物理磁盘匹配?

在日志中获取如下内容:

10月2日 22:11:21 jupiter 内核:[439646.093111] ata4.00:异常 Emask 0x0 SAct 0x0 SErr 0x0 操作 0x6
10月2日 22:11:21 jupiter 内核:[439646.093144] ata4.00:BMDMA 状态 0x6
10月2日 22:11:21 jupiter 内核:[439646.093176] ata4.00:命令失败:WRITE DMA EXT
10月2日 22:11:21 jupiter 内核:[439646.093206] ata4.00:cmd 35/00:98:00:0d:ff/00:02:42:00:00/e0 标签 0 dma 339968 输出
10月2日 22:11:21 jupiter 内核:[439646.093282] ata4.00:状态:{DRDY ERR}
10月2日 22:11:21 jupiter 内核:[439646.093306] ata4.00:错误:{ICRC ABRT}
10月2日 22:11:21 jupiter 内核:[439646.093353] ata4:软重置链接
10 月 2 日 22:11:21 jupiter 内核:[439646.265242] ata4.00:已配置为 UDMA/133
10月2日 22:11:21 jupiter 内核:[439646.265268] ata4:EH 完成

现在我想知道要更换哪个磁盘。但我找不到“ataX.YZ”和 /dev/disk/ 条目之间的任何明确映射。

答案1

  • 您应该从 dmesg 获取更多信息:

    dmesg | grep ata
    

    就像是:

    [    2.345126] ata2.00: ATA-8: WDC WD20EARX-00PASB0, 51.0AB51, max UDMA/133
    

    那就是我的西部数据硬盘。


  • 如果您拥有多个相同型号的驱动器,可以采用以下方法(当上述方法无效时):

    1. 查找从 SCSI 主机到 ata* ID 的映射:

      $ egrep "^[0-9]{1,}" /sys/class/scsi_host/host*/unique_id
      /sys/class/scsi_host/host0/unique_id:1
      /sys/class/scsi_host/host1/unique_id:2
      /sys/class/scsi_host/host2/unique_id:3
      /sys/class/scsi_host/host3/unique_id:4
      
    2. 查找从 SCSI 主机到 sd* ID 的映射:

      $ ls -l /sys/block/sd*
      ... /sys/block/sda -> ../devices/pci0000:00/0000:00:1f.2/host0/target0:0:0/0:0:0:0/block/sda
      ... /sys/block/sdb -> ../devices/pci0000:00/0000:00:1f.2/host1/target1:0:0/1:0:0:0/block/sdb
      

    现在您可以通过 host* 标识符链接这两个结果。因此,如果在这种情况下我遇到 ata2 问题,我会查找 unique_id 2 → host1,然后查找哪个 sd* 是 host1 → sdb。


  • 我也尝试想出一个单行代码。不知道这是否可靠。首先必须将 ata* 设置为变量:

    FAIL=ata1
    

    然后运行:

    echo "$FAIL -> $(ls -l /sys/block/ | grep $(grep "^$(echo $FAIL | cut -c 4-)" /sys/class/scsi_host/host*/unique_id | sed "s/.*\(host[0-9]\{1,\}\).*/\1/") | awk '{print $8}')"
    

    它应该返回类似这样的内容:

    ata1 -> sda
    

答案2

在我的某些服务器中,一个 scsi_host 上有两个或更多设备。我不知道这是否正确,但我假设它可以通过目标来区分,并且对我来说是可行的:

ls -l /sys/block/sd*
lrwxrwxrwx 1 root root 0 2012-02-08 08:15 /sys/block/sda -> ../devices/pci0000:00/0000:00:01.0/0000:01:00.0/host3/target3:0:0/3:0:0:0/block/sda
lrwxrwxrwx 1 root root 0 2012-02-08 08:15 /sys/block/sdb -> ../devices/pci0000:00/0000:00:1f.2/host6/target6:0:0/6:0:0:0/block/sdb
lrwxrwxrwx 1 root root 0 2012-02-08 08:15 /sys/block/sdc -> ../devices/pci0000:00/0000:00:1f.2/host7/target7:0:0/7:0:0:0/block/sdc
lrwxrwxrwx 1 root root 0 2012-02-08 08:15 /sys/block/sdd -> ../devices/pci0000:00/0000:00:1f.2/host8/target8:0:0/8:0:0:0/block/sdd
lrwxrwxrwx 1 root root 0 2012-02-08 08:15 /sys/block/sde -> ../devices/pci0000:00/0000:00:1f.2/host9/target9:0:0/9:0:0:0/block/sde
lrwxrwxrwx 1 root root 0 2012-02-08 08:15 /sys/block/sdf -> ../devices/pci0000:00/0000:00:1f.2/host10/target10:0:0/10:0:0:0/block/sdf
lrwxrwxrwx 1 root root 0 2012-02-08 08:15 /sys/block/sdg -> ../devices/pci0000:00/0000:00:1f.2/host11/target11:0:0/11:0:0:0/block/sdg
lrwxrwxrwx 1 root root 0 2012-02-08 08:15 /sys/block/sdh -> ../devices/pci0000:00/0000:00:1c.4/0000:04:00.0/host13/target13:0:0/13:0:0:0/block/sdh
lrwxrwxrwx 1 root root 0 2012-02-08 08:15 /sys/block/sdi -> ../devices/pci0000:00/0000:00:1c.4/0000:04:00.0/host13/target13:0:1/13:0:1:0/block/sdi

简单的 Bash 脚本:

#!/bin/bash

#inspired by http://askubuntu.com/questions/64351/how-to-match-ata4-00-to-the-apropriate-dev-sdx-or-actual-physical-disk

for d in /sys/block/sd*
do
  s=`basename $d`
  h=`ls -l $d | egrep -o "host[0-9]+"`
  t=`ls -l $d | egrep -o "target[0-9:]*"`
  a2=`echo $t | egrep -o "[0-9]:[0-9]$" | sed 's/://'`
  a=`cat /sys/class/scsi_host/$h/unique_id`
  echo "$s -> ata$a.$a2"
done

它的输出是:

sda -> ata4.00
sdb -> ata7.00
sdc -> ata8.00
sdd -> ata9.00
sde -> ata10.00
sdf -> ata11.00
sdg -> ata12.00
sdh -> ata14.00
sdi -> ata14.01

答案3

现在已经太晚了,但是为了其他读者的利益......我不得不回答你的另一个问题“现在我想知道要更换哪个磁盘。”

ICRC 错误标志几乎总是与损坏的 SATA 电缆有关,这很容易更换/测试。如果驱动器电源出现故障,则 ICRC 标志略有上升的可能。

但可以肯定的是,驱动器出现任何问题的证据!更换其 SATA 电缆。

相关内容