Dell PERC H750 与 Debian 的兼容性

Dell PERC H750 与 Debian 的兼容性

我已经在戴尔服务器上使用 Debian 很多年了。长期以来,我一直在使用 PERC H730P RAID 控制器,该控制器受到 MegaCLI 等实用程序的良好支持。

最近我买了一台 R440 服务器,配备了新的 H750 Raid 控制器。我最初能够在从“BIOS”系统设置创建的逻辑卷上安装 Debian 11。但在使用服务器配置软件端几分钟/几小时后,磁盘突然消失了。

在启动时,Grub 仍在工作,但 Debian 启动顺序会停止,无法找到分区。

LifeCycleController 不会报告任何硬件问题。但“Support Live Image”(戴尔提供的 LiveCD)看不到任何存储控制器。

技术支持告诉我,这个新的 RAID 控制器与 Debian 不兼容(也不兼容 SLI liveCD 上的 CentOS 7),我必须要求用旧一点但兼容的 H730P 来替换。

我写这篇文章是因为我在网上找不到任何关于 Debian 与最近的 Dell Raid 控制器兼容性的信息。

希望这可以帮助。

更新 2022-01-31

我成功地重新安装了全新的 Debian 11.2,没有任何问题。然后我安装了反向移植的 5.15.5 内核(覆盖默认的 5.10.0)。一切似乎都很好。

但是,当我安装 MegaCLI 时,安装过程会冻结整个服务器。经过多次 Ctrl-C 和几分钟后,我恢复了 shell。“megaclisas-status”挂在“-- 控制器信息 --”上。经过一轮 Ctrl-C,我恢复了 shell。

如果我尝试清除“megaclisas-status”和“megacli”包,一切都会再次冻结。

我刚刚在他们的追踪器上打开了一个问题:https://github.com/eLvErDe/hwraid/issues/130

更新 2022-02-01

我的问题被拒绝了,说这是内核问题。

我已使用 5.15 内核重新安装了所有操作系统,并进行了一系列压力测试和基准测试。一切似乎都正常。

然后我安装了“megacli”工具并使用了一些命令;没有问题。

然后我安装了“megaclisas-status”包,安装包时服务器冻结。硬重启后,我可以再次使用系统,但“megaclisas-status”包未安装。

更新 2022-09-15

这一天,还是没有运气!

以下是包含大量有关挂起信息的 dmesg 输出:https://paste.evolix.org/?6667c4e24e7e8ab4#38LSGMsxTncyQYPzWErWpMRigTPLcLuP9cU8qt9HafMW

我们再次尝试使用最新的反向移植内核。仍然挂起。

一些细节:

# uname -a
Linux my-hostname 5.18.0-0.deb11.4-amd64 #1 SMP PREEMPT_DYNAMIC Debian 5.18.16-1~bpo11+1 (2022-08-12) x86_64 GNU/Linux

# cat /etc/debian_version 
11.5

# dpkg -l | grep mega
ii  megacli                            8.07.14-3+Debian.11.bullseye   amd64        LSI Logic MegaRAID SAS MegaCLI
ii  megaclisas-status                  0.18+Debian.11.bullseye        all          get RAID status out of LSI MegaRAID SAS HW RAID controllers

# dpkg -l | grep linux
ii  console-setup-linux                1.205                          all          Linux specific part of console-setup
ii  firmware-linux-free                20200122-1                     all          Binary firmware for various drivers in the Linux kernel
ii  libselinux1:amd64                  3.1-3                          amd64        SELinux runtime shared libraries
ii  linux-base                         4.6                            all          Linux image base package
ii  linux-image-5.10.0-13-amd64        5.10.106-1                     amd64        Linux 5.10 for 64-bit PCs (signed)
ii  linux-image-5.10.0-17-amd64        5.10.136-1                     amd64        Linux 5.10 for 64-bit PCs (signed)
ii  linux-image-5.18.0-0.deb11.4-amd64 5.18.16-1~bpo11+1              amd64        Linux 5.18 for 64-bit PCs (signed)
ii  linux-image-amd64                  5.18.16-1~bpo11+1              amd64        Linux for 64-bit PCs (meta-package)
ii  util-linux                         2.36.1-8+deb11u1               amd64        miscellaneous system utilities
ii  util-linux-locales                 2.36.1-8+deb11u1               all          locales files for util-linux


# dmidecode --type 1
# dmidecode 3.3
Getting SMBIOS data from sysfs.
SMBIOS 3.2 present.

Handle 0x0100, DMI type 1, 27 bytes
System Information
    Manufacturer: Dell Inc.
    Product Name: PowerEdge R350
    Version: Not Specified
    Serial Number: 339W7R3
    UUID: 4c4c4544-0033-3910-8057-b3c04f375233
    Wake-up Type: Power Switch
    SKU Number: SKU=NotProvided;ModelName=PowerEdge R350
    Family: PowerEdge

# lspci
00:00.0 Host bridge: Intel Corporation Device 4c53 (rev 01)
00:01.0 PCI bridge: Intel Corporation Device 4c01 (rev 01)
00:06.0 PCI bridge: Intel Corporation Device 4c09 (rev 01)
00:14.0 USB controller: Intel Corporation Device 43ed (rev 11)
00:14.2 RAM memory: Intel Corporation Device 43ef (rev 11)
00:16.0 Communication controller: Intel Corporation Device 43e0 (rev 11)
00:16.4 Communication controller: Intel Corporation Device 43e4 (rev 11)
00:17.0 SATA controller: Intel Corporation Device 43d2 (rev 11)
00:1b.0 PCI bridge: Intel Corporation Device 43c0 (rev 11)
00:1b.6 PCI bridge: Intel Corporation Device 43c6 (rev 11)
00:1c.0 PCI bridge: Intel Corporation Device 43b8 (rev 11)
00:1c.1 PCI bridge: Intel Corporation Device 43b9 (rev 11)
00:1f.0 ISA bridge: Intel Corporation Device 438d (rev 11)
00:1f.4 SMBus: Intel Corporation Device 43a3 (rev 11)
00:1f.5 Serial bus controller [0c80]: Intel Corporation Device 43a4 (rev 11)
01:00.0 Ethernet controller: Intel Corporation Ethernet Controller X710 for 10GbE SFP+ (rev 02)
01:00.1 Ethernet controller: Intel Corporation Ethernet Controller X710 for 10GbE SFP+ (rev 02)
02:00.0 RAID bus controller: Broadcom / LSI MegaRAID 12GSAS/PCIe Secure SAS39xx
05:00.0 PCI bridge: PLDA PCI Express Bridge (rev 02)
06:00.0 VGA compatible controller: Matrox Electronics Systems Ltd. Integrated Matrox G200eW3 Graphics Controller (rev 04)
07:00.0 Ethernet controller: Broadcom Inc. and subsidiaries NetXtreme BCM5720 2-port Gigabit Ethernet PCIe
07:00.1 Ethernet controller: Broadcom Inc. and subsidiaries NetXtreme BCM5720 2-port Gigabit Ethernet PCIe


### INFOS IDRAC

PERC H755 Adapter (Intégré) 
- Version micrologiciel  52.16.1-4405 

Version IDrac -> 5.10.50.00 
Version Bios  -> 1.3.3 

答案1

2024 年 2 月 20 日更新:

Dell Perc H755(安装在 R750 上)现在也使用 Debian Bullseye(Proxmox VE 7.x)进行了测试,并且perccli64在显示/设置卡和 VD 的参数方面仍然运行良好。


2022 年 10 月 5 日更新:

perccli64在以下链接中发现了较新版本的 dell :

https://www.dell.com/support/home/zh-cn/drivers/driversdetails?driverid=36g6n

您可以从中轻松.deb直接从 tar.gz 文件中找到它,这意味着您不需要alien从 rpm 包中找到它,并且 deb 可以直接安装到 debian 11 和 Proxmox(已经过测试)中。


我搜索了 Dell PERC H750,发现 Dell 提供了 PercCli 作为 Linux 的 RPM 包,这意味着我们可以使用该alien命令将包格式从 RPM 切换到 DEB。安装 PercCli 后,它在 Debian 11 上运行良好,使用与 Broadcom StorCli 相同的语法(与传统的 MegaCli 的语法不同)。

https://www.dell.com/support/home/en-us/drivers/driversdetails?driverid=nf8g9

这已在我的新 Dell R640 实例上进行了测试并且证明运行良好。

哦,顺便说一句,在安装dpkg -c xxx.deb之前(或之后)使用检查文件来了解 deb 包里面有什么dpkg -i xxx.deb,否则您可能不容易找出二进制文件在哪里。

实际上它应该在那里供/opt/MegaRAID/perccli/perccli64您参考。

答案2

事实证明,被阻止的违规命令就是该命令以及 megacli 将被阻止的megacli -AdpAllInfo -a0 -NoLog地方。perccli64

希望可以打补丁megaclisas-status来避免这样的命令

diff --git a/megaclisas-status b/megaclisas-status
index 870e3a5..a9bc55b 100755
--- a/megaclisas-status
+++ b/megaclisas-status
@@ -27,7 +27,7 @@ nagiosbaddisk = 0
 
 # Sane defaults
 printarray = True
-printcontroller = True
+printcontroller = False
 debugmode = False
 notempmode = False
 totaldrivenumber = 0

我们丢失了有关控制器和 BBU 的信息,但megaclisas-status守护进程可用于监视阵列的状态,而无需进行大量重构(无论如何,我们perccli64不谈论段错误 - R540 + H750)perccli64 /c0 show all

相关内容