我已经在戴尔服务器上使用 Debian 很多年了。长期以来,我一直在使用 PERC H730P RAID 控制器,该控制器受到 MegaCLI 等实用程序的良好支持。
最近我买了一台 R440 服务器,配备了新的 H750 Raid 控制器。我最初能够在从“BIOS”系统设置创建的逻辑卷上安装 Debian 11。但在使用服务器配置软件端几分钟/几小时后,磁盘突然消失了。
在启动时,Grub 仍在工作,但 Debian 启动顺序会停止,无法找到分区。
LifeCycleController 不会报告任何硬件问题。但“Support Live Image”(戴尔提供的 LiveCD)看不到任何存储控制器。
技术支持告诉我,这个新的 RAID 控制器与 Debian 不兼容(也不兼容 SLI liveCD 上的 CentOS 7),我必须要求用旧一点但兼容的 H730P 来替换。
我写这篇文章是因为我在网上找不到任何关于 Debian 与最近的 Dell Raid 控制器兼容性的信息。
希望这可以帮助。
更新 2022-01-31
我成功地重新安装了全新的 Debian 11.2,没有任何问题。然后我安装了反向移植的 5.15.5 内核(覆盖默认的 5.10.0)。一切似乎都很好。
但是,当我安装 MegaCLI 时,安装过程会冻结整个服务器。经过多次 Ctrl-C 和几分钟后,我恢复了 shell。“megaclisas-status”挂在“-- 控制器信息 --”上。经过一轮 Ctrl-C,我恢复了 shell。
如果我尝试清除“megaclisas-status”和“megacli”包,一切都会再次冻结。
我刚刚在他们的追踪器上打开了一个问题:https://github.com/eLvErDe/hwraid/issues/130
更新 2022-02-01:
我的问题被拒绝了,说这是内核问题。
我已使用 5.15 内核重新安装了所有操作系统,并进行了一系列压力测试和基准测试。一切似乎都正常。
然后我安装了“megacli”工具并使用了一些命令;没有问题。
然后我安装了“megaclisas-status”包,安装包时服务器冻结。硬重启后,我可以再次使用系统,但“megaclisas-status”包未安装。
更新 2022-09-15:
这一天,还是没有运气!
以下是包含大量有关挂起信息的 dmesg 输出:https://paste.evolix.org/?6667c4e24e7e8ab4#38LSGMsxTncyQYPzWErWpMRigTPLcLuP9cU8qt9HafMW
我们再次尝试使用最新的反向移植内核。仍然挂起。
一些细节:
# uname -a
Linux my-hostname 5.18.0-0.deb11.4-amd64 #1 SMP PREEMPT_DYNAMIC Debian 5.18.16-1~bpo11+1 (2022-08-12) x86_64 GNU/Linux
# cat /etc/debian_version
11.5
# dpkg -l | grep mega
ii megacli 8.07.14-3+Debian.11.bullseye amd64 LSI Logic MegaRAID SAS MegaCLI
ii megaclisas-status 0.18+Debian.11.bullseye all get RAID status out of LSI MegaRAID SAS HW RAID controllers
# dpkg -l | grep linux
ii console-setup-linux 1.205 all Linux specific part of console-setup
ii firmware-linux-free 20200122-1 all Binary firmware for various drivers in the Linux kernel
ii libselinux1:amd64 3.1-3 amd64 SELinux runtime shared libraries
ii linux-base 4.6 all Linux image base package
ii linux-image-5.10.0-13-amd64 5.10.106-1 amd64 Linux 5.10 for 64-bit PCs (signed)
ii linux-image-5.10.0-17-amd64 5.10.136-1 amd64 Linux 5.10 for 64-bit PCs (signed)
ii linux-image-5.18.0-0.deb11.4-amd64 5.18.16-1~bpo11+1 amd64 Linux 5.18 for 64-bit PCs (signed)
ii linux-image-amd64 5.18.16-1~bpo11+1 amd64 Linux for 64-bit PCs (meta-package)
ii util-linux 2.36.1-8+deb11u1 amd64 miscellaneous system utilities
ii util-linux-locales 2.36.1-8+deb11u1 all locales files for util-linux
# dmidecode --type 1
# dmidecode 3.3
Getting SMBIOS data from sysfs.
SMBIOS 3.2 present.
Handle 0x0100, DMI type 1, 27 bytes
System Information
Manufacturer: Dell Inc.
Product Name: PowerEdge R350
Version: Not Specified
Serial Number: 339W7R3
UUID: 4c4c4544-0033-3910-8057-b3c04f375233
Wake-up Type: Power Switch
SKU Number: SKU=NotProvided;ModelName=PowerEdge R350
Family: PowerEdge
# lspci
00:00.0 Host bridge: Intel Corporation Device 4c53 (rev 01)
00:01.0 PCI bridge: Intel Corporation Device 4c01 (rev 01)
00:06.0 PCI bridge: Intel Corporation Device 4c09 (rev 01)
00:14.0 USB controller: Intel Corporation Device 43ed (rev 11)
00:14.2 RAM memory: Intel Corporation Device 43ef (rev 11)
00:16.0 Communication controller: Intel Corporation Device 43e0 (rev 11)
00:16.4 Communication controller: Intel Corporation Device 43e4 (rev 11)
00:17.0 SATA controller: Intel Corporation Device 43d2 (rev 11)
00:1b.0 PCI bridge: Intel Corporation Device 43c0 (rev 11)
00:1b.6 PCI bridge: Intel Corporation Device 43c6 (rev 11)
00:1c.0 PCI bridge: Intel Corporation Device 43b8 (rev 11)
00:1c.1 PCI bridge: Intel Corporation Device 43b9 (rev 11)
00:1f.0 ISA bridge: Intel Corporation Device 438d (rev 11)
00:1f.4 SMBus: Intel Corporation Device 43a3 (rev 11)
00:1f.5 Serial bus controller [0c80]: Intel Corporation Device 43a4 (rev 11)
01:00.0 Ethernet controller: Intel Corporation Ethernet Controller X710 for 10GbE SFP+ (rev 02)
01:00.1 Ethernet controller: Intel Corporation Ethernet Controller X710 for 10GbE SFP+ (rev 02)
02:00.0 RAID bus controller: Broadcom / LSI MegaRAID 12GSAS/PCIe Secure SAS39xx
05:00.0 PCI bridge: PLDA PCI Express Bridge (rev 02)
06:00.0 VGA compatible controller: Matrox Electronics Systems Ltd. Integrated Matrox G200eW3 Graphics Controller (rev 04)
07:00.0 Ethernet controller: Broadcom Inc. and subsidiaries NetXtreme BCM5720 2-port Gigabit Ethernet PCIe
07:00.1 Ethernet controller: Broadcom Inc. and subsidiaries NetXtreme BCM5720 2-port Gigabit Ethernet PCIe
### INFOS IDRAC
PERC H755 Adapter (Intégré)
- Version micrologiciel 52.16.1-4405
Version IDrac -> 5.10.50.00
Version Bios -> 1.3.3
答案1
2024 年 2 月 20 日更新:
Dell Perc H755(安装在 R750 上)现在也使用 Debian Bullseye(Proxmox VE 7.x)进行了测试,并且perccli64
在显示/设置卡和 VD 的参数方面仍然运行良好。
2022 年 10 月 5 日更新:
perccli64
在以下链接中发现了较新版本的 dell :
https://www.dell.com/support/home/zh-cn/drivers/driversdetails?driverid=36g6n
您可以从中轻松.deb
直接从 tar.gz 文件中找到它,这意味着您不需要alien
从 rpm 包中找到它,并且 deb 可以直接安装到 debian 11 和 Proxmox(已经过测试)中。
我搜索了 Dell PERC H750,发现 Dell 提供了 PercCli 作为 Linux 的 RPM 包,这意味着我们可以使用该alien
命令将包格式从 RPM 切换到 DEB。安装 PercCli 后,它在 Debian 11 上运行良好,使用与 Broadcom StorCli 相同的语法(与传统的 MegaCli 的语法不同)。
https://www.dell.com/support/home/en-us/drivers/driversdetails?driverid=nf8g9
这已在我的新 Dell R640 实例上进行了测试并且证明运行良好。
哦,顺便说一句,在安装dpkg -c xxx.deb
之前(或之后)使用检查文件来了解 deb 包里面有什么dpkg -i xxx.deb
,否则您可能不容易找出二进制文件在哪里。
实际上它应该在那里供/opt/MegaRAID/perccli/perccli64
您参考。
答案2
事实证明,被阻止的违规命令就是该命令以及 megacli 将被阻止的megacli -AdpAllInfo -a0 -NoLog
地方。perccli64
希望可以打补丁megaclisas-status
来避免这样的命令
diff --git a/megaclisas-status b/megaclisas-status
index 870e3a5..a9bc55b 100755
--- a/megaclisas-status
+++ b/megaclisas-status
@@ -27,7 +27,7 @@ nagiosbaddisk = 0
# Sane defaults
printarray = True
-printcontroller = True
+printcontroller = False
debugmode = False
notempmode = False
totaldrivenumber = 0
我们丢失了有关控制器和 BBU 的信息,但megaclisas-status
守护进程可用于监视阵列的状态,而无需进行大量重构(无论如何,我们perccli64
不谈论段错误 - R540 + H750)perccli64 /c0 show all