使用 UEFI 进行 PXE 启动时 HPE Proliant Gen10 堆栈故障异常

使用 UEFI 进行 PXE 启动时 HPE Proliant Gen10 堆栈故障异常

我正在尝试使用带有 RHEL 的 UEFI BIOS 来 pxe 启动 HPE Proliant Gen10(已经尝试了 7 和 8),并且在服务器收到第一个启动文件(shimx64.efi)后出现堆栈错误异常:

HPE ProLiant 系统 BIOS U32 v2.42(2021 年 1 月 23 日)(C)版权所有 1982-2021 Hewlett Packard Enterprise Development LP 早期系统初始化,请等待...

iLO 5 IPv4:
iLO 5 IPv6:

iLO 5 IPv4:(已删除)iLO 5 IPv6:(已删除)

2%:系统芯片组初始化 4%:UPI 链路初始化 - 启动 5%:UPI 链路初始化 - 完成 7%:早期处理器初始化 9%:内存初始化 - 启动 10%:11%:13%:14%:15%:21%:内存初始化 - 完成 25%:SMBIOS 表初始化 28%:USB 控制器初始化 31%:芯片组根端口初始化 35%:HPE SmartMemory 初始化 38%:系统安全初始化 42%:iLO 嵌入式健康初始化 45%:ACPI 表初始化 49%:BIOS 配置初始化 L 55%:早期 PCI 初始化 - 启动 62%:早期 PCI 初始化 - 完成 73%:将控制台输出切换到主视频。请等待...

[=3小时

[=3小时
[01;01

[=3小时

[=3小时

[=3小时

[=3小时

(C) 版权所有 1982-2021 Hewlett Packard Enterprise Development LP HPE ProLiant DL360 Gen10 系统 ROM 版本:U32 v2.42 (01/23/2021) 序列号:(已删除)

已安装系统内存:384 GB,可用系统内存:384 GB

检测到 2 个处理器,共启用 40 个核心,超线程已启用 Proc 1:英特尔 (R) 至强 (R) 金牌 6248 CPU @ 2.50GHz Proc 2:英特尔 (R) 至强 (R) 金牌 6248 CPU @ 2.50GHz UPI 速度:10.4 GT/s

工作负载配置文件:I/O 吞吐量电源调节器模式:动态节能高级内存保护模式:快速容错内存 (ADDDC) 启动模式:UEFI HPE SmartMemory 在所有填充的 DIMM 插槽中经过身份验证。

通过 BIOS 串行控制台进行访问:按“ESC+9”进入系统实用程序 按“ESC+0”进入智能配置 按“ESC+!”进入一次性启动菜单 按“ESC+@”进入网络启动

正在启动所需设备。请稍候,这可能需要一些时间....

引导嵌入式 FlexibleLOM 1 端口 1:HPE Eth 10/25Gb 2p 640FLR-SFP28 Adptr - NIC (PXE IPv4)

通过 IPv4 启动 PXE。站点 IP 地址为(已删除)

服务器 IP 地址是(已编辑) NBP 文件名是 bootloader/pxe.boot.host/image NBP 文件大小是 1877432 字节 正在下载 NBP 文件...

NBP 文件下载成功。

X64 异常类型 0x0C - 堆栈错误异常

RCX=0000000000000001 DX=0000000036E13971 R8=00000000A0D29060 R9=000000007B2314F0 RSP=000000007B2315F8 BP=AFAFAFAFAFAFAF AX=000000000000000 BX=000000003932D000 R10=000000007B231558 11=9A02503F3EB2EC9E 12=0000000000000000 13=000000000000040 R14=00000000982470C0 15=000000000000001 SI=000000009ED79018 DI=0000000000000E40 CR2=0000000000000000 CR3=00000000A347B000 CR0=80000013 CR4=00000668 CR8=00000000 CS=00000038 DS=00000030 SS=00000030 ES=00000030 RFLAGS=00210286 MSR:0x1D9 = 00004801,0x345=000033C5,0x1C9=00000004

LBR 从 到 从 到 01h 0000000036E0DE86->000000009A1D2174 0000000036E0E4C4->0000000036E0DE23 03h 0000000036E0E977->0000000036E0E4C4 000000007B0FB7AB->0000000036E0E948 05h 000000007B0FB82C->000000007B0FB85E 000000007B0FB738->000000007B0FB80C 07h 000000007B0FB73D->000000007B0FB71B 000000007B0FB863->000000007B0FB73A 09h 000000007B0FB868->000000007B0FB860 000000007B0FB844->000000007B0FB864 0Bh 000000007B0FB738->000000007B0FB80C 000000007B0FB73D->000000007B0FB71B 0Dh 000000007B0FB863->000000007B0FB73A 000000007B0FB868->000000007B0FB860 0Fh 000000007B0FB844->000000007B0FB864 000000009A1D217F->000000009FBAD940

CALL ImageBase ImageName+Offset 00h 0000000000000000 无图像信息 01h 0000000000000000 无图像信息

调用 ImageBase 图像名称 + 偏移量

堆栈 00h 04h 08h 0Ch 10h 14h 18h 1Ch RSP+00h 9EFC7818 9A08AB98 9EFBF56D 9EFC7818 00000000 9ED79018 00000000 4CF5B200 RSP+20h 9EFC1B9B 4CF5B200 733AA782 7B231710 982470C0 365CA000 00000040 7B109960 RSP+40h 733A904F 3932D000 365CA000 7331C340 733A787F 734C8EE5 7340ADE0 734C8F55 RSP+60h 7331E4A8 734C84A0 73450911 7331C048 7331E4A0 7B231800 7331C320 9EFBAC48 RSP+80h 7331E520 7B231840 00000001 7331E420 7B231870 734500AB 7331C048 7331E500 RSP+A0h 9EFBAC48 73450A83 7331C288 7331E580 734500AB 7331C288 7331E640 00000000 RSP+C0h 73450EC5 7331E5E0 7344CF6E 73324300 7331E640 7331E5E0 73438071 73325580 RSP+E0h 7331E640 73324300 7331EA52 7331EA40 00000000 734382B2 73325580 00000000

答案1

您没有启动 Shim 文件 (shimx64.efi)

RHEL shim 文件被BOOTX64.EFI称为1.2MB

RHEL grub 文件被调用grubx64.efi,并且是关于1.8MB

从你的日志考虑 NBP 传输的大小(NBP 文件大小为 1877432 字节),我认为你正在启动grubx64.efi而不是BOOTX64.EFI

编辑1:

如果在正确启动后BOOTX64.EFI仍然出现相同的异常,请尝试启动 64 位版本bootmgfw.efi(Microsoft UEFI Boot Manager)

如果它启动正确(即使在尝试加载 BCD 时肯定会失败),这意味着你的固件没有实现符合 UEFI 的环境,并且在加载垫片时会失败

如果启动也失败,则您可能实际上没有在 UEFI 模式下启动,或者您的固件肯定有缺陷。

编辑2:

您还可以运行内存测试,看看您的 RAM 是否正常......

相关内容