MAAS 登记不起作用,未找到数据源,无法通过 UEFI PXE 启动

MAAS 登记不起作用,未找到数据源,无法通过 UEFI PXE 启动

前面的问题描述非常详细,TL;DR 我尝试部署的服务器无法注册,并且我在几台服务器上遇到了 UEFI 网络启动问题

我有 4 台服务器(重新利用的台式机塔式服务器,不是一个非常严肃的家庭实验室设置),其中一台用作专用的区域+机架控制器(使用已安装的 PostgreSQL 数据库,通过 snap 安装的 MAAS 版本 2.8)(旧的 Dimension 就是为此而工作的)。我之前的设置没有列出的问题,部署一切顺利,直到我完全重新安装了 Ubuntu 以重置 MAAS。(我不小心尝试在 IPv6/IPv4 范围内 DHCP 分配 18Qt 地址,结果系统冻结了,导致我的网络崩溃,之后 Ubuntu 拒绝启动)从那时起唯一的区别是我在 DD-WRT 上设置了 IPv6 并更改了子网。(所有 IP 地址/引用都已更改并测试)总的来说,重新安装后 MAAS 有点不稳定,但这可能是安慰剂效应。

以下问题需要注意一点:我一直在使用 DD-WRT/dnsmasq 来控制我的网络的 DHCP,MAAS 控制器无法在其当前负载之上真正处理 DHCP。所有 dhcp-boot 记录都完好无损且正常工作(至少对于 IPv4 而言,我正在研究 IPv6 网络启动)(此外,我知道这种设置并不理想,但再说一次,这不是一个非常严肃的家庭实验室设置,我使用 MAAS 是为了方便扩展和集中控制,我知道不要对这个非常坦率地说很差的设置抱有太大期望。)

3 台虚拟化主机服务器中有 2 台(我尝试使用 MAAS 部署,它们是具有最新 BIOS 更新的 Dell Optiplex 3010)拒绝从 UEFI PXE 启动,卡在Fetching netboot image...MAAS rackd.log 上,表示机器最终抓取了bootx64.efigrubx64.efi但仅此而已。在尝试使用 UEFI 并启用安全启动后,我将机器设置为使用旧版 CSM 启动。它最终进入了登记环境,但这导致了我的下一个问题...

所有 3 台服务器(包括通过 UEFI PXE 工作的服务器,即 HP 6300-SFF)一开始都拒绝登录,并显示Can not apply stage final, no datasource found! Likely bad things to come!。然后它将我带到主机名下的登录提示符ubuntu(不maas-enlistment-node应该这样)。它们都未在 MAAS UI 上显示。在启动阶段的早些时候,它还大约 6 次无法启动 OpenSSH 守护程序。我的调试操作系统是 Ubuntu 20.04 Focal Fossa,MAAS 服务器也在它上面运行。(我尝试过 Ubuntu 18.04,结果相同)。在登录提示符下,我尝试了所有能想到的密码组合(ubuntu| ubuntuubuntu| <nothing>root| ubuntuubuntu| <my MAAS password>maas|<MAAS password>等),但都不起作用。它们显然都具有连接性,因为 DD-WRT 都为它们提供了 IP 地址,并且它们下载了网络启动映像和临时 ramdisk/I,可以在它们的 v4 和 v6 地址上成功 ping 它们。根据控制器面板,所有 MAAS 服务都在运行。

我不太确定接下来该怎么做。我之前安装过一个功能齐全的安装,但重新安装和部署 IPv6 后一切都乱了套。日志文件和 dnsmasq.conf 可应要求提供。TIA!

(如果这篇文章写得不好或者太长,我深感抱歉,这是我的第一篇帖子,虽然潜水很久了,但对这里的结构/审核方式并不太熟悉 :P)

答案1

经过长时间与服务器的斗争,我发现了这个问题。显然,PostgreSQL 数据库中有坏数据,向主机发送了错误的元数据,造成了更多的混乱。我不知道它是如何发生的,但我已经迁移到更理想的虚拟化设置,它现在与 Landscape 一起完美地运行。¯\_(ツ)_/¯

相关内容