节点仍处于调试状态!

节点仍处于调试状态!

我在实验室工作,有 2 个戴尔刀片和一台交换机。我正在尝试使用 juju 和 MAAS 创建 openStack。刀片连接到交换机并有一个私有的 192... 网络,每个刀片本身都连接到 10... 互联网。

我已经使用 Ubuntu 13.04 安装了 MAAS 服务器并向其中添加了节点,但节点的状态仍为调试!我已经检查了硬件时钟,一切正常。

我该如何修复此问题?

答案1

不确定这是否能回答您的问题,但我在虚拟环境中确实遇到了这个问题。实际上我只需要重新启动节点,它似乎在第二次设置 pxe 时修复了所需的问题。

答案2

我真的很抱歉没能对 Ross 的回答 +1,这是理所应当的,但这是我的第一篇帖子,我不能简单地发表评论。我必须回答。

我目前正在使用 MAAS(Ubuntu 14.04)在几台 Dell PE2950 上部署私有云,并发现了一些问题。与这个(相当老的)问题相关的是:

1) 一旦“节点”负载进入“调试”状态,它们将通过 PXE 故意关闭。您实际上可以在与每个节点相关的日志中看到这一点。编辑您在该节点上的电源控制类型,然后重新启动它。我选择了局域网唤醒,并输入了 MAAS 检测到的 MAC 地址。下次启动节点时,它将启动并启动另一个例程,该例程实际上将从该特定节点读取资源(内存量、磁盘数量、核心数量等)。完成后,该节点将再次关闭,并在 MAAS 上列为 READY。

既然我们在谈论奇怪的事情,下面是我注意到的几个问题以及我如何解决的。希望 Google 和其他蜘蛛索引系统也能发现这个问题,并与其他人分享这些信息。

我最初尝试在一台多宿主机器上部署 MAAS,该机器有两个网卡,这样我就可以让云控制器连接到互联网,但节点是隔离的。只是因为我有点偏执。这失败了,因为一旦节点启动,它们就会无法找到正确的 IP 地址,无法加载图像。

使其工作的唯一方法是使用单个 NIC(或者至少只配置一个 NIC)部署 MAAS,然后事情开始变得有意义,但是,你绝对不能在午休时间部署云。

或者,如果你可以的话,请告诉我你在哪里工作,因为你肯定有 4 个小时的午休时间!

我很确定可以通过调整配置文件中的几个参数来解决这个问题,但是,首先,这不是目标,其次,重新配置 MAAS,再次输入正确的 IP 地址并不能像预期的那样解决这个问题。

无论如何,这里的目标是阐明这个问题,帮助那些像我一样受苦的灵魂。

干杯。

------ 更新 --- 更新 --- 更新 ---- 2016 年 1 月 15 日

我发现在服务器上启用 IPMI(可能是机器尝试启动前的最后提示之一;通常是控制 E)将允许您启用和配置 IMPI 的行为,这很棒,因为 MAAS 将使用它来控制该节点,重新启动它并根据需要关闭它。

我还没有测试该过程的所有步骤,但它看起来很有希望。

更详细地说,在用于 DHCP 的 NIC 上启用 IPMI,而不是其他 NIC。听起来很明显,但凌晨 3:00 之后,所有想法都开始变得有点模糊。此外,确保每个节点的电源模式(在 MAAS 上)实际上是 IPMI。MAAS 似乎足够启动并测试所有 NIC 的 IPMI 功能。

看起来 MAAS 在基于 IPMI 控制金属时非常高兴。另一种选择(我还没有测试过)是将节点设置为局域网唤醒。这可能会在超时方面提供更多的自由度。

--- 更新 --- 更新 --- 更新 --- 2016 年 1 月 16 日

IPMI 有所不同,节点会自动打开和关闭,但是,请确保您的系统上安装了最新的固件。

在戴尔网站上查找 SUU 和 SLI。不同版本的 IPMI(固件)的行为也不同。

请注意,您仍需选择服务器并说“COMMISSION”或“DEPLOY”,但 MAAS 将负责打开或关闭它们。无需按按钮!

此外,无论如何,我的一台服务器始终显示电源打开。这可能是我提到的固件问题。我不得不拔下电源线并在一分钟后重新连接,以便在 MAAS 上触发正确的读数。这里只有一个未探索的变体:这个特定的单元有多个板外 NIC。(刚刚发现您可以选择服务器并说“关闭电源”以匹配其实际状态)。

相关内容