我有一个节点已成功加入 MAAS 池,即已获得“已声明”->“已委托”->“就绪”状态。在它进入就绪状态后,我发出 juju add-machine 将其置于“已分配”状态;然而,在启动时,我收到以下消息:
....
cloud-init-nonet [18.88] waiting 10 seconds network device
cloud-init-nonet [20.93] waiting 120 seconds network device
cloud-init-nonet [148.93] gave up waiting for network device
...
该节点是一台联想 Y500 笔记本电脑,我必须做以下修改:
- 其 BIOS 设置为 Legacy,启动优先级设置为 UEFI 1st
- 在启动 grub 菜单上,我在 linux 参数行的末尾添加了 nomodeset。需要注意的是,在将节点设置为已分配模式后,启动了第 2 步,以避免在启动过程中挂断 nouveau 驱动程序。我还尝试将其添加
ether=0,0,eth0
到 linux 参数行,但无济于事。
我最初倾向于将 UEFI 归咎为问题的根本原因,但事实证明这是没有根据的。以下是我现在看到的情况:
- 分配的节点有时会卡在等待网络设备的过程中,例如,经过 4-5 次重启后,我的 Y500 节点终于成功了,我能够将其部署为 nova-compute。我还注意到,重启现有节点(例如 cinder 或另一个 nova-compute)会导致相同的行为,这很奇怪,因为 2 周前我部署它们时没有出现这样的问题。
- 对于已部署的节点,解决方法是以单一模式登录,为 ubuntu 用户添加密码,重新启动,使用新凭据登录并发出
dhclient br0
。我还注意到,在发出 dhclient 之前,br0 未在 ifconfig 中列出。 - 我观察到的 MAAS 服务器也想获取 dhcp IP 地址的问题似乎是由于
/etc/network/interface
和网络管理器不匹配造成的。在两者中将相关字段设置为相同,可以摆脱烦人的 dhclient 进程。
我还没有通过查看 cloud-inits 日志文件确定任何新信息。如果有建议,请告诉我。
(不确定这是否相关,但当我尝试在现有的 10 个节点设置中添加另外 2 个节点时,我开始看到这个问题。)
答案1
这是我的一个愚蠢的问题,但是你能粘贴一份 /etc/network/interfaces 的副本吗?我发现设备在其中启动的方式在某种程度上依赖于顺序,并且如果桥接器先启动,卡随后启动,则会出现不稳定的行为。