Openstack Autopilot 在部署 Landscape 时失败

Openstack Autopilot 在部署 Landscape 时失败

更新:

进一步调查显示,LXC 容器在安装期间没有获取 IP。

但是如果放置几个小时,LXC 容器最终会从 MAAS 获取 IP。

所以今天早上我把集群从非常昂贵的 L3 Cisco 交换机移到了便宜的 L2 Dell 交换机上。所有 LXC 容器都可以立即获取 DHCP 地址,Openstack 安装程序也顺利完成。我们可能需要在 Cisco 交换机上进行某种配置设置,但目前我们将保持网络简单,同时在实验室中试用软件。

在这个相当恼人又奇怪的问题上花费了大量时间!非常感谢您的努力。


我们有一组在 MAAS 中配置的 5 节点机器。

它们运行正常,但是部署 Ubuntu 的 Openstack Autopilot 失败,原因如下:

./cloud-install/commands.log:

http://paste.ubuntu.com/10676002/

machine-0.log:

2015-03-24 16:49:19 ERROR juju.worker runner.go:219 exited "api": unable to connect to "wss://localhost:17070/"
2015-03-24 16:49:22 ERROR juju.rpc server.go:554 error writing response: EOF
2015-03-24 16:49:45 ERROR juju.state.unit unit.go:665 unit apache2/0 cannot get assigned machine: unit "apache2/0" is not assigned to a machine
2015-03-24 16:49:45 ERROR juju.state.unit unit.go:665 unit apache2/0 cannot get assigned machine: unit "apache2/0" is not assigned to a machine
2015-03-24 16:49:50 ERROR juju.state.unit unit.go:665 unit haproxy/0 cannot get assigned machine: unit "haproxy/0" is not assigned to a machine
2015-03-24 16:49:50 ERROR juju.state.unit unit.go:665 unit haproxy/0 cannot get assigned machine: unit "haproxy/0" is not assigned to a machine

-- 更多日志

从 juju 引导机:

/var/log/juju/all-machines.log

http://paste.ubuntu.com/10724991/

我想不通,它只是一遍又一遍地显示以下内容,直到失败:

machine-0: 2015-04-02 13:50:10 INFO juju.worker runner.go:261 start "api"
machine-0: 2015-04-02 13:50:10 INFO juju.api apiclient.go:252 dialing "wss://localhost:17070/"
machine-0: 2015-04-02 13:50:10 INFO juju.api apiclient.go:260 error dialing "wss://localhost:17070/": websocket.Dial wss://localhost:17070/: dial tcp 127.0.0.1:17070: connection refused
machine-0: 2015-04-02 13:50:10 ERROR juju.worker runner.go:219 exited "api": unable to connect to "wss://localhost:17070/"
machine-0: 2015-04-02 13:50:10 INFO juju.worker runner.go:253 restarting "api" in 3s

不确定这是否相关,但我在不同的实验室中有一个工作部署,我看到的唯一区别是在非工作实验室中的 juju boostrap 节点中的/var/lib/juju/agents/machine-0/agent.confSECURE_STATESERVER_CONNECTION: "true"已设置并且版本是1.22.0

缺少工作环境SECURE_STATESERVER_CONNECTION: "true" 且版本为1.21.3

答案1

我将在这里添加一个可以帮助其他人的一般答案。

当遇到此类问题时,如果不清楚是什么原因导致失败,一般的建议是简单处理。

在这种情况下,请尝试直接使用 juju 在 MAAS 中配置节点,而不是通过云安装程序。这样调试起来应该更容易、更快捷。

此 URL 包含有关如何直接将 juju 与 MAAS 结合使用的说明:https://maas.ubuntu.com/docs1.7/juju-quick-start.html

相关内容