在我新部署的 openstack 环境中,我注意到 CEPH 在 3 个 LXC 容器内出现故障。
016-05-03 02:18:38 INFO juju-log Unknown hook update-status - skipping.
Reading package lists... Donete-status
Building dependency tree -status
Reading state information... Donetatus
2016-05-03 02:18:40 INFO update-status sudo: unable to resolve host juju-machine-1-lxc-3
有什么想法吗?物理节点无法 DNS 容器是标准情况吗?似乎不太可能,而且,当我之前部署相同的设置时,我没有遇到任何问题。我猜 DNS 就是我收到 HEALTH_WARN 错误的原因。
更新:我发现 DNS 错误实际上并不是 CEPH 失败的原因,所以我对两者都感兴趣。是否应该将 DNS 条目添加到容器的 Bind 中,而不仅仅是物理主机?您对 Ceph 失败的原因有什么想法吗?
更新 2:Ceph 失败,因为放置组超出了 ceph 设置的 PG 最大值。修复方法是增加 OSD 而不增加放置组。我添加了一个答案来指出这个错误。在编辑时的建议是在 juju charm 中进行一些调整,以便在部署后“校准”设置。
更新 3:添加 OSD 确实会减少放置组的数量以达到最大 PG 限制警告值。
答案1
在帮助下,我找到了导致 ceph 出现 health_warn 的错误。我还没有找到解决方法来解决这个错误,但当我解决了这个问题后,我会更新这个答案。
https://bugs.launchpad.net/charms/+source/glance/+bug/1492742
添加 OSD 将解决警告。好消息是,juju 会为您处理所有事情。将驱动器放入服务器后,maas 和 juju 会运行良好,并立即将其设为 OSD。
ubuntu@juju-machine-0-lxc-4:~$ sudo ceph status
cluster eabab000-231c-4edb-855c-dd30b1bab56d
health HEALTH_OK
monmap e2: 3 mons at {juju-machine-0-lxc-4=10.14.0.53:6789/0,juju-machine-1-lxc-0=10.14.0.62:6789/0,juju-machine-2-lxc-4=10.14.0.60:6789/0}
election epoch 12, quorum 0,1,2 juju-machine-0-lxc-4,juju-machine-2-lxc-4,juju-machine-1-lxc-0
osdmap e356: 13 osds: 13 up, 13 in
pgmap v133686: 1091 pgs, 14 pools, 101133 MB data, 26747 objects
278 GB used, 3735 GB / 4014 GB avail
1091 active+clean