将集群控制器连接到区域控制器 (MaaS)

将集群控制器连接到区域控制器 (MaaS)

我正在尝试构建一个 MaaS 集群,这是我目前所做的:

区域主管

  • 安装 ubuntu 14.10
  • 配置接口
  • 配置 DNS
  • apt update
  • apt upgrade
  • apt install maas-region-controller
  • dpkg-reconfigure maas-region-controller---->http://192.168.10.1/MAAS/
  • 创建新的root帐户
  • 登录

集群控制器

  • 安装 ubuntu 14.10
  • 配置接口
  • 配置 DNS
  • apt update
  • apt upgrade
  • apt install maas-cluster-controller
  • dpkg-reconfigure maas-cluster-controller----> 192.168.10.1
  • maas login <maas_user> http://192.168.10.1/MAAS/ <api_key>

检查 MaaS 网络界面...群集选项卡中未出现任何群集。只是为了确认它们在同一个网络上。无论如何,我都可以从集群控制器登录 maas……但这似乎对结果没有影响。

我已经排除此故障四天了,但情况越来越糟……有人知道是什么让这两者能够正常沟通吗?

答案1

答案的第一个线索在于集群控制器上的日志 /var/log/maas/pserv.log。该问题本质上是身份验证失败。

2015-02-02 20:36:57+0900 [Uninitialized] ClusterClient connection established (HOST:IPv4Address(TCP, '172.16.10.3', 46209) PEER:IPv4Address(TCP, u'172.16.10. 1', 39492)) 
2015-02-02 20:36:57+0900 [Uninitialized] Event-loop maas:pid=1814 (127.0.0.1:33547): Connection was refused by other side: 111: Connection refused.

第二条线索来自区域控制器的 /var/log/maas/apache2/error.log。

[Mon Feb 02 18:02:10.106725 2015] [:error] [pid 31259:tid 140386414548864] OperationalError: FATAL:  password authentication failed for user "maas"
[Mon Feb 02 18:02:10.106731 2015] [:error] [pid 31259:tid 140386414548864] FATAL:  password authentication failed for user "maas"

对于那些好奇的人,我将我的 IP 方案更改为我的 eth0 接口,这是造成差异的原因,但这并没有解决任何问题。

这很可能是一个错误,因为一般来说应该会发生这种情况......但是节点仍应显示在 MaaS 中,等待管理员批准。

一旦获得批准(根据我对系统如何运作的理解),/var/lib/maas/secret密码就会从区域控制器传输到集群控制器。

不幸的是,服务器从未达到待处理状态,因此可能无法执行此操作。因此,要解决此问题,必须通过以下命令手动传输您的机密:

区域主管

cat /var/lib/maas/secret

复制输出,它应该是约 16 位十六进制代码。然后在集群控制器上运行以下命令并输入您复制的“机密”。

集群控制器

maas-provision install-shared-secret

最后通过您选择的 API 查询连接到服务器(这可能不是必需的,但它确实强制连接)。

My Configurations thus far.

1. Assign Basic Network Settings to CCs and RC
a) Assign an IP from the Management LAN XXX.XXX.XXX.XXX
b) configure interface XXX.XXX.XXX.XXX and XXX.XXX.XXX.XXX

2. Install and configure MaaS
a) apt update && apt upgrade && apt install -y maas-region-controller ubuntu-cloudimage-keyring openssh-server
b) dpkg-reconfigure maas-region-controller
c) sudo maas-region-admin createadmin (use this account to access the web interface)
d) Create and install public key into maas profile
e) ssh-keygen -t rsa -C [email protected]
f) cat /root/.ssh/id_rsa.pub and put the output into the add sshkey page on maas
g) (cluster-controller) apt install -y libvirt-bin maas-cluster-controller

3. Configure MaaS DNS and iptables
a) in /etc/resolv.conf verify XXX.XXX.XXX.XXXis the only nameserver
b) in /etc/resolvconf/head place nameserver XXX.XXX.XXX.XXX
c) (Cluster Controller) in /etc/bind/named.conf.options.* type the follwing:
"forwarders { 
 8.8.8.8;
 8.8.4.4:
};"
d) (Cluster Controller) /etc/sysctl.conf uncomment the line net.ipv4.ip_forward=1
e) (Cluster Controller)run mkdir /etc/yourorg/
f) (Cluster Controller)in /etc/init.d/rc.local write /etc/yourorg/settings.conf
g) (Cluster Controller)create file /etc/yourorg/settings.conf in vim and include:

"#!/bin/bash

/sbin/iptables -t nat -A POSTROUTING -o eth0 -j MASQUERADE
/sbin/iptables -A FORWARD -i eth0 -o eth1 -m state --state RELATED,ESTABLISHED -j ACCEPT
/sbin/iptables -A FORWARD -i eth1 -o eth0 -j ACCEPT"

4. Install MaaS shared secret on any distributed clusters.
a) sudo cat /var/lib/maas/secret  (On region controller)
b) maas-provision install-shared-secret (Cluster Controller)
<paste secret>

答案2

我遇到这个问题是因为另一个进程已在监听端口 69(tftpd)。

maas-clusterd该服务的日志文件中报告了/var/log/maas/clusterd.log

2016-03-15 13:56:15+1000 [-] twisted.internet.error.CannotListenError:无法在 10.0.3.1:69 上监听:[Errno 98] 地址已在使用中。

这导致该进程终止并且被 Upstart 不断重生。

为了解决这个问题,我只是停止了现有的 tftpd。

相关内容