将群集控制器连接到区域控制器(MaaS)

我正在尝试构建一个MaaS集群,这是我到目前为止所做的:

区域控制器

  • 安装ubuntu 14.10
  • 配置接口
  • 配置DNS
  • apt update
  • apt upgrade
  • apt install maas-region-controller
  • dpkg-reconfigure maas-region-controller —-> http://192.168.10.1/MAAS/
  • 创建新的root帐户
  • 登录

群集控制器

  • 安装ubuntu 14.10
  • 配置接口
  • 配置DNS
  • apt update
  • apt upgrade
  • apt install maas-cluster-controller
  • dpkg-reconfigure maas-cluster-controller —-> 192.168.10.1
  • maas login http://192.168.10.1/MAAS/

检查MaaS Web界面… 群集选项卡中不显示任何群集。 只是为了确认他们在同一个网络上。 无论我是否可以从群集控制器登录maas …但它似乎没有对结果产生影响。

我已经对这个问题进行了4天的故障排除了,而且它变得越来越粗糙….有谁知道是什么让这两者正常通信?

答案的第一个线索在于集群控制器上的log /var/log/maas/pserv.log。 问题本质上是身份validation失败。

 2015-02-02 20:36:57+0900 [Uninitialized] ClusterClient connection established (HOST:IPv4Address(TCP, '172.16.10.3', 46209) PEER:IPv4Address(TCP, u'172.16.10. 1', 39492)) 2015-02-02 20:36:57+0900 [Uninitialized] Event-loop maas:pid=1814 (127.0.0.1:33547): Connection was refused by other side: 111: Connection refused. 

第二个线索来自region-controller的/var/log/maas/apache2/error.log。

 [Mon Feb 02 18:02:10.106725 2015] [:error] [pid 31259:tid 140386414548864] OperationalError: FATAL: password authentication failed for user "maas" [Mon Feb 02 18:02:10.106731 2015] [:error] [pid 31259:tid 140386414548864] FATAL: password authentication failed for user "maas" 

对于那些好奇的人,我把我的IP方案改为我的eth0接口,这是造成差异的原因,但没有解决任何问题。

这可能是一个错误,因为通常会发生这种情况……但是,该节点仍然应该在MaaS中显示为等待管理员批准。

一旦获得批准(根据我对系统应如何工作的理解), /var/lib/maas/secret密码将从区域控制器传输到集群控制器。

不幸的是,服务器从未达到挂起状态,因此可能无法执行。 因此,解决此问题必须采取的措施是通过以下命令手动传输您的密码:

区域控制器

 cat /var/lib/maas/secret 

复制输出应该是一个~16位hex代码。 然后在您的群集控制器上运行以下命令并输入您复制的“秘密”。

群集控制器

 maas-provision install-shared-secret 

最后通过您选择的API查询连接到服务器(这可能不是必需的,但它会强制连接)。

 My Configurations thus far. 1. Assign Basic Network Settings to CCs and RC a) Assign an IP from the Management LAN XXX.XXX.XXX.XXX b) configure interface XXX.XXX.XXX.XXX and XXX.XXX.XXX.XXX 2. Install and configure MaaS a) apt update && apt upgrade && apt install -y maas-region-controller ubuntu-cloudimage-keyring openssh-server b) dpkg-reconfigure maas-region-controller c) sudo maas-region-admin createadmin (use this account to access the web interface) d) Create and install public key into maas profile e) ssh-keygen -t rsa -C maas@maas.maas f) cat /root/.ssh/id_rsa.pub and put the output into the add sshkey page on maas g) (cluster-controller) apt install -y libvirt-bin maas-cluster-controller 3. Configure MaaS DNS and iptables a) in /etc/resolv.conf verify XXX.XXX.XXX.XXXis the only nameserver b) in /etc/resolvconf/head place nameserver XXX.XXX.XXX.XXX c) (Cluster Controller) in /etc/bind/named.conf.options.* type the follwing: "forwarders { 8.8.8.8; 8.8.4.4: };" d) (Cluster Controller) /etc/sysctl.conf uncomment the line net.ipv4.ip_forward=1 e) (Cluster Controller)run mkdir /etc/yourorg/ f) (Cluster Controller)in /etc/init.d/rc.local write /etc/yourorg/settings.conf g) (Cluster Controller)create file /etc/yourorg/settings.conf in vim and include: "#!/bin/bash /sbin/iptables -t nat -A POSTROUTING -o eth0 -j MASQUERADE /sbin/iptables -A FORWARD -i eth0 -o eth1 -m state --state RELATED,ESTABLISHED -j ACCEPT /sbin/iptables -A FORWARD -i eth1 -o eth0 -j ACCEPT" 4. Install MaaS shared secret on any distributed clusters. a) sudo cat /var/lib/maas/secret (On region controller) b) maas-provision install-shared-secret (Cluster Controller)  

由于另一个进程已经在端口69(tftpd)上侦听,我遇到了这个问题。

/var/log/maas/clusterd.logmaas-clusterd服务的日志文件中报告了它

2016-03-15 13:56:15 + 1000 [ – ] twisted.internet.error.CannotListenError:无法收听10.0.3.1:69:[Errno 98]地址已被使用。

导致这个过程死亡并由Upstart不断重生。

为了修复,我只是停止了现有的tftpd。