DataStax Ops Center EC2 多区域设置,其中 us-east-1 有 2 个节点,us-west-1 有 2 个节点
Ops center 安装在单独的 ec2 实例上,可以看到集群,但我无法安装代理。查看一个实例,在 /var/lib/opscenter-agent/conf/address.yaml 中,我有:
stomp_interface: "local ip address"
local_interface: "public ip address"
local_address: "public ip address"
use_ssl: 0
agent_rpc_interface: "local ip address"
agent_rpc_broadcast_address: "public ip address"
这些是 IP 地址,而不是 ec2 主机名。
在 OpsCenter 服务器端,我有:
[agents]
use_ssl = false
在 /etc/opscenter/opscenterd.conf 中设置。
当我启动代理时,我看到:
ERROR [StompConnection receiver] 2013-10-14 20:27:49,980 failed connecting to 10.114.79.236:61620:java.net.ConnectException: Connection refused
INFO [StompConnection receiver] 2013-10-14 20:27:49,981 Reconnecting in 60s.
INFO [install-location-finder] 2013-10-14 20:27:56,774 New JMX connection (127.0.0.1:7199)
WARN [clojure-agent-send-off-pool-4] 2013-10-14 20:28:37,083 Tried to send message while not connected: /node-details ["public ip address",{"os-load":0.0}]
OpsCenter 可以看到集群的详细信息(节点数、它们位于哪个 DC 等)。
在 opscenterd 日志中,我看到:
Node "public ip" has an unknown topology, collecting topology info from another node now
循环遍历所有 4 个节点。
我在代理和服务器节点的安全组之间打开了端口。
任何建议都将受到欢迎。
答案1
stomp_interface 是用于访问运行 opscenterd 的机器的 IP。在大多数情况下,该值在所有节点上都是相同的。
看起来您正在将其设置为节点本身的 IP,这就是您看到无法在端口 61620 上连接的原因:(ERROR [StompConnection receiver] 2013-10-14 20:27:49,980 failed connecting to 10.114.79.236:61620:java.net.ConnectException: Connection refused
)