我有一个正在运行的 OpsCenter 5.0 实例,并且已连接 10 个代理。这些代理位于 AWS 的 2 个区域,因此所有内容都使用外部地址进行通信。所有必要的端口都已打开,事实上,OpsCenter 仪表板显示“所有代理均已连接”。我还可以单击任何节点查看详细信息,所有统计数据似乎都在正常更新。
我唯一的问题是所有图表都显示“无数据”。奇怪的是,在我第一次设置后,它们似乎工作了几分钟,但随后就停止记录任何数据了。
我已重启服务器和所有代理进程,但无济于事。提前感谢大家提出的任何建议或想法!
答案1
搞定了!在代理日志中发现以下一堆内容:
WARN [Thread-1] 2014-08-08 15:07:06,527 Thrift operation queue is full, discarding thrift operation
WARN [Thread-1] 2014-08-08 15:07:06,527 239710 operations dropped so far.
ERROR [thrift-processor-1] 2014-08-08 15:07:07,832 Error when proccessing thrift callme.prettyprint.hector.api.exceptions.HInvalidRequestException: InvalidRequestException(why:You have not logged in)
这有点奇怪,因为所有其他通信都很好,图表最初也正常工作。为了解决这个问题,我只需在所有代理上的 address.yaml 文件中添加以下内容,然后重新启动代理服务:
thrift_user: <username>
thrift_pass: <password>