我有一个简单的双节点集群设置,在过去几周里运行良好。我没有对我的节点进行任何更改,但几天前数据指标停止显示。所有迹象表明其他一切都运行良好,OpsCenter 能够毫无问题地查看我的节点是否正在运行。此外,GUI 中没有报告任何错误。
我看过其他几篇帖子,尽管这些解决方案与我的场景无关。我的服务器负载不大。我的列族少于 10 个,因为这只是为了测试,而且没有配置 thift 密码。
当我查看 opscenterd.log 时,我看到以下内容:
2015-06-09 00:16:40+0000 [] ERROR: Error fetching metric data: Traceback (most recent call last):
File "/usr/lib/python2.7/dist-packages/opscenterd/MetricFetcher.py", line 470, in _fetch_through_cache
UnavailableException: UnavailableException()
2015-06-09 00:16:40+0000 [] ERROR: Problem while calling NewMetricsController (IndexError): list index out of range
File "/usr/share/opscenter/lib/py-debian/2.7/amd64/twisted/internet/defer.py", line 1020, in _inlineCallbacks
result = g.send(result)
File "/usr/lib/python2.7/dist-packages/opscenterd/MetricFetcher.py", line 612, in fetchMetrics
在 agent.log 中我看到了这个:
ERROR [os-metrics-5] 2015-06-09 17:47:41,161 Long os-stats collector failed: Cannot run program "iostat": error=2, No such file or directory
ERROR [os-metrics-4] 2015-06-09 17:47:41,162 Long os-stats collector failed: Cannot run program "iostat": error=2, No such file or directory
关于如何解决这个问题有什么想法吗?