ganglia

如何在 Unicast 中正确配置 Ganglia?
ganglia

如何在 Unicast 中正确配置 Ganglia?

我正在使用 Ganglia,顺便说一句,这是一个很棒的工具!我正在尝试制作这个拓扑,部分节点正在运行centOS 6.4,centOS 5.9。 因此,我正在尝试对 GMetad 进行以下配置(其余为默认配置): ########################################################################## Head Monitor Cluster (GMetad + Gmond > mute no > deaf no + GWeb ) | centOS 6.4 (desktop) ###...

Admin

重新启动收集服务器后,ganglia 停止
ganglia

重新启动收集服务器后,ganglia 停止

我有 3 台机器。其中一台收集所有 3 台机器的 ganglia 数据。当我重新启动此“收集器”服务器时,gmetad 和 ganglia-monitor 都从 /etc/rc3.d 启动,我可以在 tcpdump 中看到其他 2 台服务器每 15 秒发送一次监控数据,但只有“收集器”服务器的数据显示在 Web GUI 中。 我可以让其他服务器再次出现在图表中的唯一方法是:停止远程服务器上的 ganglia-monitor,等到服务器显示为“离线”,然后再次在远程服务器上启动 ganglia-monitor。 我很确定这应该是开箱即用的,知道可能出什么问...

Admin

Ganglia 的 RRD 模块是瓶颈吗?
ganglia

Ganglia 的 RRD 模块是瓶颈吗?

我想监控很多机器上的大量指标,从 Graphite 网站,我注意到 ganglia 的 RRD 组件可能会带来可扩展性问题,这是以下常见问题解答中解释 whisper 最初被发明的原因。如果问题尚未解决(我喜欢 ganglia2 的 webapp),我想知道是否有办法使用 gweb2 读取 whisper 数据。 “编写 whisper 的第二个原因是性能。RRDtool 非常快,实际上比 whisper 快得多。但 RRD 的问题(在编写 whisper 时)是 RRD 只允许您一次将单个值插入数据库,而 whisper 允许一次插入多个数据点,将它们压...

Admin

Ganglia - 缺少某些服务器的指标
ganglia

Ganglia - 缺少某些服务器的指标

我最近在 Ubuntu 16.04 服务器上安装了 Ganglia。我基本上按照说明进行操作这里。 问题是,某些服务器的指标集的 rrd 文件丢失。 最重要的是,除了来自 Nvidia 插件的 GPU 指标之外,“主”节点本身没有其他指标。 有人能就这个问题给我一些建议吗? 另外,有没有办法强制立即收集至少定义一次的所有指标? 谢谢! ...

Admin

Ganglia 仅显示本地主机
ganglia

Ganglia 仅显示本地主机

我刚刚安装了 Ganglia,但它只显示本地主机。似乎无论我怎么更改都不起作用。我肯定我漏掉了一些愚蠢的东西,谁能帮我一下。 /* This configuration is as close to 2.5.x default behavior as possible The values closely match ./gmond/metric.h definitions in 2.5.x */ globals { daemonize = yes setuid = yes user = ganglia debug_level = 0 max_udp_ms...

Admin

是否可以配置 Ganglia 的 gmond,使得如果 Ganglia 服务器重新启动,它不需要重新启动?
ganglia

是否可以配置 Ganglia 的 gmond,使得如果 Ganglia 服务器重新启动,它不需要重新启动?

我用神经节监控我的计算机集群: (图片来源) 当我重新启动 Ganglia 服务器时,gmond集群中其他服务器上的守护进程停止向 Ganglia 服务器发送信息。我必须运行 sudo /etc/init.d/ganglia-monitor restart 在每台服务器上。 是否可以配置 Ganglia 的 gmond,使得如果 Ganglia 服务器重新启动,它不需要重新启动? 我用: Ganglia Web 前端版本 3.6.1 Ganglia Web 后端 (gmetad) 版本 3.6.0 RRDtool 版本 1.4.7。 U...

Admin

Ganglia 的 GPU Nvidia 模块:我们需要修补 ganglia-webfrontend 吗?
ganglia

Ganglia 的 GPU Nvidia 模块:我们需要修补 ganglia-webfrontend 吗?

我正在尝试添加 GPU Nvidia 模块神经节(/ganglia/gmond_python_modules/gpu/nvidia/)。 我们需要打补丁吗ganglia_web.patch? 如果我不应用该补丁,当我访问http://本地主机/ganglia/ 如果我尝试应用该补丁,我会遇到以下问题: ubuntu@server:/usr/share/ganglia-webfrontend$ sudo patch -p0 < /home/ubuntu/gmond_python_modules/gpu/nvidia/ganglia_web.pat...

Admin

Ganglia 私人页面
ganglia

Ganglia 私人页面

我已经阅读了有关授权系统的 Ganglia 文档(https://github.com/ganglia/ganglia-web/wiki/Authorization-System)。 我想通过 htaccess 限制对该页面的所有访问,以便只有经过身份验证的用户才能访问它。 在 ganglia 网站上,带有“需要有效用户”的 .htaccess 文件是否足够? ...

Admin

如何在 Ganglia 中创建自定义图表?
ganglia

如何在 Ganglia 中创建自定义图表?

如何在 ganglia 中创建自定义图表。我编写了几个脚本,它们可以返回整数数据,我想在 ganglia 中绘制它们。我可以每分钟从我的脚本中获取输出。 ...

Admin

Ganglia 正在运行但不显示 CPU 或主机
ganglia

Ganglia 正在运行但不显示 CPU 或主机

所以我在一个 Debian 节点上设置了 Ganglia。它遵循了一个非常简单的过程 1-使用以下方法从稳定仓库安装 apt-get install ganglia-monitor gmetad apt-get install ganglia-webfrontend 2-使用以下配置:https://www.digitalocean.com/community/tutorials/introduction-to-ganglia-on-ubuntu-14-04#installation 现在,我已让所有程序运行,我可以在 localhost/ga...

Admin

Ganglia gmetad 运行一段时间后出现段错误(在 AWS EC2 上)
ganglia

Ganglia gmetad 运行一段时间后出现段错误(在 AWS EC2 上)

我们正在使用 Ganglia 监控我们在 Amazon AWS 上的云基础设施。一切都运行正常(指标流动等),只是偶尔 gmetad 进程会突然出现段错误。gmetad 进程在 m3.medium EC2 上运行,监控大约 50 台服务器。这些服务器被分成几组,每组都有一个堡垒 EC2,用于收集指标。gmetad 配置为从这些堡垒(大约 10 个)中获取指标。 一些有用的事实: 我们在所有 EC2 上运行 Debian Wheezy 崩溃在正常运行时不会生成任何日志,除了一个段错误日志,例如“gmetad[11291]: segfault at 71 ...

Admin

如何知道哪个脚本或可执行文件与 Ganglia 中的指标相链接?
ganglia

如何知道哪个脚本或可执行文件与 Ganglia 中的指标相链接?

我刚刚开始探索 ganglia,我的问题是“如何知道哪个脚本或可执行文件与 ganglia 中的指标相关联?” 事实上,我对 ganglia 了解不多。我在 zabbix 方面经验丰富,我想在 zabbix 中链接一个已经在 ganglia 中运行的图表。 我在网上浏览了很多内容,但没有一个答案是相关的。 假设度量标准为: “hbase.RegionServerDynamicStatistics.tbl.SUBSCRIBER.cf.M_T_V” 在这下面,显示了两个图表:“hbase.RegionServerDynamicStatistics.tb...

Admin

Ganglia – gmond + gmetad 可以工作,但 gweb 不可以
ganglia

Ganglia – gmond + gmetad 可以工作,但 gweb 不可以

我在 RHEL 6.5 EC2 实例上创建了 Ganglia 安装。我已在此主机上安装并配置了 gmond、gmetad 和 gweb。我现在只想监控本地主机。我已将本地主机配置为数据源。当我访问 时,http://localhost/ganglia2Firefox 中出现“无法连接”页面。知道原因吗? 当我运行telnet localhost 8649和时telnet localhost 8651,我毫无问题地获得了 XML 转储。 当我运行时telnet localhost 8652,我得到这个输出: ‘Trying ::1... telnet: ...

Admin