如何监控和记录 Chef 服务器和 Chef 客户端的响应时间和网络流量?

如何监控和记录 Chef 服务器和 Chef 客户端的响应时间和网络流量?

我对 Chef 服务器和 Chef Chef 客户端还很陌生。此外,我对用 Ruby 编写的 Chef 也还很陌生。

我在监控 Chef 客户端运行时 Chef 服务器响应时间的性能并从中获取信息时遇到了问题。顺便说一下,我们的设置是 1 个 Chef 服务器、1 个 Chef 客户端作为节点和 1 个 Chef 客户端作为工作站(我们在那里执行 knife 命令)。

目前我们的日志输出信息只包含Chef客户端运行后的运行时间,

[root@sg8tb08208 chef]# chef-client
[2013-02-13T15:16:02+09:00] INFO: *** Chef 10.18.2 ***

..........更多日志信息.................然后

[2013-02-13T15:16:11+09:00] INFO: Chef Run complete in 8.782384 seconds

但我们还需要记录或至少了解服务器和它们之间的网络的响应时间。这可能吗?

我已经在网上搜索了两天了,却找不到关于它的文档。甚至找不到已经尝试过的人。如果知道在有 n 个客户端/节点连接到 Chef 服务器的情况下,Chef 服务器的平均响应时间是多少,那将非常有帮助。

非常感谢您的帮助。谢谢!

更新:我正在尝试使用 revealcloud 来监控服务器性能。这将连接到 CopperEgg。我已经设置了 api_key 和代理,但一直出现错误。

Error executing action `run` on resource 'script[revealcloud_install]'
Expected process to exit with [0], but received '2'
 - !! Downloaded revealcloud binary does not match MD5
---- End output of "bash"  "/tmp/chef-script20130214-1211-1xejv30-0" ----

答案1

要检查配方中每个资源的响应时间,您可以使用厨师处理时间对这 8.782384 秒进行某种分析。

对于提供多个系统的响应时间历史记录和统计数据,您可以使用厨师指标并将所有这些酷炫指标发送到石墨。

相关内容