我最近第一次遇到了熵池耗尽的情况,并且令我失望的是,所有常见的系统日志都无法帮助我发现问题。
在新的 CentOS 6 虚拟机上安装 CUPS 后,我尝试通过 HTTPS 连接到管理页面。请求似乎无限期挂起。后来我了解到,CUPS 正在尝试动态生成新的自签名 SSL 证书,并在尝试从 /dev/random 读取时被阻止。进一步阅读互联网显示,这是虚拟机的一个常见问题,因为它们缺乏通常的熵源。
虽然在我的特定情况下很容易解决这个问题,但我现在担心类似的耗尽事件可能发生在我的 ESXi 集群中的其他虚拟机上。但由于此事件未写入任何常用日志文件,因此我真的无法知道问题有多普遍。
有没有办法轻松监控大型集群中所有虚拟机的熵可用性?特别是,我想知道熵耗尽是否是导致我们在某些机器上看到的某些间歇性性能问题的一个因素。
答案1
通过文件系统检查很容易/proc
...
cat /proc/sys/kernel/random/entropy_avail
此外,还有一些监控实用程序和图表以及可用熵的警报。Munin 是一个简单的例子。