我们有三台 Ubuntu(值得信赖)服务器接收请求。其中一台出现了各种奇怪的问题,我们正在努力找出原因。
首先,我们要排除硬件差异。因此,我们要验证三台服务器上的硬件是否相同,并且每台服务器上的操作系统是否以相同的方式查看所有硬件。有没有一种简单的方法可以获取我们可以从每台服务器进行比较的摘要?就像硬件的 md5 校验和一样?
答案1
尝试安装 Ubuntu 的 List Hardware 包。
sudo apt-get install lshw
运行命令
sudo lshw -short
在所有三个硬件上,并在安装其比较插件后使用 Notepad++ 进行比较。这是我能想到的最好和最简单的方法。当然,上面的命令留下了很多细节。如果您需要详细信息,可以省略-短的切换并将输出路由到 html、xml 或 txt 文件,如下所示。
sudo lshw > hardware.txt
sudo lshw -html > hardware.html
sudo lshw -xml > hardware.xml
您也可以尝试使用 Excel 表。取决于您习惯使用哪种方式。
答案2
该dmidecode
命令可能已安装。尝试以下操作:
dmidecode -t 1 | egrep '(制造商|产品|序列号)'; dmidecode -t 0 | egrep '(版本|发布)'; dmidecode -t 处理器| egrep '(套接字|版本)'
我很想看看输出结果...
但是,如果您遇到稳定性问题,硬件差异可能不是问题。这是托管环境吗?如果是,他们可能使用低端或手工组装的(咳嗽...超微) 设备。您可能想查看dmesg | tail
问题服务器上的内核环形缓冲区 ( ) 中是否有任何消息。
这些提供商使用的设备类型通常不具备任何形式的硬件监控功能。您可能拥有 IPMI 等带外选项,但它与通用硬件上的传感器/组件的集成并不紧密。