我有四台二手 Supermicro 服务器(X9DRi-LN4F+,CSE-815TS 机箱)。每台都有五个 FAN-0086L4(https://store.supermicro.com/index.php/40mm-fan-0086l4.html) 开始出现故障。所谓故障,是指 IPMI Web 界面中的事件日志包含如下条目:
369 ... FANA Fan Lower Critical - Going Low - Asserted
370 ... FANA Fan Lower Non-Recoverable - Going Low - Asserted
当我打开机箱时,风扇“卡住了”。我尝试更换风扇的位置,但无济于事。然后更多的风扇开始出现故障——四台机器的二十个风扇中有八个出现故障。我想我的一批风扇可能有问题,所以我用这个风扇替换了所有二十个风扇:https://www.aliexpress.com/item/NIDEC-4056-R40W12BS5AC-65-12V-0-80A-4cm-For-SUPERMICRO-FAN-0086L4-Cooling-Fan/32806512302.html?spm=2114.11010108.01008.1.650c649bwYCBmG。
现在新一批服务器开始出现故障:自从我购买替换件以来的四个月里,二十台服务器中就有三台出现故障。接下来我需要调查什么?服务器位于车库中,灰尘很少:当我打开它们时,风扇和机箱内部看起来都很干净。温度在 2-18°C 范围内,湿度在 40-70% 范围内。