早上好;
我们的数据中心一直出现间歇性电源故障,初步认为是“锌晶须”造成的。我刚刚开始阅读有关它们的文章(我刚刚在 Google 上搜索了这个词,然后开始挑选资料),我对其他人遇到它们的经历以及任何清理和恢复经验很感兴趣。谢谢!
答案1
您问的是有关 ROHS 电路板的问题,还是有关架空地板和机架安装设备的镀锌层的问题?
但这没什么大不了的……因为它们比人的头发还细,所以它们通常会在造成真正问题之前就烧掉。它们也足够大,即使是最普通的空气过滤器也能捕捉到它们。
在电源中,它们通常会在成为真正问题之前烧毁。保形涂层会有所帮助。它们主要只是在没有保形涂层的更敏感的逻辑电路中(周围没有很多这样的电路)的信号危害。
最有可能的情况是,供应商只是在找借口解释其电源 OEM 的劣质选择。如果您能说出名称和型号就更好了。这可能会带来更多(和更有帮助的)回应。
答案2
我从来没有遇到过可以归咎于锌/锡晶须的故障,尽管我的样本集并不大,而且我从来没有真正遇到过像你描述的那样的电源故障,这会让我去寻找根本原因。
我会研究更常规的问题(电源中的电容器损坏或瞬态电气故障率相当高,特别是因为您说您遇到了两次“大规模” PSU 故障),尽管听起来您已经遇到了。
如果我的清单与您或您的电工的清单不同,请列出我的简短清单:
电气方面:由于 UPS 或 PDU/CDU 故障、接地故障等原因,电源稳定性较差。如果“大规模事故”发生在由相同配电设备提供服务的区域,则更有可能出现这种情况。
环境:温度和湿度;检查设备的入口/出口温度(特别是如果故障发生在数据中心的同一物理区域:您可能会发现气流/冷却问题导致设备过热)。
设备/制造商质检:检查坏掉的电源是否有膨胀/烧坏的电容器,尤其是当故障发生在大约同一时间购买的设备中时。确保不要对电源施加过大的压力(大量硬盘和耗电的 CPU 可能需要更大的 PSU)