机架式服务器的可靠性(按品牌和外形尺寸)

机架式服务器的可靠性(按品牌和外形尺寸)

我们公司在两个独立的数据中心的两个集群上运行电子商务网站(数千个)。

基本上,我们需要操作的只是机架式服务器节点。每个节点需要:

1.) 4 或 8 核 2.) 32 GB RAM 3.) 1 个 250 GB SATA 磁盘 4.) 2 端口、千兆、以太网适配器 5.) 能够启动 Windows XP Pro

就是这样。我们在一个完全冗余、始终在线(希望如此!)的集群中运行大约 40 个这样的节点(我们自己编写了集群部分)

以前,我们购买了白盒系统(基本上是让一家小商店根据我们的规格定制我们的服务器(supermicro))。

在我们上一轮节点采购之前,这个方案一直运行良好。上一轮节点采购的故障率非常高(6 个月内有 30% 的节点发生故障)。原因不明,电源坏了、内存坏了、主板烧坏了等等。

我的问题是:

如果我们从知名品牌供应商(IBM/DELL/HP)购买产品,我们的可靠性是否会更加稳定,还是说我们基本上还是会像以前一样陷入可靠性的困境?请记住,这些都是低端服务器。我们不会过渡到大型机或任何新奇的东西。

我们的可靠性会随着服务器的外形尺寸而变化吗?也就是说,2u 服务器会比 1u 盒式服务器中的高密度 2 个节点更可靠吗?

有谁从白盒服务器过渡到名牌服务器(或改变了外形尺寸)并有一个故事要讲吗?

答案1

一般来说,品牌名称趋向比白盒更可靠(尽管在我看来,超微不算作“白盒”),但是你仍然会偶尔遇到名牌硬件的坏运气。不过,如果你的购买量很大,并且与大品牌有过合作,你往往会很快修复这些问题。如果你从白盒供应商那里得到一批劣质主板,他们几乎没有机会有一堆备用件可以替换,而大品牌会有很多备用件——长期忠诚的客户(即“摇钱树”)会首先得到这些库存。

但归根结底,这是计算机硬件,这也是我们对收到的所有硬件进行大量老化测试的原因。一旦进入大规模管理,这种情况就会以惊人的频率发生,在测试架上失败远比在生产中失败要好得多(即使你拥有大量冗余系统)。

另外,“运行 XP Pro”——你是认真的吗?

答案2

更换建造者但保留品牌。

确实,Supermicro 硬件真的很好。如果失败率这么高,我首先会怀疑是建造者搞砸了。

答案3

从主板到完整的解决方案,Supermicro 是一个非常可靠的品牌。

优秀的建造商应该对自己的工作负责,并尽可能地帮助你。选择戴尔和惠普等大品牌也能为你提供同样的帮助。

至于配置类型。一个位置的热量越多,故障率就越高。因此,1u 中的 2 个节点会比 2u 中的 1 个节点散发更多的热量。但如果您的机架有足够的冷却能力,那么这根本不是一个因素。

答案4

对我来说,从大型 OEM 购买硬件的卖点在于,与小型供应商不同,大型 OEM 每天制造数千台机器,其制造\装配过程经过科学的微调。他们有零件制造商和工程师随时待命,在每个主要大都市地区都有零件仓库和服务技术人员。设备不仅在交付给您之前经过“路试”,而且还拥有数千小时的经验和工程设计。在我看来,这意味着可靠性、稳定性和一致性。

相关内容