我知道一些大公司(例如 IBM、Amazon)和政府要求其服务器具有高可用性和数据保留率。为了实现这一点,他们使用冗余。我的问题是,服务器(和集群)的哪些组件通常是冗余的?我曾在这样的服务器机房工作过一段时间,注意到以下方面的冗余:
- 电源
- RAID 至少使用约 10 个磁盘,并且通常具有热备用
- 网卡
- 网络卡本身有多个以太网端口
- UPS备份
- 柴油发电机
冗余中还有哪些常见内容?我知道整个服务器可以镜像。任何计算机组件都可以冗余吗?例如,现在的计算机确实有多个 CPU,但我想你不会认为这是冗余的,因为它们都在同时使用,所以所有 CPU 发生故障的可能性都是相等的,我理解得对吗?内存可以冗余吗?
我有兴趣查看服务器哪个部分最常出现故障的统计数据。
答案1
服务器的任何部分都可以冗余,但可能会有重大的权衡,这可能是交易破坏者 - 取决于你正在做的事情 -
在很多情况下,最大的问题是冗余站点 —— 即使您有 2 台 PC,如果它们彼此相距较远,延迟也会对您的 IO 造成严重影响。
进入设备 -
您实际上无法使内存冗余,但可以使用 ECC 内存来增加完整性。
你实际上不可能有冗余主板——这实际上意味着 2 台计算机。
尽管您可以拥有多个 CPU 并禁用一个没有执行的 CPU,但您实际上不可能拥有冗余 CPU。
计算机中最常发生故障的部分是硬盘驱动器 - 远远超过硬盘驱动器。内存故障也相当常见。