是否有人同时具有 Linux 和 Windows 故障转移冗余群集的经验,如果有,您更喜欢哪种文件服务器和/或 Web 服务器?
简单介绍一下背景。我们在 Windows 2000 下设置并管理了一个 Microsoft 集群好几年。该集群是一对 Web 服务器,带有一个相当大的(当时的)RAID 阵列,用于向 Web 提供多媒体存储 - 向广播电台提供数十万个 mp3 广告。我们对这种情况有很多不满。首先,Microsoft 集群使用共享存储阵列。尽管它是热插拔 RAID,但只要驱动器上的 NTFS 文件系统稍微损坏,就会突然导致您在 ChkDsk 运行时停机几个小时。
因此,在下一次构建时,我们购买了一款名为 NeverFail 的产品 -http://www.neverfailgroup.com/ 该产品在主服务器和辅助服务器之间自动复制数据,使其在块写入级别保持同步。这消除了我们在共享存储方面遇到的问题。但它也带来了自身的问题。任何重启都需要数据重新同步,系统会分析所有内容以进行同步。虽然系统在此同步期间处于启动状态并可用,但在 mp3 文件数量少于 1TB 的服务器上,这需要几个小时。而典型的 Microsoft 补丁会话需要几次这样的重新同步。因此,我们通常需要 2 天以上的时间来修补 2 台机器。结果,我们发现自己推迟了修补,并且没有像我们应该的那样频繁地进行修补,这并不理想。而且这个过程很棘手,必须具体遵循。
因此,我们正在考虑将包含所有这些内容的主站点移动到带有 Linux HA 和 DRBD 的一对 LAMP 盒中。
因此,我很好奇是否有人有管理 Linux 和 Windows 集群的经验,可以告诉我他们经历了什么。具体来说,我们想知道重启时的重新同步时间等,以及管理此类 Linux 系统的总体经验。
虽然我们传统上是一家 Windows 商店,但现在我们公司内部有一位了解 Linux 的人,而且我现在也在学习,并在我们的系统中添加了许多 Linux 机箱,因此从管理的角度来看,我们对此持开放态度。
答案1
我喜欢 Linux HA 的东西,DRBD 现在已经达到了非常高的水平。在我遇到的情况下,Windows 同类产品从未提供过相同水平的稳定性和可配置性。
答案2
首先是一些观察,我相信其他人会有更多数据。DRBD 的存在时间比原生 Windows 目录同步工具更长,因此它可能更强大。其次,Windows 2008 的 DFS/Replication 技术已被重写以提高性能。它存在的时间没有 DRBD 那么长,但它承诺能够在多个服务器之间复制大型目录。DFS/Replication 不像 DRBD 那样在块级别进行操作,只是在文件/目录级别进行操作。使用 DFS/Replication 的完全重新同步是在线的,而不是离线的,因此您不会遇到与 neverfailgroup 相同的服务中断。