我希望我即将提出的问题足够具体,并且您能够并且愿意提供支持:-) 我们在 ESX 集群(三个 ESX 服务器)中拥有多个 openSUSE VM,并带有附加的 iSCSI-SAN。
所有这些 Linux VM 都配置了“单点故障”,这意味着对于 Web 服务器来说:LAMP、存储等,所有东西都在这个机器上。这非常简单,如果发生故障(最近几年:内核崩溃或 Apache 崩溃),只需通过脚本触发简单的重启即可。
但问题是:如何在不停机的情况下升级/维护网络应用程序或底层操作系统?这实际上很难管理,而且我是在清晨完成的;)我现在如何实现“简单”的高可用性集群?
我想到:带有心跳的 DRBD 和 2 个虚拟机。对于存储,使用 RDM(原始设备映射)LUN 并更改两个虚拟机的读写权限。
这是个好主意吗?有人有更好的解决方案吗?
答案1
如果您希望 Web 或应用服务器具有某种程度的 HA,那么只需使用某种形式的负载平衡器即可,但对于数据库的 HA,那么您可能希望以某种方式对其进行集群。话虽如此,我不喜欢 RDM,它们造成的问题和它们解决的问题一样多,但这就是您需要做的全部。