rhcs

RedHat 6 集群故障转移
rhcs

RedHat 6 集群故障转移

我正在测试此处记录的 RedHat 集群管理工具:https://access.redhat.com/site/documentation/en-US/Red_Hat_Enterprise_Linux/6/html/Cluster_Administration/index.html 我有两台运行 CentOS 6.4 的虚拟机。我一直在测试故障转移方案;重新启动主机并正常关闭主机均能成功将资源迁移到辅助机器(例如 DRBD、Tomcat、MySQL、Apache)。 但是,我想模拟完全断电或强制关机。在 XenCenter 客户端中,我强制关闭了主机,并...

Admin

哪种隔离设备设置可以阻止双节点 RHEL 群集中的相互 STONITH?
rhcs

哪种隔离设备设置可以阻止双节点 RHEL 群集中的相互 STONITH?

我在带有 iDRAC 的物理戴尔服务器上的 RHEL 6.6 上安装了 Red Hat 集群(corosync+rgmanager)软件。 此集群用于无状态应用程序(stunnel,TLS 网关),因此它不需要也没有任何共享磁盘。我希望让此集群尽可能简单,因此我宁愿不添加任何 iSCSI 仲裁磁盘(截至目前,根本没有 qdisk)。 我的 cluster.conf 包含: <cman expected_votes="1" two_node="1"/> 如果我的“心跳”链接完全失败,我的测试强烈建议发生这种情况: 如果双节...

Admin

当您已经拥有冗余通信链路时为什么还要使用隔离?
rhcs

当您已经拥有冗余通信链路时为什么还要使用隔离?

本文你应该同时使用隔离(又名 STONITH)和冗余通信链路。我试图了解 STONITH 在裂脑情况下有什么好处。例如,假设你有节点 A、节点 B、STONITH 设备,它们使用交换机 I 连接。如果交换机 I 死机 - 网络被分区 - 并且节点 A 无法向 STONITH 设备发送请求,那么它就毫无用处了。 好的,我们可能有专用的交换机 II,用于将节点与 STONITH 设备连接起来。如果交换机 I 发生故障,我们仍然可以向 STONITH 设备发送信号,它可能会关闭节点 B。 但问题是,为什么不直接使用交换机 II 作为节点 A 和节点 B 之间的...

Admin

如何以降级模式运行 CentOS(Red Hat)集群?
rhcs

如何以降级模式运行 CentOS(Red Hat)集群?

我在 CentOS 6.5 上安装了 Red Hat 的集群软件,并使用它提供从一个网络到另一个网络的冗余路由。这工作得很好,我有一对提供该服务的盒子,这样如果其中一个发生故障(例如,如果我通过删除其网络连接进行测试),另一个就会接管路由。 但是,如果我必须对剩下的盒子做任何事情,我无法重新启动它,因为 rgmanager 存在问题: service rgmanager stop 挂起,停止进程的唯一方法就是执行kill -9此操作。这显然还会影响任何试图停止服务的操作,例如reboot或poweroff。 当我设法自行启动服务器时,虽然集群启动了...

Admin

在所有 RHCS 集群节点中运行服务
rhcs

在所有 RHCS 集群节点中运行服务

我正在尝试配置一个服务,使其在 RHCS 的所有节点上运行。我尝试过将该服务放置在没有故障转移域的情况下,但它似乎只在一个节点上运行 <rm> <service autostart="1" name="rsync" exclusive="0" recovery="restart"> <script file="/etc/init.d/xinetd" name="RSync"/> </service> &lt...

Admin

为什么 Red Hat Cluster Suite 停止工作了?
rhcs

为什么 Red Hat Cluster Suite 停止工作了?

我一直在 CentOS 6.4 上测试 Cluster Suite,它运行良好,但是今天我注意到 [8 月 8 日,这个问题最初被提出时] 它不喜欢之前工作的配置。我尝试使用 CCS 从头开始​​重新创建配置,但出现了验证错误。 8 月 21 日编辑: 我现在已经从 CentOS 6.4 x86_64 最小安装完全重新安装了该框,并添加了以下软件包及其依赖项: yum install bind-utils dhcp dos2unix man man-pages man-pages-overrides nano nmap ntp rsync tcpd...

Admin

使用 rhcs 的共享文件系统
rhcs

使用 rhcs 的共享文件系统

我们有 2 个节点集群,它们与存储相连,以便在两个集群节点之间共享单个分区。因此,我们为 rhcs 配置了 gfs2。我们为资源添加了 gfs 和 ip 地址。因此,当我第一次询问集群服务时,它代表节点 1,因为我以高优先级选择了它。当我重新启动它时,它会使用 ip 进入节点 2 并安装 gfs 分区,但是只要 ndoe 1 回来,它就会再次获取 ip 地址并安装 gfs 分区,但那时我也可以看到在节点 2 上安装。 这是正确的行为吗?我们可以使用相同的分区从两个节点访问相同的文件吗? 谢谢,本 ...

Admin

Red-Hat Cluster 在节点关闭时不会迁移服务
rhcs

Red-Hat Cluster 在节点关闭时不会迁移服务

我有一个带有两个节点和手动隔离的 RHCS。当我重新启动节点 1(主节点)时,它会自动将两个服务迁移到节点 2。但是当我关闭节点 1 时,它不会发生,我需要使用 fence_ack_manual 来隔离节点 1,然后将服务迁移到节点 2。 为什么会发生这种情况? 谢谢, ...

Admin

RHCS:具有公共存储的 A/A 集群中的 GFS2。使用 rgmanager 配置 GFS
rhcs

RHCS:具有公共存储的 A/A 集群中的 GFS2。使用 rgmanager 配置 GFS

我正在配置一个双节点 A/A 集群,该集群通过 iSCSI 连接一个公共存储,该集群在集群 LVM 上使用 GFS2。到目前为止,我已经准备好了一个简单的配置,但不确定哪种方式才是配置 gfs 资源的正确方法。 以下是 /etc/cluster/cluster.conf 的 rm 部分: <rm> <failoverdomains> <failoverdomain name="node1" nofailback="0" ordered="0" restricted="1"> ...

Admin

Red Hat 集群:两个共享同一虚拟 IP 的服务之一发生故障,导致 IP 地址被破坏
rhcs

Red Hat 集群:两个共享同一虚拟 IP 的服务之一发生故障,导致 IP 地址被破坏

我在 Red Hat 5.5 下创建了一个 2+1 故障转移群集,其中包含 4 个服务,其中 2 个必须在同一节点上运行,共享同一个虚拟 IP 地址。每个节点上的一个服务(称为磁盘1和磁盘2在下面的 cluster.conf 中)需要一个(SAN)磁盘,另一个则不需要(它们被称为nodisk1和nodisk2)。因此,每个节点上应该有一个需要磁盘的服务(磁盘N) 及其对应的不需要磁盘的服务(无磁盘)我正在使用 HA-LVM。 当我关闭(通过 ifdown)连接到 SAN 的两个接口以模拟 SAN 故障时,需要磁盘的服务被禁用,而另一个服务继续运行,正如预期...

Admin

HP ILO 和 Vmware ESXi,如何将 HP ILO 分配给特定的虚拟客户机?
rhcs

HP ILO 和 Vmware ESXi,如何将 HP ILO 分配给特定的虚拟客户机?

我正在使用 RHCS,其中最重要的部分是让隔离适用于我的环境。通常使用物理服务器时,我可以简单地使用 ILO 作为隔离设备。但是,作为 esxi 中的客户机,通过 ILO 隔离发送重启指令实际上会重启主机/物理机。 在 vsphere/esxi 管理部分中,我是否可以将 ILO 分配给特定的 vm 客户机,以便隔离只会影响单个 vm 客户机。 我正在使用最新的 vmware vsphere 虚拟机管理程序。 或者还有其他可靠的击剑选择吗? ...

Admin

间歇性隔离的临时网络证书吊销注意事项
rhcs

间歇性隔离的临时网络证书吊销注意事项

我正在尝试为我正在设计的解决方案确定证书撤销策略(根据客户要求,将使用 Dogtag PKI)。显而易见的选择似乎是使用 CRL 或使用 OCSP。我试图了解两者的实际含义,并选择一种可以支持此特定解决方案的方法。 我认为这里的主要问题是,虽然客户端偶尔会通过网络访问 PKI 基础设施,但它们也需要在隔离的局域网中运行。在此用例中,两个客户端需要能够直接相互验证身份(包括由中央机构检查证书吊销情况),而无需访问 OCSP 响应器等。 这些解决方案(CRL/OCSP)之一是否更适合缓存/离线操作? 将 CRL 描述为黑名单并将 OCSP 描述为白名单(可...

Admin

RHCS 5 NFS 集群节点在重新定位时未释放 TCP 2049
rhcs

RHCS 5 NFS 集群节点在重新定位时未释放 TCP 2049

想象一下,如果您有一个 2 节点 Red Hat NFS 集群;每个节点都是 RHEL5.4 64 位,它们共享一个 SAN LUN 来存储数据。每台服务器上的主接口都是 HA 故障转移绑定(bond0、eth0+eth1),并且有一个用于 NFS 的标准浮动集群资源 IP。集群配置使用标准 Red Hat 工具设置,NFS​​ 在 /etc/sysconfig/nfs 中定义了静态端口,以便通过防火墙工作。到目前为止一切顺利,对吧?非常符合惯例——在服务器或集群设置中没有使用任何古怪或奇怪的东西。 问题的核心是当客户端使用 TCP 挂载导出的 NFSv4...

Admin

Xen 来宾访问 LUN
rhcs

Xen 来宾访问 LUN

我们正在使用 RHEL5.3 和通过 FC 连接的 Clarion SAN。 我们的情况是,我们有许多 LUN 呈现给主机,我们希望动态地将这些 LUN 呈现给 Xen 客户机。我们不确定设置此设置的最佳方法是什么。Xen 客户机将一起形成一个集群,并且只需要将 LUN 用于数据分区,即当它们正在积极运行服务时。 因此,一种方法是始终将所有磁盘提供给所有 Xen 客户端,然后依靠集群软件并自行挂载,这样就不会在两个位置两次挂载磁盘。这听起来有点冒险,而且也不太安全(一个破解的客户端可以看到/销毁所有数据)。 另一种方法是动态地在 dom0 级别添加和删...

Admin