pacemaker 无法在第二个节点上启动 MySQL

Question

过去，当我必须使用起搏器时，我会使用几种不同的程序来排除此类故障。一般的想法是验证起搏器配置的每个依赖“层”，其中依赖关系图如下：

mysql -> mounting of filesystem -> DRBD master

还从头开始构建集群对非常相似的配置有一个很好的演练。

首先要确保 DRBD 已配置并同步。在任一节点上运行：

cat /proc/drbd

如果 DRBD 完全同步并准备好进行故障转移，则输出应显示类似以下内容（请参阅 CfS 第 45 页）：

[root@pcmk-1 ~]# cat /proc/drbd
version: 8.4.6 (api:1/proto:86-101)
GIT-hash: 833d830e0152d1e457fa7856e71e11248ccf3f70 build by phil@Build64R7, 2015-04-10
 05:13:52
 1: cs:Connected ro:Primary/Secondary ds:UpToDate/UpToDate C r-----
    ns:1048508 nr:0 dw:0 dr:1049420 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:0

如果

cat /proc/drbd

输出类似的内容（也在 CfS 第 45 页上）

[root@ovz-node1 ~]# cat /proc/drbd
version: 0.7.17 (api:77/proto:74)
SVN Revision: 2093 build by phil@mescal, 2006-03-06 15:04:12
 0: cs:SyncSource st:Primary/Secondary ld:Consistent
    ns:627252 nr:0 dw:0 dr:629812 al:0 bm:38 lo:640 pe:0 ua:640 ap:0
        [=>..................] sync'ed:  6.6% (8805/9418)M
        finish: 0:04:51 speed: 30,888 (27,268) K/sec

那么系统就无法成功进行故障转移。等待故障转移完成，然后重试故障转移测试。

假设在模拟 node1 故障之前 DRBD 已同步，当 DB 未在 node2 上运行时，故障转移到 node2 后要尝试的下一步是登录到 node2 并检查以下内容：

是否cat /proc/drbd显示 node2 为主节点？
是否mount显示 /dev/drbd0 安装在其配置的挂载点（从 pastebin 来看，这应该是 '/sync'）？
所有预期的符号链接都已设置吗？
您是否看到节点 2 上的 /sync 中的文件与故障转移之前节点 1 上的文件相同？

最重要的是，如果所有这些问题的答案都是肯定的：

在 node2 上手动启动 MySQL 时（可能使用/etc/init.d/mysql start或 systemctl 等效）是否可以成功启动？
如果 MySQL 启动，mysql 客户端是否显示正在运行的服务器实际上正在提供存储在 /sync 下的 DB 数据？是否可以使用 node2 上的 mysql 客户端访问已知在 node1 上运行的数据库和表？

如果 MySQL 手动启动，那么它的起搏器配置可能有问题。

全面披露：我个人没有使用过 ocf::heartbeat:mysql 资源；而是使用了“lsb”资源“lsb:mysql”。

Answer 1