请原谅英语:-)
我正在安装 IBM 平台 HPC v4.2 以在高可用性模式下进行学习。
我的实验室是:
- 物理机Fedora 25:用于共享存储的nfs3
- VM1:管理器1:RHEL 6.5
- VM2:管理器2:RHEL 6.5
安装过程如下:
- 在第一个管理器上安装 phpc:manager1
- 在第二个管理器上安装 phpc:manager2(使用相同的选项)
- 为 HA 配置 NFS3 共享(主目录和数据)
- 触发 manager1 上的 HA 安装
所有这些步骤均已成功完成,但在 HA 安装结束时,我无法登录 phpc webmin 界面,出现一些未运行的服务/守护进程的错误。
经过一番挖掘,我发现了问题,我想我至少有:-)
问题来自 ActiveMQ 进程,该进程启动但未绑定到其端口(61616)。 - 该端口是免费的并在防火墙上打开。
activemq进程使用/opt/pcm/activemq/data来存储它的日志文件、pid文件和包含它的数据库的kahadb目录(我对activemq不太了解)。
在 HA 模式下,数据目录被复制到 nfs3 共享中,安装在 /shared_phpc/opt/pcm/activemq/data 上,并在 /opt/pcm/activemq/data 上的两个管理器上创建一个符号链接以指向该目录。
/opt/pcm/activemq/data -> /shared_phpc/opt/pcm/activemq/data
如果我重命名符号链接并使用真实目录(由 HA 安装程序备份),activemq 进程将成功启动,但如果我使用符号链接,它就不会启动,它会启动但不会绑定到它的端口。
我什至删除了共享数据目录上的所有文件,看看是否是访问权限问题,但事实并非如此,activemq进程启动,重新创建其日志文件、pid文件、kahadb目录、lock文件kahadb 目录,但它不会创建 kahadb 文件,并且无法正常启动。
我的日志文件中没有错误消息,我现在不知道去哪里查看。
提前致谢。