我尝试使用 CentOS High Availability 安装一个小型 GlusterFS(用于 NFS)集群。我真的不知道为什么会失败。我从头开始多次。我的问题是,我看不到任何错误,例如“DNS 无法解析”或“连接失败”。什么都没有。
基本上,我有一个 Proxmox Infracutre 作为底层。我使用 CentOS 7.2 创建了 3 个虚拟机,其中包括:
1 x vNic(连接到网桥)8 GB RAM 30GB 操作系统磁盘 50GB 存储磁盘安装在 /data/disk01/archive 中。
- 我为 glusterfs 系统拥有自己的 /29 子网。
- 本地防火墙已禁用并停止(iptablels 已允许全部)
- SELINUX 已禁用
- 搜索域是“staging.mydomain.ending”
- DNS 服务器可以解析主机名
- 我还将主机名和主机名+域添加到 /etc/hosts (因此我可以保证,dns 正常运行)
至少,我遵循了本教程:https://jamesnbr.wordpress.com/2017/01/26/glusterfs-and-nfs-with-high-availability-on-centos-7/ 但可以肯定的是,我又尝试了一些。但它们都是一样的,并没有太大的区别。
第一个问题:GlusterFS NFS
我可以按照教程中所述成功安装该卷:
Volume Name: rdxarchive
Type: Replicate
Volume ID: dfe190c8-b4fd-413e-9b58-214c4f295cba
Status: Created
Snapshot Count: 0
Number of Bricks: 1 x 3 = 3
Transport-type: tcp
Bricks:
Brick1: fra1-glusterfs-m01:/data/disk01/archive
Brick2: fra1-glusterfs-m02:/data/disk01/archive
Brick3: fra1-glusterfs-m03:/data/disk01/archive
Options Reconfigured:
performance.client-io-threads: off
nfs.disable: off
transport.address-family: inet
storage.fips-mode-rchecksum: on
但我无法挂载 NFS。
[18:48:44 root@fra1-glusterfs-m01]{~}>showmount
clnt_create: RPC: Program not registered
RPC 绑定正在工作:
[18:49:10 root@fra1-glusterfs-m01]{~}>systemctl status rpcbind
● rpcbind.service - RPC bind service
Loaded: loaded (/usr/lib/systemd/system/rpcbind.service; enabled; vendor preset: enabled)
Active: active (running) since Sun 2020-11-01 17:42:11 CET; 1h 7min ago
Process: 637 ExecStart=/sbin/rpcbind -w $RPCBIND_ARGS (code=exited, status=0/SUCCESS)
Main PID: 646 (rpcbind)
CGroup: /system.slice/rpcbind.service
└─646 /sbin/rpcbind -w
Nov 01 17:42:11 fra1-glusterfs-m01.staging.mydomain.ending systemd[1]: Starting RPC bind service...
Nov 01 17:42:11 fra1-glusterfs-m01.staging.mydomain.ending systemd[1]: Started RPC bind service.
并且我肯定没有本地 NFS 服务器(只有 nfs-uitls)。
知道发生什么问题了吗?
第二个问题:Pacemaker 和 Corosync。
我按照教程中所述创建了集群。没有出现任何错误。身份验证、连接、创建。一切正常。
集群状态为绿色:
[18:55:22 root@fra1-glusterfs-m01]{~}>pcs cluster status
Cluster Status:
Stack: corosync
Current DC: fra1-glusterfs-m01 (version 1.1.21-4.el7-f14e36fd43) - partition WITHOUT quorum
Last updated: Sun Nov 1 18:55:49 2020
Last change: Sun Nov 1 17:23:13 2020 by root via cibadmin on fra1-glusterfs-m01
3 nodes configured
1 resource configured
PCSD Status:
fra1-glusterfs-m01: Online
fra1-glusterfs-m02: Online
fra1-glusterfs-m03: Online
正常状态请求失败,三个节点中有两个处于离线状态。只有本地节点处于在线状态:
[18:55:50 root@fra1-glusterfs-m01]{~}>pcs status
Cluster name: rdxfs
Stack: corosync
Current DC: fra1-glusterfs-m01 (version 1.1.21-4.el7-f14e36fd43) - partition WITHOUT quorum
Last updated: Sun Nov 1 18:56:24 2020
Last change: Sun Nov 1 17:23:13 2020 by root via cibadmin on fra1-glusterfs-m01
3 nodes configured
1 resource configured
Online: [ fra1-glusterfs-m01 ]
OFFLINE: [ fra1-glusterfs-m02 fra1-glusterfs-m03 ]
Full list of resources:
virtual_ip (ocf::heartbeat:IPaddr2): Started fra1-glusterfs-m01
Daemon Status:
corosync: active/enabled
pacemaker: active/enabled
pcsd: active/enabled
Corosync 日志:https://pastebin.com/TBC8yxHK
知道那里出了什么问题吗?为什么两个节点离线?我可以调试谁?日志中的错误在哪里?
当我使用 IP 而不是 DNS 创建集群时,corosync 和 pacemaker 似乎可以工作。但是我在使用“pcs status”时收到警告,提示有节点具有 IP 和 DNS。当我登录“Radhat High Availability”GUI 时,我可以看到 6 个节点而不是 3 个:3 个具有 IP 的节点和 3 个具有 DNS 的节点。在具有 IP 的节点上,corosync 已连接且为绿色(Pacemaker 未成功)。在具有 DNS 的节点上,corosync 失败,而 Pacemaker 已连接且成功)。
版本:
[19:01:36 root@fra1-glusterfs-m01]{~}>gluster --version
glusterfs 8.1
Repository revision: git://git.gluster.org/glusterfs.git
Copyright (c) 2006-2016 Red Hat, Inc. <https://www.gluster.org/>
GlusterFS comes with ABSOLUTELY NO WARRANTY.
It is licensed to you under your choice of the GNU Lesser
General Public License, version 3 or any later version (LGPLv3
or later), or the GNU General Public License, version 2 (GPLv2),
in all cases as published by the Free Software Foundation.
[19:01:41 root@fra1-glusterfs-m01]{~}>pcs --version
0.9.168
[19:02:20 root@fra1-glusterfs-m01]{~}>corosync -v
Corosync Cluster Engine, version '2.4.5'
Copyright (c) 2006-2009 Red Hat, Inc.
Linux fra1-glusterfs-m01.staging.mydomain.ending 3.10.0-1127.18.2.el7.x86_64 #1 SMP Sun Jul 26 15:27:06 UTC 2020 x86_64 x86_64 x86_64 GNU/Linux
希望我能得到一些帮助。
谢谢。