网络故障后 Ceph 无法自动挂载

网络故障后 Ceph 无法自动挂载

我在 Debian 机器上安装 ceph 集群时遇到了一些问题,不知道我是否做错了什么,是版本问题还是其他问题。

我正在使用来自 OVH 的 ceph 集群,然后使用 fstab 在大约 20 个 vm(2 个裸机服务器,每个服务器上都有一个 proxmox 实例)上进行安装。

当 ceph 集群和我们的裸机之间出现网络故障时,就会出现问题,从那时起,ceph 的挂载就完全无法使用了。正在使用的版本,只有我重新启动服务器才能恢复使用。

  • Ceph 集群:14.2.16
  • Debian 10 Buster
  • Ceph 安装在 Debian 上:14.2.21 nautiles(稳定版)

Ceph 配置:

[global]
fsid = xxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx
mon_host = XX.XX.XXX.XX XX.XX.XXX.XX XX.XX.XXX.XX

fstab 配置:

:/     /mnt/ceph     ceph     name=ceph_user,_netdev,noatime        0     0

跑步mount

xx.xx.xx.xx:6789,xx.xx.xx.xx:6789,xx.xx.xx.xx:6789:/ on /mnt/ceph type ceph (rw,noatime,name=ceph_user,secret=<hidden>,acl)

刚刚进行编辑,因此添加更多信息:

发生这种情况时,我尝试 ls 文件夹 /mnt/ 时出现以下内容:

d????????? ? ?    ?       ?            ? ceph

如果我尝试mount -a

mount error 16 = Device or resource busy

来自 /var/log/messages 的日志:

Jul 23 21:48:27 prod7-2 kernel: [28344.425057] libceph: mon2 xx.xx.xxx.xx:6789 session lost, hunting for new mon
Jul 23 21:48:27 prod7-2 kernel: [28344.427340] libceph: mon1 xx.xx.xxx.xx:6789 session established
Jul 23 21:48:54 prod7-2 kernel: [28371.560529] ceph: mds0 caps stale
Jul 23 21:52:53 prod7-2 kernel: [28610.660328] ceph: mds0 hung
Jul 23 21:53:25 prod7-2 kernel: [28642.659775] libceph: mon1 xx.xx.xxx.xx:6789 session lost, hunting for new mon
Jul 23 21:53:25 prod7-2 kernel: [28642.677667] libceph: mon0 xx.xx.xxx.xx:6789 session established
Jul 23 21:53:39 prod7-2 kernel: [28656.231175] libceph: mds0 xx.xx.xxx.xx:6801 socket closed (con state OPEN)
Jul 23 21:53:40 prod7-2 kernel: [28657.459175] libceph: reset on mds0
Jul 23 21:53:40 prod7-2 kernel: [28657.459179] ceph: mds0 closed our session
Jul 23 21:53:40 prod7-2 kernel: [28657.459180] ceph: mds0 reconnect start
Jul 23 21:53:40 prod7-2 kernel: [28657.498027] ceph: mds0 reconnect denied
Jul 23 21:53:40 prod7-2 kernel: [28657.513419] libceph: mds0 xx.xx.xxx.xx:6801 socket closed (con state NEGOTIATING)
Jul 23 21:53:41 prod7-2 kernel: [28658.454421] ceph: mds0 rejected session

我做错了吗?谢谢

相关内容