我正在尝试让一些多集群事物在我们的两个 GPFS 集群之间工作。
在“客户端”集群中,当尝试挂载“远程”集群时,我得到:
[root@gpfs2 ~]# mmmount all
Tue Dec 10 18:54:46 IST 2019: mmmount: Mounting file systems ...
mount: mount gpfs2 on /gpfs/storage failed: Connection timed out
[root@gpfs2 ~]# mmmount gpfs2
Tue Dec 10 18:18:55 IST 2019: mmmount: Mounting file systems ...
mount: mount gpfs2 on /gpfs/storage failed: Connection timed out
mmmount: Command failed. Examine previous error messages to determine cause.
[root@gpfs2 ~]# mmmount gpfs1
mmmount: File system gpfs1 is not known to the GPFS cluster.
mmmount: Command failed. Examine previous error messages to determine cause.
mmauth
、mmremotecluster
、mmremotefs
配置正确。
答案1
当一切配置正确时,通常可以正常工作。因此,某些内容可能不太正确。您应该检查客户端集群上的 /var/adm/ras/mmfs.log.latest,以获取有关错误的更多详细信息。
我的第一个猜测是您在客户端集群上的 IP 地址解析存在问题。也许它无法查找存储集群的地址,或者它没有与存储集群的守护程序网络的网络连接?