运行一个集群,其中计算节点 NFS 从 LAN 上的头节点挂载文件/home
夹/shared
- 经过一段时间后,节点会丢失对这些文件夹的 NFS 挂载。当您登录到节点并执行操作时,ls -l
文件/home
夹显示为
d???????? ?? ?? /home
如果(作为 root)我这样做,umount -l /home; mount /home
它会立即返回。对于 3 或 4 个其他 NFS 挂载文件夹中的任何一个,但在一段时间后,这些 NFS 挂载都会再次变坏,然后可以mount
按照所述再次恢复。
什么可能导致这样的事情,如何解决要查看哪些文件? /var/log/messages
没有显示任何我可以与这样的问题相关的内容。
这是在 RHEL 7.8 下,并/etc/sysconfig/nfs
返回/etc/nfsmount.conf
到最初安装的文件,导致 NFSv3 发生...或者如果我使用原始 RHEL 文件,其中所有内容都被注释掉(默认设置),则会导致 NFS vers=4.1 发生。不管怎样,我都会遇到 NFS 安装丢失的情况。
答案1
直到我exportfs -f
在 nfs-server 上做了一个它才响应
配置文件第57行错误。
在/etc/nfs.conf
nfs 服务器上,该[nfsd]
行已被注释掉,#
但在下面我rdma=y
没有注释掉。一个明显的错误,但是执行exportfs -arv
并exportfs -s
响应没有错误。在 nfs 客户端上,如果我执行mount /home
从 nfs 服务器(集群头节点)导出的一个文件夹或任何其他文件夹,它就可以工作。但在一段时间后,这些坐骑中的任何一个都会丢失,然后显示为
ls -l /
d???????? ? ? ? /home