我在虚拟集群中运行虚拟 ubuntu 20.04.6 LTS 节点,并且拥有三个 nfs 共享,在所有实例之间共享。所有其他节点都在 CentOS 流上运行,但这个节点包含两个 GV100 GPU,在 ubuntu 中管理 nvidia 软件似乎总是更容易,因此设置很奇怪。
昨天我运行了标准版apt update/upgrade
,并将一些其他工具nfs-common
更新到版本 1.3.4-2.5ubuntu3.5。从那时起,我就无法再连接到 NFS 共享。每当我尝试时,我都会得到一个 mount.nfs 超时。我很确定这是一个客户端问题,因为所有其他 (CentOS) 节点仍然可以像往常一样连接到共享。
我意识到 nfs-common 服务在此之后被屏蔽了,所以我取消屏蔽并重新启动了它,但没有帮助,所以我清除了 nfs common,重新启动了实例,重新安装它并再试一次,但问题仍然存在。
据我所知,最常见的错误是 nfs 服务器的 IP 错误,但此后我再也没有更改 fstab,只是从那里复制路径进行试验mount -fav
,所以我认为这不是我的问题。当我systemctl status nfs-common
不时检查时,我会收到这个我无法理解的警告
Dec 05 15:24:52 gpu systemd[1]: Starting LSB: NFS support files common to client and server...
Dec 05 15:24:52 gpu nfs-common[2464]: * Starting NFS common utilities
Dec 05 15:24:52 gpu rpc.statd[2488]: Version 1.3.3 starting
Dec 05 15:24:52 gpu sm-notify[2489]: Version 1.3.3 starting
Dec 05 15:24:52 gpu rpc.statd[2488]: Failed to read /var/lib/nfs/state: Success
Dec 05 15:24:52 gpu rpc.statd[2488]: Initializing NSM state
Dec 05 15:24:52 gpu nfs-common[2464]: ...done.
Dec 05 15:24:52 gpu systemd[1]: Started LSB: NFS support files common to client and server.
但我不确定这是否相关。当我运行 systemctl restart 时它也会消失nfs-common
。
我没有运行 nfs-shares 的服务器的管理权限,但正如前面提到的,我不认为这是服务器端的问题,因为所有其他节点都运行良好。是否还有其他服务或配置需要我确保正确设置才能使 nfs 客户端正常工作?
请给我一些建议,提前谢谢。
编辑:这是我的 fstab 条目的样子
server:/path/share1 /mnt/work_data nfs rw,vers=4.0 0 0
server:/path/share2 /mnt/raw_data nfs rw,vers=4.0 0 0
server:/path/share3 /mnt/tools nfs rw,vers=4.0 0 0