如何从出现“nfs 服务器 *** 没有响应”错误的挂起机器中恢复?

如何从出现“nfs 服务器 *** 没有响应”错误的挂起机器中恢复?
nfs server *** not responding
nfs server *** not responding
nfs server *** not responding
nfs server *** not responding
nfs server *** not responding
nfs server *** not responding

我反复收到此请求,机器挂起。我该如何停止该请求?

我也无法启动新的 ssh 连接。

答案1

您可以尝试使用umount -f强制卸载。根据磁盘活动,它并不总是对我有用;有时我不得不循环机器(除非我可以恢复服务)。

对于未来,您可以研究mount_nfs参数-i(可中断)、-s(软挂载)或-Rn(最大重试次数)适合您的环境。

我无法很快找出这方面的黄金标准,但这里有一些相关项目:

答案2

umount -l /mnt/nfs在这种情况下非常方便,因为它基本上会卸载并稍后询问问题。它的作用是立即地卸载文件系统,并使所有打开的文件挂起。它会尽可能地杀死已挂起的 nfs 安装上的所有打开的文件。

答案3

Mike 的回答是正确的。我想补充一点,这lsof有助于查看哪些进程在 NFS 挂载上打开了文件。我总是必须立即查看kill -9这些 pid 并快速umount -f执行。有时它不起作用,您必须重新启动并重置。

答案4

在这里,达到可以操作 fstab 的程度很重要。

您需要使用救援磁盘启动机器,然后编辑 /etc/fstab 以删除自动安装卷的行。然后您应该能够重新启动机器并进行其他发帖者提到的适当更改。

相关内容