在服务器节点上,可以访问导出的文件夹。但是,重新启动(服务器和客户端)后,客户端将无法再访问该文件夹。
在服务器上
# ls /data
Folder1
Forlder2
/etc/exports 文件包含
/data 192.168.1.0/24(rw,no_subtree_check,async,no_root_squash)
在客户端
# ls /data
ls: cannot access /data: Stale NFS file handle
我不得不说,客户端的共享文件夹没有问题,但是重新启动(服务器和客户端)后,我看到此消息。
有什么办法可以解决这个问题吗?
答案1
重启的顺序很重要。在客户端之后重启服务器可能会导致这种情况。过时的 NFS 句柄表示客户端打开了一个文件,但服务器不再识别该文件句柄。在某些情况下,NFS 会在超时后清理其数据结构。在其他情况下,您需要自己清理 NFS 数据结构,然后重新启动 NFS。这些结构的位置在某种程度上取决于操作系统。
尝试先在服务器上重新启动 NFS,然后在客户端上重新启动。这可能会清除文件句柄。
不建议在打开了其他服务器的文件的情况下重启 NFS 服务器。如果服务器上已删除打开的文件,则这尤其成问题。服务器可能会保持文件打开直到重启,但重启将删除服务器端的内存文件句柄。然后客户端将无法再打开该文件。
确定服务器上使用了哪些挂载点非常困难且不可靠。该showmount -a
选项可能会显示一些活动挂载点,但可能不会报告所有挂载点。锁定文件更容易识别,但需要启用锁定功能,并依赖客户端软件来锁定文件。
您可以lsof
在客户端上使用来识别在挂载点打开文件的进程。
我在 NFS 挂载上使用hard
和挂载选项。该选项会导致无限期重试 IO。如果进程正在等待 NFS IO 完成,则该选项允许终止这些进程。 intr
hard
intr
答案2
试试我写的这个脚本:
#!/bin/bash
# Purpose:
# Detect Stale File handle and remove it
# Script created: July 29, 2015 by Birgit Ducarroz
# Last modification: --
#
# Detect Stale file handle and write output into a variable and then into a file
mounts=`df 2>&1 | grep 'Stale file handle' |awk '{print ""$2"" }' > NFS_stales.txt`
# Remove : ‘ and ’ characters from the output
sed -r -i 's/://' NFS_stales.txt && sed -r -i 's/‘//' NFS_stales.txt && sed -r -i 's/’//' NFS_stales.txt
# Not used: replace space by a new line
# stales=`cat NFS_stales.txt && sed -r -i ':a;N;$!ba;s/ /\n /g' NFS_stales.txt`
# read NFS_stales.txt output file line by line then unmount stale by stale.
# IFS='' (or IFS=) prevents leading/trailing whitespace from being trimmed.
# -r prevents backslash escapes from being interpreted.
# || [[ -n $line ]] prevents the last line from being ignored if it doesn't end with a \n (since read returns a non-zero exit code when it encounters EOF).
while IFS='' read -r line || [[ -n "$line" ]]; do
echo "Unmounting due to NFS Stale file handle: $line"
umount -fl $line
done < "NFS_stales.txt"
#EOF
同时,上述脚本并不适用于所有服务器。以下是更新内容:
#!/bin/bash
# Purpose:
# Detect Stale File handle and remove it
# Script created: July 29, 2015 by Birgit Ducarroz
# Last modification: 23.12.2020 /bdu
#
MYMAIL="[email protected]"
THIS_HOST=`hostname`
# Detect Stale file handle and write output into a variable and then into a file
mounts=`df 2>&1 | grep 'Stale' |awk '{print ""$2"" }' > NFS_stales.txt`
sleep 8
# Remove : special characters from the output
sed -r -i 's/://' NFS_stales.txt && sed -r -i 's/‘//' NFS_stales.txt && sed -r -i 's/’//' NFS_stales.txt && sed -r -i 's/`//' NFS_stales.txt && sed -r -i "s/'//" NFS_stales.txt
# Not used: replace space by a new line
# stales=`cat NFS_stales.txt && sed -r -i ':a;N;$!ba;s/ /\n /g' NFS_stales.txt`
# read NFS_stales.txt output file line by line then unmount stale by stale.
# IFS='' (or IFS=) prevents leading/trailing whitespace from being trimmed.
# -r prevents backslash escapes from being interpreted.
# || [[ -n $line ]] prevents the last line from being ignored if it doesn't end with a \n (since read returns a non-zero exit code when it encounters EOF).
while IFS='' read -r line || [[ -n "$line" ]]; do
message=`echo "Unmounting due to NFS Stale file handle: $line"`
echo echo | mail -s "$THIS_HOST: NFS Stale Handle unmounted" $MYMAIL <<< $message
umount -f -l $line
done < "NFS_stales.txt"
mount -a
#EOF
答案3
在 NFS 服务器上取消导出并重新导出文件系统:
exportfs -u nfs 服务器:/文件系统 exportfs nfs 服务器:/文件系统
在客户端上挂载文件系统
mount -t nfs nfs 服务器:/文件系统/挂载点
答案4
检查特定路径的 lsof 并杀死相应的 pid 。然后卸载分区并将其重新挂载。