重启后出现“过时的 NFS 文件句柄”

重启后出现“过时的 NFS 文件句柄”

在服务器节点上,可以访问导出的文件夹。但是,重新启动(服务器和客户端)后,客户端将无法再访问该文件夹。

在服务器上

# ls /data
Folder1
Forlder2

/etc/exports 文件包含

/data 192.168.1.0/24(rw,no_subtree_check,async,no_root_squash)

在客户端

# ls /data
ls: cannot access /data: Stale NFS file handle

我不得不说,客户端的共享文件夹没有问题,但是重新启动(服务器和客户端)后,我看到此消息。

有什么办法可以解决这个问题吗?

答案1

重启的顺序很重要。在客户端之后重启服务器可能会导致这种情况。过时的 NFS 句柄表示客户端打开了一个文件,但服务器不再识别该文件句柄。在某些情况下,NFS 会在超时后清理其数据结构。在其他情况下,您需要自己清理 NFS 数据结构,然后重新启动 NFS。这些结构的位置在某种程度上取决于操作系统。

尝试先在服务器上重新启动 NFS,然后在客户端上重新启动。这可能会清除文件句柄。

不建议在打开了其他服务器的文件的情况下重启 NFS 服务器。如果服务器上已删除打开的文件,则这尤其成问题。服务器可能会保持文件打开直到重启,但重启将删除服务器端的内存文件句柄。然后客户端将无法再打开该文件。

确定服务器上使用了哪些挂载点非常困难且不可靠。该showmount -a选项可能会显示一些活动挂载点,但可能不会报告所有挂载点。锁定文件更容易识别,但需要启用锁定功能,并依赖客户端软件来锁定文件。

您可以lsof在客户端上使用来识别在挂载点打开文件的进程。

我在 NFS 挂载上使用hard和挂载选项。该选项会导致无限期重试 IO。如果进程正在等待 NFS IO 完成,则该选项允许终止这些进程。 intrhardintr

答案2

试试我写的这个脚本:

#!/bin/bash
# Purpose:
# Detect Stale File handle and remove it
# Script created: July 29, 2015 by Birgit Ducarroz
# Last modification: --
#

# Detect Stale file handle and write output into a variable and then into a file
mounts=`df 2>&1 | grep 'Stale file handle' |awk '{print ""$2"" }' > NFS_stales.txt`
# Remove : ‘ and ’ characters from the output
sed -r -i 's/://' NFS_stales.txt && sed -r -i 's/‘//' NFS_stales.txt && sed -r -i 's/’//' NFS_stales.txt

# Not used: replace space by a new line
# stales=`cat NFS_stales.txt && sed -r -i ':a;N;$!ba;s/ /\n /g' NFS_stales.txt`

# read NFS_stales.txt output file line by line then unmount stale by stale.
#    IFS='' (or IFS=) prevents leading/trailing whitespace from being trimmed.
#    -r prevents backslash escapes from being interpreted.
#    || [[ -n $line ]] prevents the last line from being ignored if it doesn't end with a \n (since read returns a non-zero exit code when it encounters EOF).

while IFS='' read -r line || [[ -n "$line" ]]; do
    echo "Unmounting due to NFS Stale file handle: $line"
    umount -fl $line
done < "NFS_stales.txt"
#EOF

同时,上述脚本并不适用于所有服务器。以下是更新内容:

#!/bin/bash
# Purpose:
# Detect Stale File handle and remove it
# Script created: July 29, 2015 by Birgit Ducarroz
# Last modification: 23.12.2020  /bdu
#

MYMAIL="[email protected]"
THIS_HOST=`hostname`

# Detect Stale file handle and write output into a variable and then into a file
mounts=`df 2>&1 | grep 'Stale' |awk '{print ""$2"" }' > NFS_stales.txt`
sleep 8

# Remove : special characters from the output

sed -r -i 's/://' NFS_stales.txt && sed -r -i 's/‘//' NFS_stales.txt && sed -r -i 's/’//' NFS_stales.txt && sed -r -i 's/`//' NFS_stales.txt  && sed -r -i "s/'//" NFS_stales.txt 


# Not used: replace space by a new line
# stales=`cat NFS_stales.txt && sed -r -i ':a;N;$!ba;s/ /\n /g' NFS_stales.txt`

# read NFS_stales.txt output file line by line then unmount stale by stale.
#    IFS='' (or IFS=) prevents leading/trailing whitespace from being trimmed.
#    -r prevents backslash escapes from being interpreted.
#    || [[ -n $line ]] prevents the last line from being ignored if it doesn't end with a \n (since read returns a non-zero exit code when it encounters EOF).

while IFS='' read -r line || [[ -n "$line" ]]; do
    message=`echo "Unmounting due to NFS Stale file handle: $line"`
    echo echo | mail -s "$THIS_HOST: NFS Stale Handle unmounted" $MYMAIL <<< $message
    umount -f -l $line
done < "NFS_stales.txt"
mount -a

#EOF

答案3

在 NFS 服务器上取消导出并重新导出文件系统:

exportfs -u nfs 服务器:/文件系统 exportfs nfs 服务器:/文件系统

在客户端上挂载文件系统

mount -t nfs nfs 服务器:/文件系统/挂载点

答案4

检查特定路径的 lsof 并杀死相应的 pid 。然后卸载分区并将其重新挂载。

相关内容