NFSv4“符号链接级别过多”错误

NFSv4“符号链接级别过多”错误

两台机器都运行 Ubuntu 12.04

远程 NFSv4 客户端

$ ls /mnt/storage/aaaaaaa_aaa/bbbb/cccc_ccccc gives this error:
ls: reading directory .: Too many levels of symbolic links

我怎样才能解决这个问题?

当发生错误时,ls 开始列出文件,但是 PHP 却停止了。

在 NFSv4 服务器上

/etc/fstab

/mnt/storage    /srv/storage    none    bind    0 0

/etc/exports

/srv         192.168.1.0/24(rw,async,insecure,no_subtree_check,crossmnt,fsid=0,no_root_squash)
/srv/storage   192.168.1.0/24(rw,async,nohide,insecure,no_subtree_check,no_root_squash)

错误

root@ds:root@ds:/mnt/storage/foreign_dbs/imdb/imdb_htmls# ls -l | head
ls: reading directory .: Too many levels of symbolic links
total 10302840
-rw-r--r-- 1 root root  10484 Jul  5 13:56 0019038.gz
-rw-r--r-- 1 root root  16264 Mar 30 00:31 0259701.gz
-rw-r--r-- 1 root root  13784 Mar 30 14:20 1000000.gz
-rw-r--r-- 1 root root  12741 Mar 30 13:04 1000003.gz
-rw-r--r-- 1 root root  12794 Mar 30 12:40 1000004.gz
-rw-r--r-- 1 root root  13123 Mar 30 12:07 1000005.gz
-rw-r--r-- 1 root root  13183 Mar 30 12:04 1000006.gz
-rw-r--r-- 1 root root  13443 Jul  4 01:16 1000007.gz
-rw-r--r-- 1 root root  12968 Mar 30 11:05 1000008.gz

我在 PHP 中遇到了这个问题。scandir 会返回 1612577.gz 和 1612579.gz,但会跳过 1612578.gz,但它们的文件类型和属性是相同的

这只发生在 nfs 客户端上,在服务器上 100% 有效

答案1

关于问题

当两个或多个文件具有相同的 readdir cookie 时,您可能会遇到问题。

当使用 NFS 文件系统(v3 或 v4)而不是 EXT4 后端且同一目录中有大量文件(超过 50000 个)时,此问题更常见。使用 GlusterFS 而不是 NFS 时也会出现此问题。

附言:当单个目录内只有少数文件时也可能会出现此问题,但最后一种情况的可能性极小。

在这种情况下,Too many levels of symbolic links即使目录中没有符号链接,您也会看到错误。您可以通过验证以下命令不返回任何输出来证明这一点:

find /mnt/storage/aaaaaaa_aaa/bbbb/cccc_ccccc -type l

要检查是否遇到此特定问题,请运行上述命令:

$ ls /mnt/storage/aaaaaaa_aaa/bbbb/cccc_ccccc >/dev/null
ls: reading directory .: Too many levels of symbolic links

之后,检查你的系统日志(/var/log/syslog)中是否有如下条目:

[400000.200000] NFS: directory /mnt/storage/aaaaaaa_aaa/bbbb/cccc_ccccc
contains a readdir loop. Please contact your server vendor.
The file: DDDDDDDDDD has duplicate cookie COOKIE_NUMBER.

该问题与 readdir API 的功能有关readdir,该功能使用 readdir cookie 快速定位目录中的文件。NFS 服务器在与 EXT4 后端通信时使用此 API。

关于重复 cookie 问题(实际上是哈希碰撞问题)的完整而出色的解释可以在以下位置找到:扩大 ext4 的 readdir() cookie

相关的错误报告可以在以下位置找到:NFS 客户端报告名称损坏的“readdir 循环”

如果你可以重新启动系统,那么好消息是,根据 David Hedberg 的说法,此问题已在较新的 Ubuntu 内核版本(>= 3.2.0-60-generic)中得到解决。您可能还需要更新 NFS 服务器(只有 NFS 服务器和内核都更新后,此解决方案才有效)。

附言:如果你真的喜欢操作系统,你可以查看内核/nfs 补丁http://comments.gmane.org - 32/64 位 llseek 哈希

解决方案

更新内核和 NFS 内核服务器并重启系统:

apt-get -y dist-upgrade
reboot

如果您无法重新启动系统,您还可以检测具有重复的 readdir cookie 的文件(检查您的系统日志)并将其移动到另一个目录(或重命名以更改其 cookie/哈希)。

答案2

在某个地方,你有一个指向其父级的符号链接。使用以下命令找到它:

find /mnt/storage -type l -exec ls -l {} \;

一旦你这样做了,你也许就能想出如何纠正它。

相关内容