`find /nfs/server/mount/data[12] -name data_*.gz > /dev/null` 第二次执行时速度慢了 4 倍 - 为什么？

Question

该find命令扫描目录中的条目并获取文件属性以发现子目录并循环扫描它们。find首次运行时，nfs 客户端将发出 READDIR 操作，除了获取目录列表外，还会询问文件属性。这非常高效，因为您只有几个 nfs 请求通过网络传输。第二次运行时，由于目录未更改，因此使用缓存列表。但是，客户端会检查每个文件的文件属性更改，这会增加总执行时间。从技术上讲，文件系统对象类型无法更改（文件永远不会成为目录），但 nfs 客户端不知道应用程序在调用时实际需要哪些属性stat，find命令查询所有文件属性时会使用它。

这听起来有悖常理，但如果你删除文件系统缓存（echo 3 > /proc/sys/vm/drop_cache在 Linux 上），那么在第二次运行时你也会获得更好的性能。

有一个讨论如果您想更深入地了解 Linux 实现的技术细节，请参阅 Linux nfs 邮件列表。

Answer 1

该find命令扫描目录中的条目并获取文件属性以发现子目录并循环扫描它们。find首次运行时，nfs 客户端将发出 READDIR 操作，除了获取目录列表外，还会询问文件属性。这非常高效，因为您只有几个 nfs 请求通过网络传输。第二次运行时，由于目录未更改，因此使用缓存列表。但是，客户端会检查每个文件的文件属性更改，这会增加总执行时间。从技术上讲，文件系统对象类型无法更改（文件永远不会成为目录），但 nfs 客户端不知道应用程序在调用时实际需要哪些属性stat，find命令查询所有文件属性时会使用它。

这听起来有悖常理，但如果你删除文件系统缓存（echo 3 > /proc/sys/vm/drop_cache在 Linux 上），那么在第二次运行时你也会获得更好的性能。

有一个讨论如果您想更深入地了解 Linux 实现的技术细节，请参阅 Linux nfs 邮件列表。

`find /nfs/server/mount/data[12] -name data_*.gz > /dev/null` 第二次执行时速度慢了 4 倍 - 为什么？

答案1

相关内容