在 Perl 中检测叶目录

Question 1

你可以这样做：

perl -MFile::Find -le '
  find(sub { 
         if (-d _) {
           undef $leaves{$File::Find::name};
           delete $leaves{$File::Find::dir};
         }
       }, ".");
  print for keys %leaves'

undef将当前目录的哈希元素设置为一个undef值，同时delete删除父目录的哈希元素。所以最后哈希的键%leaves只包含叶子。

对于，我们将重用对当前文件执行的信息，因此不会执行-d _额外的/ 。对于alone，将执行额外的(not )，这意味着它也会为目录的符号链接返回 true。lstat()File::Findlstat()stat()-dstat()lstat()

虽然它在我的测试中有效，但它可能不是一个有效且面向未来的事情。文档说：

[与“follow”]保证统计数据在调用用户的“wanted()”函数之前已被调用。这可以实现涉及“_”的快速文件检查。请注意，如果出现以下情况，则此保证不再成立：跟随或者快速跟随没有设置。

这样做if (! -l && -d _)可能会更安全，但代价是lstat()为每个文件执行额外的操作。

Answer

你可以这样做：

perl -MFile::Find -le '
  find(sub { 
         if (-d _) {
           undef $leaves{$File::Find::name};
           delete $leaves{$File::Find::dir};
         }
       }, ".");
  print for keys %leaves'

undef将当前目录的哈希元素设置为一个undef值，同时delete删除父目录的哈希元素。所以最后哈希的键%leaves只包含叶子。

对于，我们将重用对当前文件执行的信息，因此不会执行-d _额外的/ 。对于alone，将执行额外的(not )，这意味着它也会为目录的符号链接返回 true。lstat()File::Findlstat()stat()-dstat()lstat()

虽然它在我的测试中有效，但它可能不是一个有效且面向未来的事情。文档说：

[与“follow”]保证统计数据在调用用户的“wanted()”函数之前已被调用。这可以实现涉及“_”的快速文件检查。请注意，如果出现以下情况，则此保证不再成立：跟随或者快速跟随没有设置。

这样做if (! -l && -d _)可能会更安全，但代价是lstat()为每个文件执行额外的操作。

Question 2

只是一些想法。我不是 perl 大师，所以不确定 File::Find 能做什么，所以我转向 shell 'find'。

find / -type d -print

打印出从“/”开始的目录列表，因此这是基本列表。我非常怀疑你能否提高 Perl 的速度，尽管 C 应用程序可能可以做到。我怀疑这会是为了微不足道的利益而浪费精力。

GNU find 有一个选项“-printf”，它接受“%h”标志来打印出父目录。因此，您可以做的是同时 -printf 路径 %p 和父路径 %h，然后在 perl 中将父路径拆分到一个新列表中。现在您有了一个不是叶子的路径列表，因此从 %p 列表中删除这些路径，然后就完成了。

遗憾的是 MacOS 没有 GNU 版本，只有一个较低版本。你可以使用 'brew' 安装 GNU find，但是直接在 perl 中从 %p 行创建 %h 的效果并不太难。

最后要注意的一件事。在某些情况下，依赖于管道或类似路径名的换行终止已知会出现错误，因此 GNU find 和（我认为）MacOS find 都对由 \0 而不是 \n 分隔的行提供零终止选项。如果你能使用它，就这样做。

Answer