wget - 仅获取每个子目录中的 .listing 文件

Question 1

如果您希望建立 FTP 站点的索引，即列出站点上的所有子目录和文件而不实际检索它们，您可以执行以下操作：

wget -r -x --no-remove-listing --spider ftp://ftp.example.com/

在哪里，

-r => 递归（即访问子目录）
-x => 强制在客户端上创建镜像子目录
--no-remove-listing => 在每个子目录中保留“.listing”文件
--spider => 访问但不检索文件

这将在客户端和服务器上创建一个结构相同的稀疏目录树，其中仅包含显示每个目录内容的“.listing”文件（“ls -l”的结果）。如果您想将其分解为一个路径限定文件名列表（就像您从“find . -type f”中获得的一样），请在该稀疏目录树的根目录中执行以下操作：

find . -type f -exec dos2unix {} \;
( find . -maxdepth 999 -name .listing -exec \
awk '$1 !~ /^d/ {C="date +\"%Y-%m-%d %H:%M:%S\" -d \"" $6 " " $7 " " $8 "\""; \
C | getline D; printf "%s\t%12d\t%s%s\n", D, $5, gensub(/[^/]*$/,"","g",FILENAME), $9}' \
{} \; 2>/dev/null ) | sort -k4

这将给你类似的输出

2000-09-27 00:00:00       261149    ./README
2000-08-31 00:00:00       727040    ./foo.txt
2000-10-02 00:00:00      1031115    ./subdir/bar.txt
2000-11-02 00:00:00      1440830    ./anotherdir/blat.txt

注意：在此用例中，“-maxdepth 999”选项不是必需的，我将其留在了我正在测试的调用中，该调用有一个额外的约束：限制报告的树的深度。例如，如果您扫描包含多个项目的完整源树的站点，例如

./foo/Makefile
./foo/src/...
./foo/test/...
./bar/Makefile
./bar/src/...
./bar/test/...

那么您可能只需要项目和顶级目录的概要。在这种情况下，您可以给出类似“-maxdepth 2”的选项。

Answer