使用 wget 从文本文件中获取文件名

Question 1

您可以使用 for 循环：

for x in a b c d e f g h ; do
    wget http://url.com/$x.doc
done

可以在 bash 中缩短为

for x in {a..h} ; do
    wget ...
done

但即使没有 for 循环，您也可以使用这个简写：

wget http://url.com/{a..h}.doc

如果名称不连续并且您需要从文件中读取它们，请使用 while 循环：

while read x ; do
    wget http://url.com/$x.doc
done < sourcefile.txt

Answer

您可以使用 for 循环：

for x in a b c d e f g h ; do
    wget http://url.com/$x.doc
done

可以在 bash 中缩短为

for x in {a..h} ; do
    wget ...
done

但即使没有 for 循环，您也可以使用这个简写：

wget http://url.com/{a..h}.doc

如果名称不连续并且您需要从文件中读取它们，请使用 while 循环：

while read x ; do
    wget http://url.com/$x.doc
done < sourcefile.txt

Question 2

如果您已使用相对 URL 创建了文件，则可以执行以下操作：

wget -i /path/to/file -B http://base_url_here

因此，例如，如果您想下载http://www.myfiles.com/*.txt其中*可以有许多不同的内容，例如a，，a_1...，您只需创建一个包含条目的文件

a.txt
a_1.txt
a_2.txt
...

并输入命令：

wget -i /path/to/file -B http://www.myfiles.com

该-i开关指示wget从文件中读取其链接，并且该-B开关指示它将给定参数作为基本 URL 添加到从文件读取的所有链接中。

Answer

如果您已使用相对 URL 创建了文件，则可以执行以下操作：

wget -i /path/to/file -B http://base_url_here

因此，例如，如果您想下载http://www.myfiles.com/*.txt其中*可以有许多不同的内容，例如a，，a_1...，您只需创建一个包含条目的文件

a.txt
a_1.txt
a_2.txt
...

并输入命令：

wget -i /path/to/file -B http://www.myfiles.com

该-i开关指示wget从文件中读取其链接，并且该-B开关指示它将给定参数作为基本 URL 添加到从文件读取的所有链接中。

Question 3

您可以使用httrack下载整个文件目录（基本上镜像站点中的所有内容），或者您可以指定httrack过滤器以及特定的文件扩展名，例如仅下载.pdf文件。

您可以阅读更多有关httrack的过滤能力如果您只想下载以特定方式命名的文件，则需要使用它。

以下是通配符功能的一些示例：

$ httrack http://url.com/files/ -* +1_[a-z].doc -O /dir/to/output

开关如下：

Answer

您可以使用httrack下载整个文件目录（基本上镜像站点中的所有内容），或者您可以指定httrack过滤器以及特定的文件扩展名，例如仅下载.pdf文件。

您可以阅读更多有关httrack的过滤能力如果您只想下载以特定方式命名的文件，则需要使用它。

以下是通配符功能的一些示例：

$ httrack http://url.com/files/ -* +1_[a-z].doc -O /dir/to/output

开关如下：

相关内容