下载文件中的网页列表并重命名它们以避免覆盖？

Question 1

您将需要这些index.html文件，因为网页中的各种链接将依赖于它们。我会将每个网页保存到其自己的目录中：

while read url; do
    mkdir "$url";
    cd "$url"
    wget -r -np  -nH --cut-dirs=1 -p -k "$url"
    cd ../
done

事实证明，wget默认情况下已经这样做了，所以使用斯蒂芬的方法反而。

Answer

您将需要这些index.html文件，因为网页中的各种链接将依赖于它们。我会将每个网页保存到其自己的目录中：

while read url; do
    mkdir "$url";
    cd "$url"
    wget -r -np  -nH --cut-dirs=1 -p -k "$url"
    cd ../
done

事实证明，wget默认情况下已经这样做了，所以使用斯蒂芬的方法反而。

Question 2

wgetwith的默认行为-r是将下载的文件存储在与 URL 匹配的目录中，因此您可以让它这样做：

wget -r -np -p -i myurls

（在哪里myurls包含要下载的 URL 的文件在哪里）。

由此产生的大量目录可能不是最令您满意的，但它将确保您拥有显示下载文件所需的一切，并且没有任何内容被覆盖......

Answer

wgetwith的默认行为-r是将下载的文件存储在与 URL 匹配的目录中，因此您可以让它这样做：

wget -r -np -p -i myurls

（在哪里myurls包含要下载的 URL 的文件在哪里）。

由此产生的大量目录可能不是最令您满意的，但它将确保您拥有显示下载文件所需的一切，并且没有任何内容被覆盖......

相关内容