我正在一个网站上运行 wget(我已经意识到)有两种语言 - 以及每种语言的重复页面。我已经获得了英文内容,因此我想阻止 wget 下载更多内容。我在运行它时指定了 -k 开关,那么如果我在 wget 完全下载所有内容之前停止它,它会照常将链接转换为相对链接吗?或者它会停止吗?
(StackExchange 网络上还有另一个问题,该问题通过运行强制 wget 转换已下载内容上的链接
wget -nc -k [previous options] [previous url]
但时间戳被意外关闭,因此这不是一个选项。)
答案1
不。
下载完成后才会应用 -k 选项。
如果取消 wget(即 ctrl+c),则不会调用 -k 选项。
当 wget 完成时您可以看到这一点,最后一步是链接的转换。
它最后会告诉您它转换了多少个 .html 文件。他们的时间戳也会在此过程中更新。
更新: 尝试使用 -R 选项排除使用不同语言的文件。但这仅在文件具有使它们一致唯一的东西时才有效。
尝试例如:
-R*_en*.htm*
这将排除以 .htm 或 .html 结尾且路径中某处具有 _en 的文件。我使用下划线或其他东西缓冲“en”部分,因为我不想排除仅包含“en”的文件。
但这仅在文件命名一致的情况下才有效。