有人知道我必须使用什么命令来下载包含多个页面的网站的一部分吗(使用 wget)。例如:
我想下载论坛中的某个页面。这个论坛中有一篇关于“stderr”的文章。
地址是 : ”https://forum.ubuntuusers.de/topic/stderr-umleitungen/“ 和 ”https://forum.ubuntuusers.de/topic/stderr-umleitungen/2/“因为它由两页组成。
我想用一个命令下载两个页面,而不是整个论坛。我该如何输入正确的命令?
系统:Linux/Lubuntu 16.04.2 LTS,64位
答案1
wget -Ek https://example.com/foo/bar/{,2}
最后一点{,2}
是括号扩展指示 wget 下载:
https://example.com/foo/bar/ https://example.com/foo/bar/2
要下载第 3 页至第 6 页,请使用以下任一命令:
wget -Ek https://example.com/foo/bar/{3,4,5,6}
wget -Ek https://example.com/foo/bar/{3..6}
还有一些非常有用的wget 选项:-E 和 -k。
-E:如果下载了“text/html”类型的文件,并且 URL 不以正则表达式“\.[Hh][Tt][Mm][Ll]?”结尾,则此选项将导致后缀“.html”附加到本地文件名。
-k:下载完成后,转换文档中的链接,使其适合本地查看(即将相对链接转换为绝对链接)。
请阅读 wget 手册页和手册以获取更多信息。