可以使用wget下载URL处的资源吗?

可以使用wget下载URL处的资源吗?

为什么我无法使用 wget 下载文件:

$ wget http://www.abook.cn/pdf/H-0552.0101.pdf
--2020-07-26 09:46:28--  http://www.abook.cn/pdf/H-0552.0101.pdf
Resolving www.abook.cn (www.abook.cn)... 103.59.150.133
Connecting to www.abook.cn (www.abook.cn)|103.59.150.133|:80... failed: Connection timed out.
Retrying.

--2020-07-26 09:48:40--  (try: 2)  http://www.abook.cn/pdf/H-0552.0101.pdf
Connecting to www.abook.cn (www.abook.cn)|103.59.150.133|:80... failed: Connection timed out.
Retrying.

--2020-07-26 09:50:52--  (try: 3)  http://www.abook.cn/pdf/H-0552.0101.pdf
Connecting to www.abook.cn (www.abook.cn)|103.59.150.133|:80... 

但我可以将资源保存在 URL 中回程机器

wget 是否可以像 wayback machine 一样用于下载 URL 上的资源?如果不能的话还有什么其他工具可以呢?

答案1

好吧,您提供的“The Wayback Machine”链接是一个 HTML 页面,您想要wget https://web.archive.org/web/20200726034218if_/http://www.abook.cn/pdf/H-0552.0101.pdf

这可以通过查看页面源代码并找到加载 PDF 的 iframe 来找到,<iframe id="playback" src=

我个人建议您将此文件存储在您自己的网络服务器、CDN 等上 - 然后从那里提取它。

相关内容