为什么我无法使用 wget 下载文件:
$ wget http://www.abook.cn/pdf/H-0552.0101.pdf
--2020-07-26 09:46:28-- http://www.abook.cn/pdf/H-0552.0101.pdf
Resolving www.abook.cn (www.abook.cn)... 103.59.150.133
Connecting to www.abook.cn (www.abook.cn)|103.59.150.133|:80... failed: Connection timed out.
Retrying.
--2020-07-26 09:48:40-- (try: 2) http://www.abook.cn/pdf/H-0552.0101.pdf
Connecting to www.abook.cn (www.abook.cn)|103.59.150.133|:80... failed: Connection timed out.
Retrying.
--2020-07-26 09:50:52-- (try: 3) http://www.abook.cn/pdf/H-0552.0101.pdf
Connecting to www.abook.cn (www.abook.cn)|103.59.150.133|:80...
但我可以将资源保存在 URL 中回程机器?
wget 是否可以像 wayback machine 一样用于下载 URL 上的资源?如果不能的话还有什么其他工具可以呢?
答案1
好吧,您提供的“The Wayback Machine”链接是一个 HTML 页面,您想要wget https://web.archive.org/web/20200726034218if_/http://www.abook.cn/pdf/H-0552.0101.pdf
这可以通过查看页面源代码并找到加载 PDF 的 iframe 来找到,<iframe id="playback" src=
我个人建议您将此文件存储在您自己的网络服务器、CDN 等上 - 然后从那里提取它。