Firefox 的加载速度非常慢,所以我决定使用wget
它来保存 HTML 文件。我使用了以下命令,
wget http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter
文件已保存在我的主文件夹中。但我不知道图像存储在哪里。我需要它们在 中使用Anki
。
那么图像存储在哪里?
答案1
我更喜欢使用--page-requisites
(-p
简称)而不是-r
这里,因为它会下载页面需要显示的所有内容,但不下载其他页面,而且我不必考虑我想要什么类型的文件。
实际上我通常使用类似
wget -E -H -k -p http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter
这意味着:
-E
:.html
如果文件是 HTML 文件但不以.html
或类似结尾,则附加到文件名-H
:也从其他主机下载文件-k
:下载后,转换其中的任何链接,使其指向下载的文件-p
:下载页面所需的任何内容,以便离线正常查看
答案2
使用 -r 参数应该允许 wget 下载整个文件夹,包括您的图像。
wget -r http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter
答案3
单独下载图像文件
我认为这个命令可以帮助你入门。
wget -r -P /save/location -A jpeg,jpg,bmp,gif,png http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter
它允许您指定保存图像的位置以及所需的文件类型。这样下载图像可能更容易。
来源:
-r 启用递归检索。有关更多信息,请参阅递归下载。
-P 设置保存所有文件和目录的目录前缀。
-A 设置仅检索特定文件类型的白名单。接受字符串和模式,并且两者都可以在逗号分隔的列表中使用(如上所示)。有关更多信息,请参阅文件类型。
从文件夹复制图像文件
我注意到该网站使用 PNG 图像文件。您可以从文件夹中复制这些文件。这应该在您存储网页的文件夹中运行。
find . -name "*.png" -exec cp '{}' ./some_dir/somewhere/ \;
答案4
wget
仅下载页面的 HTML 文件,而不是页面中的图像,因为页面 HTML 文件中的图像以 URL 形式写出。要执行所需的操作,请使用-r
(递归)、-A
带有图像文件后缀的选项、--no-parent
使其不上升的选项以及--level
带有 的选项1
。
具体来说wget -r -A .jpg,.png,.gif --no-parent --level <url>
更好的是,大多数浏览器有保存页面以供离线查看的方法。