单独下载图像文件

单独下载图像文件

Firefox 的加载速度非常慢,所以我决定使用wget它来保存 HTML 文件。我使用了以下命令,

wget http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

文件已保存在我的主文件夹中。但我不知道图像存储在哪里。我需要它们在 中使用Anki

那么图像存储在哪里?

答案1

我更喜欢使用--page-requisites-p简称)而不是-r这里,因为它会下载页面需要显示的所有内容,但不下载其他页面,而且我不必考虑我想要什么类型的文件。

实际上我通常使用类似

wget -E -H -k -p http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

这意味着:

  • -E.html如果文件是 HTML 文件但不以.html或类似结尾,则附加到文件名
  • -H:也从其他主机下载文件
  • -k:下载后,转换其中的任何链接,使其指向下载的文件
  • -p:下载页面所需的任何内容,以便离线正常查看

答案2

使用 -r 参数应该允许 wget 下载整个文件夹,包括您的图像。

wget -r http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

答案3

单独下载图像文件

我认为这个命令可以帮助你入门。

 wget -r -P /save/location -A jpeg,jpg,bmp,gif,png http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

它允许您指定保存图像的位置以及所需的文件类型。这样下载图像可能更容易。

来源

-r 启用递归检索。有关更多信息,请参阅递归下载。

-P 设置保存所有文件和目录的目录前缀。

-A 设置仅检索特定文件类型的白名单。接受字符串和模式,并且两者都可以在逗号分隔的列表中使用(如上所示)。有关更多信息,请参阅文件类型。

从文件夹复制图像文件

我注意到该网站使用 PNG 图像文件。您可以从文件夹中复制这些文件。这应该在您存储网页的文件夹中运行。

find . -name "*.png" -exec cp '{}' ./some_dir/somewhere/ \;

答案4

wget仅下载页面的 HTML 文件,而不是页面中的图像,因为页面 HTML 文件中的图像以 URL 形式写出。要执行所需的操作,请使用-r(递归)、-A带有图像文件后缀的选项、--no-parent使其不上升的选项以及--level带有 的选项1

具体来说wget -r -A .jpg,.png,.gif --no-parent --level <url>

更好的是,大多数浏览器有保存页面以供离线查看的方法

相关内容