通过终端保存网页浏览器页面

通过终端保存网页浏览器页面

有没有办法使用常见的网络浏览器(例如火狐)通过命令行界面获取页面?如果我使用firefox www.google.com,则会打开 Firefox 并显示 google 页面。我想获取该网站并保存一个或一堆文件。

答案1

您可以使用以下方法下载完整网页wget

wget \
     --recursive \
     --no-clobber \
     --page-requisites \
     --html-extension \
     --convert-links \
     --restrict-file-names=windows \
     --domains website.com \
     --no-parent \
         www.website.com

选项有:

  • recursive:下载整个网站。
  • domains website.com:不要点击 website.com 之外的链接。
  • no-parent:不要点击目录之外的链接/
  • page-requisites:获取组成页面的所有元素(图像、CSS 等)。
  • html-extension:以扩展名保存文件.html
  • convert-links:转换链接,以便它们在本地、离线状态下工作。
  • restrict-file-names=windows:修改文件名,以便它们也可以在 Windows 中运行(如果需要)。
  • no-clobber:不要覆盖任何现有文件(在下载中断并恢复时使用)。

相关内容