我用来wget
下载一个问题档案的网站,有些问题以 html 形式提供,有些问题以 PDF 形式提供,位于同一域中。问题是,当我使用选项--adjust-extensions
或时--html-extension
,pdf 文件以 html 扩展名保存。而当我不使用它时,html 页面看起来已损坏,没有背景、缩进等。
命令如下:
wget --recursive --page-requisites --adjust-extension --quiet --convert-links test.com
那么有没有办法可以下载所有具有正确扩展名的内容?