下载不在其发布网页中的文件

Question

PDF URL 嵌入在 JavaScriptonclick属性中。你可以grep：

wget -qO- https://www.lezioni4all.com/ase/appunti | 
  grep -o "https://www\.lezioni4all\.com/files/[^']*\.pdf"

您可以使用 no-clobber 选项下载它们-nc（因为每个文档都链接两次）并且-i：

wget -nc -P ~/Desktop/ASE_lezioni4all -i <(
  wget -qO- https://www.lezioni4all.com/ase/appunti |
  grep -o "https://www\.lezioni4all\.com/files/[^']*\.pdf")

Answer 1

PDF URL 嵌入在 JavaScriptonclick属性中。你可以grep：

wget -qO- https://www.lezioni4all.com/ase/appunti | 
  grep -o "https://www\.lezioni4all\.com/files/[^']*\.pdf"

您可以使用 no-clobber 选项下载它们-nc（因为每个文档都链接两次）并且-i：

wget -nc -P ~/Desktop/ASE_lezioni4all -i <(
  wget -qO- https://www.lezioni4all.com/ase/appunti |
  grep -o "https://www\.lezioni4all\.com/files/[^']*\.pdf")

下载不在其发布网页中的文件

答案1

相关内容