如何在网页中下载嵌入 JavaScript 的 PDF

如何在网页中下载嵌入 JavaScript 的 PDF

更具体地说,来自“http://krishikosh.egranth.ac.in”它是论文的存储库。以前,IDM 能够捕获所有 pdf 请求,但现在一些编码已更改,现在无法访问。到达网络选项卡时,它确实将其显示为 pdf.worker.js 下的 XHR 文件。

这是试用链接

http://krishikosh.egranth.ac.in/displaybitstream?handle=1/5810062295

请帮忙。

答案1

正如您所说,该网站已采取措施阻止下载。在网络上,这主要会导致速度变慢。如果您在网上可以查看文档,则在查看期间,该文档将保存在您的计算机上,您可以提取该文档以供日后使用。

一个简单的解决方案是使用卷曲,一种在许多操作系统中都可用的命令行工具,并将其与 Google Chrome 开发人员工具相结合。Chrome 的网络选项卡可以从网站中进行的 PDF 加载中输出现成的 curl 命令,并将其粘贴到命令提示符中。

我将输出减少到最低限度:

curl 'https://krishikosh.egranth.ac.in/bitstream/1/5810062295/1/Anil%20Kumar%202601' \
  -X 'POST' \
  -H 'keyname: Akz914723960' \
  -H 'Content-Length: 0' \
  -H 'Type: application/pdf' \
  --output Document.pdf

此方法并不适用于网站中的所有文档,但会将指定的 PDF 下载到Document.pdf您自己驱动器上命名的文件中。网站使用的关键安全措施是键名-标题。

相关内容