从 doc88 Flash 查看器中提取 pdf/图像

从 doc88 Flash 查看器中提取 pdf/图像

doc88.com 使用某种加密来保护 pdf 文件。我使用 Chrome 开发人员工具发现它加载了 .ebt 文件。我认为它是加密的 Pdf/Swf 文件。

我找到了以下回复这里但我仍然无法下载 pdf 文件。有人能帮忙吗?

好的。我完全不知道 docin.com 使用的加密方式,但我确定 doc88.com 可能使用了来自 cryptbot.com 的软件,尽管我无法提取密钥:它可能深埋在 Flash 查看器中。– whitequark

答案1

尝试https://www.npmjs.com/package/doc88-download它保存每个页面的 PNG,然后可以作为单独的步骤将其转换为 PDF 或其他格式。

答案2

以下是如何从 www.doc88.com 获取 pdf 文件的方法:

  1. 访问您感兴趣的文档的网站并加载要提取的文档的每一页只需将鼠标悬停在它们上面几秒钟(为了更快地完成此操作,请缩小)。这会将 pdf 保存在 Chrome 的缓存中。默认情况下,并非所有页面都会首先加载。

  2. 右键单击屏幕上的任意位置并选择“打印...”。

  3. 打印为 PDF。

  4. 使用工具裁剪不属于 PDF 的页面部分。例如,在 Linux 中,您可以使用pdfjam. 更多示例这里

  5. 使用 OCR 程序将图像重新转换为文本。质量无法保证。一些 Linux 实用程序这里

相关内容