如何在 Windows 上打开(可能)损坏的 Webarchive

如何在 Windows 上打开(可能)损坏的 Webarchive

首先,这是我第一次处理 WARC 文件...
我有一个 webarchive 文件似乎已损坏(在某种程度上),我在 Windows 上安装了 Safari,然后出现了此问题(在 Mac 上也发生了同样的事情):

在此处输入图片描述

我尝试使用 7-zip 打开它,但它说这不是有效的档案。
我尝试Ruby 脚本但是它也给了我一个错误...

我需要的是找到一种方法来从档案中提取文件...有什么建议吗?

答案1

我实际上能够在 Windows 10 上做到这一点。

从这里安装 Safari:http://www.techspot.com/downloads/4184-safari-for-windows.html(单击“直接下载”),然后右键单击要打开的 .webarchive 文件,指向“打开方式”并选择 Safari。它会打开它,同时还会打开一个打印窗口。

我建议选择“Microsoft print to PDF”作为打印机并将其保存为 PDF,但如果您取消打印对话框,它将在 Safari 中正常打开。

信用:佩德罗尔贝

相关内容