从网络档案 (.warc) 中提取文件

Question 1

你可以使用以下方式浏览 WARC网络档案播放器并从浏览器中保存所需的文件。或者，将 WARC 上传到webrecorder.io并在那里浏览/下载。

Answer

你可以使用以下方式浏览 WARC网络档案播放器并从浏览器中保存所需的文件。或者，将 WARC 上传到webrecorder.io并在那里浏览/下载。

Question 2

我建议尝试一下 warctools https://github.com/internetarchive/warctools它是一个非常容易使用的 python 库。

Answer

我建议尝试一下 warctools https://github.com/internetarchive/warctools它是一个非常容易使用的 python 库。

Question 3

ReplayWeb.页面取代了取代 WebArchivePlayer 的 Webrecorder Player。

无需安装应用程序，只需进入页面并浏览文件即可。所有处理都在本地进行。

Answer

ReplayWeb.页面取代了取代 WebArchivePlayer 的 Webrecorder Player。

无需安装应用程序，只需进入页面并浏览文件即可。所有处理都在本地进行。

Question 4

我发现7-Zip它本身通常不起作用，但有一个名为 eDecoder 的插件可用于启用 warc 支持。

可以从以下网址免费下载 eDecoder这里。

打开安装了此插件的 warc 后，它的作用与 7-Zip 中的任何其他存档一样，但有几点例外：

虽然它可以免费下载，但它似乎是闭源的，无论是在代码还是许可证方面，因此由于它是一个编译的 DLL，因此仅限于 Windows。

Answer

我发现7-Zip它本身通常不起作用，但有一个名为 eDecoder 的插件可用于启用 warc 支持。

可以从以下网址免费下载 eDecoder这里。

打开安装了此插件的 warc 后，它的作用与 7-Zip 中的任何其他存档一样，但有几点例外：

虽然它可以免费下载，但它似乎是闭源的，无论是在代码还是许可证方面，因此由于它是一个编译的 DLL，因此仅限于 Windows。

相关内容