我安装并运行了 Heritrix Web Crawler。它将数据存储在 .arc.gz 文件中

Question

我谷歌搜索读取 arc 文件这是第一个链接。

首先，您需要解压文件（它们是经过 gzip 压缩的，因此扩展名为 .gz）。然后，您就可以读取 ARC 文件了。

Answer 1

我谷歌搜索读取 arc 文件这是第一个链接。

首先，您需要解压文件（它们是经过 gzip 压缩的，因此扩展名为 .gz）。然后，您就可以读取 ARC 文件了。

相关内容