如何编辑“.zim”文件

如何编辑“.zim”文件

我下载了波斯语维基百科转储文件.zim。我可以用以下方式打开它:奇异果软件,它工作正常。问题是官方波斯语维基百科的字体是Tahoma默认的,但本地下载的页面却是其他字体,这很烦人,而且不太易读。是否可以提取 zim 文件并修改样式表并再次压缩?

答案1

我遇到了同样的问题:我想对 zim 文件进行一些更改,例如剪切索引或在主页上进行一些更改。我研究了 zim 格式的制作方法,并编写了一些 python 脚本来完成这项工作:

https://gitlab.com/Afrikalan/zim-tools/-/tree/master/zim-manipulation

wikipediaIndexHasard.py 是一个用于更改主页的脚本,它依赖于同一目录中的 zimDerivate.py。您可以更改它来调整 CSS 而不是主页。

答案2

  1. 使用 zimdump 将 ZIM 的所有内容导出到文件系统。请参阅如何“解压缩” ZIM 文件?看看如何。

  2. 对 HTML 和 CSS 文件执行修改。

  3. 使用以下方法重新压缩zimwriterfs

docker run -v $(pwd):/app -w /app -it --rm --privileged --pid=host openzim/zimwriterfs
zimwriterfs --welcome=A/Main_Page --favicon=I/favicon.png --language=cho --title=mytitle --description=mydescription --creator=mycreator --publisher=mypublisher . my_project.zim

答案3

严格回答问题正文中出现的问题:

是否可以提取 zim 文件并修改样式表并再次压缩?

答案是:对的,这是可能的

退房.ZIM 文件格式,我们会看到以下段落:

ZIM 代表“Zeno IMproved”,因为它取代了早期的 Zeno 文件格式。其文件压缩使用 LZMA2,由 xz-utils 库实现。openZIM 项目由 Wikimedia CH 赞助,并由 Wikimedia 基金会支持。

为了实现你的目标,你必须使用XZ 实用程序

XZ Utils(以前称为 LZMA Utils)是一组免费软件命令行无损数据压缩器,包括 LZMA 和 xz,适用于类 Unix 操作系统以及从 5.0 版本开始的 Microsoft Windows。

他们的网站将为您提供有关该主题的所有信息。

相关内容