我尝试过许多不同的 CHM 转 HTML 实用程序,但我很难找到一个能够生成单身的HTML 文件。我可以使用 反编译 CHM 文件hh.exe
,但我不知道如何轻松地将生成的文件合并为单个 HTML 文件,同时保留页面的正确顺序。
有没有免费工具可以做到这一点?如果没有,我该如何按顺序合并 HTML 文件?
答案1
html 档案由一组带有相关媒体(读取:图像和简单的 javascript)的 html 页面组成。
CHM 会指示哪个页面是“主页”,通常是一些概览页面。除此之外,它还有一个目录 (TOC),它是指向 html 文件的节点树。遍历树会给出或多或少线性的顺序。
但默认页面可能不是目录的第一页,或者根本不在目录中,而且可能并非所有页面都在目录中。在这种情况下,无法通过自动化手段检测出顺序。
使用一般的反编译工具提取 CHM 会得到一堆 html、一个 .hhk 和一个 .hhc。.hhc 是 XML 格式的目录。hhk 是索引,但现在不需要它。默认页面位于内部文件中,提取后通常不可见(使用 chm 工具的属性)
除了确定顺序之外,还有实际的合并过程。这可能很难,但实际的解决方法可能是通过一些脚本方式将它们导入到 Office 中。
我认为有能力的脚本编写者也许能够完成这一任务,但这并不是一件容易的事情。