转换为 HTML(章节/节标题)和 PDF(单独章节/节)的混合

转换为 HTML(章节/节标题)和 PDF(单独章节/节)的混合

我有大量笔记,目前由大量单独的“章节”组成,我手动编号并跟踪它们。例如访问 http://www.stat.sfu.ca/~cschwarz/CourseNotes 使用手动创建和维护的 HTML 索引。

我想创建一个包含所有单独章节的“超级文档”,并使用它来自动创建带有 PDF 中“叶子”的 HTML 索引结构。

例如,在最高级别,您将获得如下 HTML 文档:

这是我的一大套课程笔记。1
. 这是第 1 章
2. 这是第 2 章
3. 这是第 3 章

其中每个“这是第 x 章”都是指向第 x 章的 PDF 文档的指针。

这看起来像是latex2html章节/节标题的转换类型和针对每个章节类型的问题创建单独的 pdf 文件的组合。理想情况下,您可以控制创建的 HTML 索引的级别(例如,显示所有 1 级和 2 级标题)以及创建 PDF 的叶级(例如,在章节级别或节级)。跨叶边界的交叉引用会很好,但不是必需的,即第 15.3 节中对第 13.2 节的引用将跳转到包含第 13.2 节的“叶”。

有没有可以实现这个功能的包?我对 LaTeX 的要求是不是太高了?还有其他关于自动化工作流程的建议吗?我已经阅读了关于每个章节单独制作 PDF 文件的建议,这是一个开始,但主索引的创建仍然需要手动完成。

附录:

嗯...我想我可以看到一个潜在的工作流程。如果我能以一种方便的方式分割最终的 pdf 文档(例如章节边界),这将使我部分完成,我认为文件的后期处理*.toc可以生成 html 代码??目前还不确定如何将两者联系起来。我想我注意到了一个关于如何分割最终 pdf 文件的问题/答案...是时候进行更多研究了...

答案1

好的……我已经设法开发出一种似乎可行的工作流程。我已经对其进行了概念验证测试,它基本上可以正常工作,但我需要进行一些微调。

  1. 使用该hyperref包,以便 PDF 文件具有与每个章节/部分相关联的书签。

  2. 用于pdflatex生成包含所有章节等的书籍。请勿销毁该.toc文件,因为它稍后将会使用。

  3. 用于pdfasm将 (2) 中的书拆分成单独的章节。您可以使用[FILENUMBER###]输出文件名中的片段对各部分进行适当编号,例如MyBook-Part-[FILENUMBER###].pdf生成等MyBook-Part-001.pdfMyBook-Part-002.pdf请注意,书名会生成一个单独的文件,因此第 1 章是MyBook-Part-002.pdf等。[我想将来我不会为这本书生成标题页。] 我还使用该minitoc包为每个章节生成一个迷你目录。

  4. 处理.toc(2) 中的文件以生成 HTML。我使用 SAS(只是因为我知道 SAS)为章节和节标题生成 HTML 代码。然后我使用服务器端包含自动将生成的 HTML 代码片段嵌入到我的index.shtml页面中。生成 HTML 并不太难,因此可以用您选择的语言(例如 perl)完成。在此阶段,您可以控制在目录中要生成 HTML 的级别。

我有几个“功能”需要调整:

  • 标题中的希腊字母存储在.toc文件中,如$\alpha$等,需要修改 HTML 生成的代码;
  • 章节/部分标题中的某些格式需要针对 HTML 进行调整,例如{\it text}
  • 使整个流程自动化。

相关内容