使用许多工具,例如pandoc
,我们可以将文本或 HTML 文件转换为 DOCX 文件。但有一个问题,输出文件必须是多页的。输入文件中必须有一些内容指示在何处插入分页符。
是否有任何实用程序可以从终端使用分割页面的标记(或任何其他方法)将 .TXT 或 .HTML 文件转换为 .DOCX?
我有一个从其他来源提取文本的系统。我无法访问系统上的 DOCX 生成器,但我可以创建文本文件。所以我的想法是生成这样的文本文件:
第 1 页,第 2 页:
Lorem ipsum dolor sat amet,consectetur adipiscing elit,sed do eiusmod tempor incididunt ut Labore et dolore magna aliqua。 Ut enim ad minim veniam, quis nostrud exeritation ullamco labouris nisi ut aliquip ex ea commodo consequat.
_______________________ [NEWLINE_HERE]
第 2 页,第 2 页:
Lorem Ipsum 是印刷和排版行业的简单虚拟文本。自 1500 年代以来,Lorem Ipsum 一直是行业标准的虚拟文本,当时一位不知名的印刷商拿走了一堆字体并将其打乱以制作一本字体样本簿。
并将它们发送到另一台服务器,该服务器充当 API 将此文件转换为 DOCX 文件格式,但不是将整个文本文件作为单个页面插入,而是将它们转换为具有用 NEWLINE feed 标记的多个页面的单个文件。
如果我无法解释,请告诉我。