我正在使用 MS Word,在很多地方我都很关心文档的最终外观。我不想分割某些部分(例如粘贴的源代码)。我也不想将这些部分变成对象,因为虽然这样可以保持它们不分离,但它会经常在文档周围添加填充空格。Web Layout 适用于开发,但最终我会将文档导出为 PDF。我希望生成的 PDF 只是一页长页。
如何将 MS Word 文档导出为 PDF,以便生成的文件只包含一页(合并所有页面的结果,内容之间没有看似随机的页眉和页脚)?
答案1
我不认为 PDF 编辑器解决方案会给你一个确实单个连续页面。我认为它仍会包含分页符。
相反,还有另一种方法。
首先,您需要将 Word 文档转换为 HTML。我喜欢这在线服务,但你也可以使用潘多克将 docx 转换为 html,例如:
pandoc --extract-media='media' -s your_file.docx -t html -o your_file.html
然后,您需要从 HTML 转换为真正连续的单页 PDF。可以这样做:
得到
wkhtmltopdf
-https://wkhtmltopdf.org/downloads.html(不要忘记添加 PATH!)打开终端并执行
wkhtmltopdf -T 0 -B 0 --page-width 210mm --page-height 594mm input.html output.pdf
在这里,将
--page-height
word 文档中的参数更改为 (297*A4 页数)。例如,对于 2 张 A4 页,它变为 2*297 = 594mm
对于包含额外文件的更复杂文件,请提取第.zip
一个文件,然后使用
wkhtmltopdf -T 0 -B 0 --page-width 210mm --page-height 594mm --enable-local-file-access input.html output.pdf
答案2
我有一个简单的解决方案:
转换为普通 PDF
将 PDF 上传到
https://foxyutils.com/mergepdf/