我需要在 Linux 下将 PDF 或 HTML+CSS 转换为 DOC 或 DOCX,可以通过命令行或脚本语言进行。
任何想法?
答案1
我刚刚偶然发现了这个问题,经过一番谷歌搜索后,找到了 pandoc:http://johnmacfarlane.net/pandoc/README.html
一个简单的命令将从 html 输入创建一个 docx 或 pdf(或 rtf 等)文件,如下所示:
pandoc -o output.docx input.html
它还可以写入标准输出(使用某些格式)并从标准输入读取。
不确定它是否在 debian / ubuntu 存储库中,但它在 Redhat / CentOS 6 的 epel 6 存储库中(yum install pandoc
)。
希望这对某人有帮助:)
答案2
您可能能够使用 OpenOffice 从命令行执行后者。还有用于脚本语言的桥梁 - 请访问 OpenOffice 网站了解更多信息。有一个用于 PHP 的桥梁,名为普诺,但我还没有亲身经历过。
答案3
您可以使用 OpenOffice 宏将 HTML 转换为 .doc,请参阅此线程:
http://www.oooforum.org/forum/viewtopic.phtml?p=44367#44367
将 pdf 转换为 .doc 要困难得多,因为 PDF 中可能包含大量不同的内容 - PDF 通常用于诸如扫描文本之类的内容。
答案4
文档转换
如何使用 openoffice api 将 Powerpoint 幻灯片转换为 jpeg?(幻灯片分割器)
OOo 2.0 (1.9.x) 中可用的转换器列表?生成过滤器列表的说明
将 Html 递归文件夹转换为 PDF、Txt、SXW、DOC
从命令行将 Word 转换为 PDF http://www.oooforum.org/forum/viewtopic.php?t=3772 http://www.oooforum.org/forum/viewtopic.php?t=5513 http://www.oooforum.org/forum/viewtopic.php?t=3768
PyOpenOffice 工具无需使用 OOo 即可将 SXW 转换为 PDF
从命令行将 Excel 转换为 PDF
http://www.oooforum.org/forum/viewtopic.php?t=5596 http://www.oooforum.org/forum/viewtopic.php?p=21050#21050
使用 Java 将 SXW 转换为 DOC
http://www.oooforum.org/forum/viewtopic.phtml?p=81846#81846我写了一个批量文件转换器
http://www.oooforum.org/forum/viewtopic.php?t=3525 http://www.oooforum.org/forum/viewtopic.php?t=2810 http://www.oooforum.org/forum/viewtopic.php?p=10311#10311 你可以在这里得到它
http://www.ooomacros.org/user.php#95532 这里有更多关于此的讨论...
http://www.oooforum.org/forum/viewtopic.php?t=5708宏可保存为三种格式
http://www.oooforum.org/forum/viewtopic.php?t=3612 使用时间戳保存备份的宏
http://www.oooforum.org/forum/viewtopic.php?t=7674使用 Writer 而不是 Web 打开 HTML 以便导出
http://www.oooforum.org/forum/viewtopic.php?t=3973 http://www.oooforum.org/forum/viewtopic.php?p=44367#44367
如何将 HTML 转换为 OpenOffice 文件?
http://www.oooforum.org/forum/viewtopic.php?t=11580
将 HTML 转换为 PDF 时的页面大小 pblm
http://www.oooforum.org/forum/viewtopic.phtml?p=63682#63682以 DocConverter 实用程序结束的讨论。
http://www.oooforum.org/forum/viewtopic.php?t=2668将 DBF 转换为 XLS、SXC、PDF 和 HTML
http://www.oooforum.org/forum/viewtopic.php?t=5728良好的 Visual Basic 代码示例...转换文档
http://www.oooforum.org/forum/viewtopic.php?t=7673图纸导出与打印
http://www.oooforum.org/forum/viewtopic.php?t=3620使用 OOo 的源代码以它的过滤器支持的格式读取/转换/写入文档。 http://www.oooforum.org/forum/viewtopic.php?t=5785