文档转换

文档转换

我需要在 Linux 下将 PDF 或 HTML+CSS 转换为 DOC 或 DOCX,可以通过命令行或脚本语言进行。

任何想法?

答案1

我刚刚偶然发现了这个问题,经过一番谷歌搜索后,找到了 pandoc:http://johnmacfarlane.net/pandoc/README.html

一个简单的命令将从 html 输入创建一个 docx 或 pdf(或 rtf 等)文件,如下所示:

pandoc -o output.docx input.html

它还可以写入标准输出(使用某些格式)并从标准输入读取。

不确定它是否在 debian / ubuntu 存储库中,但它在 Redhat / CentOS 6 的 epel 6 存储库中(yum install pandoc)。

希望这对某人有帮助:)

答案2

您可能能够使用 OpenOffice 从命令行执行后者。还有用于脚本语言的桥梁 - 请访问 OpenOffice 网站了解更多信息。有一个用于 PHP 的桥梁,名为普诺,但我还没有亲身经历过。

答案3

您可以使用 OpenOffice 宏将 HTML 转换为 .doc,请参阅此线程:

http://www.oooforum.org/forum/viewtopic.phtml?p=44367#44367

将 pdf 转换为 .doc 要困难得多,因为 PDF 中可能包含大量不同的内容 - PDF 通常用于诸如扫描文本之类的内容。

答案4

文档转换

当前过去示例的列表。

将任何文档类型转换为 PDF

如何使用 openoffice api 将 Powerpoint 幻灯片转换为 jpeg?(幻灯片分割器)

许多过去的转换示例列表

筛选列表

OOo 2.0 (1.9.x) 中可用的转换器列表?生成过滤器列表的说明

将 Html 递归文件夹转换为 PDF、Txt、SXW、DOC

SXD 到 SDC 的递归文件夹 (StarCalc 5)

设置 JPEG 导出的图像大小

使用 API 将 Xcel 转换为 Calc

非常相似的一个,将Xcel转换为文本

批量模式转换

文档转换

VB:将 Excel 文件转换为 txt 文件

文本的常规 Visual Basic 文档转换...

从命令行将 Word 转换为 PDF http://www.oooforum.org/forum/viewtopic.php?t=3772 http://www.oooforum.org/forum/viewtopic.php?t=5513 http://www.oooforum.org/forum/viewtopic.php?t=3768

PyOpenOffice 工具无需使用 OOo 即可将 SXW 转换为 PDF

从命令行转换 Word --> Writer

从命令行将 Excel 转换为 PDF

http://www.oooforum.org/forum/viewtopic.php?t=5596 http://www.oooforum.org/forum/viewtopic.php?p=21050#21050

从命令行将 SXC 转换为 CSV

从命令行将 PPT 转换为 HTML...

将 PPT 转换为 HTML 简短示例...

将 PPT 转换为 PDF 简短示例...

参见线程尾端...

将 SXW 转换为 PDF

绘制导出为 PDF

在 Python 中...

关于使用 Java 将文档转换为 PDF 的讨论

使用 Java 将 SXW 转换为 DOC
http://www.oooforum.org/forum/viewtopic.phtml?p=81846#81846

我写了一个批量文件转换器
http://www.oooforum.org/forum/viewtopic.php?t=3525 http://www.oooforum.org/forum/viewtopic.php?t=2810 http://www.oooforum.org/forum/viewtopic.php?p=10311#10311 你可以在这里得到它
http://www.ooomacros.org/user.php#95532 这里有更多关于此的讨论...
http://www.oooforum.org/forum/viewtopic.php?t=5708

宏可保存为三种格式
http://www.oooforum.org/forum/viewtopic.php?t=3612 使用时间戳保存备份的宏
http://www.oooforum.org/forum/viewtopic.php?t=7674

使用 Writer 而不是 Web 打开 HTML 以便导出
http://www.oooforum.org/forum/viewtopic.php?t=3973 http://www.oooforum.org/forum/viewtopic.php?p=44367#44367
如何将 HTML 转换为 OpenOffice 文件?
http://www.oooforum.org/forum/viewtopic.php?t=11580
将 HTML 转换为 PDF 时的页面大小 pblm
http://www.oooforum.org/forum/viewtopic.phtml?p=63682#63682

以 DocConverter 实用程序结束的讨论。
http://www.oooforum.org/forum/viewtopic.php?t=2668

将 DBF 转换为 XLS、SXC、PDF 和 HTML
http://www.oooforum.org/forum/viewtopic.php?t=5728

良好的 Visual Basic 代码示例...转换文档
http://www.oooforum.org/forum/viewtopic.php?t=7673

图纸导出与打印
http://www.oooforum.org/forum/viewtopic.php?t=3620

使用 OOo 的源代码以它的过滤器支持的格式读取/转换/写入文档。 http://www.oooforum.org/forum/viewtopic.php?t=5785

相关内容