我需要使用命令行将 PowerPoint PPTX 文件转换为 HTML。HTML 文件应将文本保留为文本(而不是图像),同时将所有形状、Smart-art 和图形转换为图像(如果不是图像,则为 SVG)。
我正在尝试使用 LibreOffice Impress 4.4.3.2 来执行此操作。
如果我打开 Impress 并将 PPTX 文件导出为 HTML,所有幻灯片都会转换为图像,包括文本。如果我导出为 PDF,它确实会保留文本并转换所有形状,但可惜...我想要 HTML 而不是 PDF。
使用命令行(在 Windows 8 上),我尝试了在以下位置找到的所有 HTML 过滤器:链接文本
其中大多数根本不起作用。我能找到的最接近的方法是:
soffice.exe --headless --convert-to html --outdir d:\temp d:\temp\presentation.pptx 很好地转换了文本,但由于某种原因,转换后的 HTML 文件中缺少所有形状和图形。
我该如何解决我的问题?也许其他一些免费工具/.net 库可以做到这一点?