我想在运行 Linux 的服务器上通过命令行将 PowerPoint (.ppt) 和 Excel (.xls) 文件转换为纯文本格式 (.txt)。该服务器未安装 Xorg 或类似库,无法安装它们。
我已经尝试过catppt
了卡特多克,但它对我不起作用。
~$ catppt presentacion_16x9.ppt
Violación de segmento
(该消息的意思是“分段错误”)
我应该使用什么软件进行这种转换?
答案1
您可能需要使用 XSLT 将文件转换为您需要的任何内容。请参阅此博客:关联了解详细信息。
简而言之,您需要编写一个 XSLT,它可以处理 PPT/XLS 文件中所需的字段,并以所需的格式将它们打印到 TXT 文件中。这需要一点学习,但我知道这是唯一可行的方法。
答案2
使用 LibreOffice/OpenOffice 的命令行实用程序
soffice --headless --convert-to txt presentacion_16x9.ppt
您可能需要更改soffice
为libreoffice
,或将--headless
选项添加到之前或之后,--convert-to
具体取决于您的软件版本
还有输出过滤器可以修改输出选项
soffice --headless --convert-to "txt:Text (encoded):UTF8" presentacion_16x9.ppt
soffice --headless --convert-to "txt:Text (encoded):UTF8,LF" sheet.xls
有关命令和过滤器的更多信息,请参阅