如何从命令行将 .odt 转换为 .html(或 .md)?

如何从命令行将 .odt 转换为 .html(或 .md)?

我在找免费软件可以转换开放文档转换为 HTML 或 markdown。

潘多克可以将 HTML 转换为 OpenDocument,但不能将 HTML 转换为 OpenDocument。

odt2html.pypip使用和均无法安装easy_install

自由办公室据报道可以进行转换;但是,我无法使用以下命令使其工作:

soffice --convert-to --outdir . htm:HTML my.odt

答案1

您正在使用--convert-to,但未指定其值。

正确的语法是:

soffice --headless --convert-to htm:HTML --outdir . my.odt

或者尝试使用以下脚本

#! /bin/bash

CONFIG=/path/to/tidy_options.conf
# rm -rv "$2"
mkdir -p "$2"

for F in `find $1 -type f -name "*.doc" -or -name "*.odt"`; do
  BASE=`basename $F .doc` ; BASE=`basename $BASE .odt`
  soffice --headless --convert-to htm:HTML --outdir $2 $F
  tidy -q -config $CONFIG -f $2/$BASE.err -i $2/$BASE.htm | sed 's/ class="c[0-9]*"//g' > $2/$BASE.html
done

用法:

$ convert_doc_to_html.sh SOURCE_DIR TARGET_DIR

看:

答案2

新版本潘多克,开源通用文档转换器,现在工作:

pandoc -t html -s input.odt -s -o output.html 

相关内容