两个 ODT 文档的相似性和/或差异(Linux)

两个 ODT 文档的相似性和/或差异(Linux)

我有两个 ODT 文档,它们的内容非常接近,我想比较它们看看它们有多相似。

最好的办法是相似度百分比如果不可能的话,另一种选择是至少有某种差异

我在跑步Ubuntu Lucid


解决方案:

我曾经odt2txt将文件转换为文本,然后使用wdiff -i --statistics one.txt two.txt差异以及统计数据来得到常用词的百分比(相似性)。

答案1

我自己还没有尝试过,但是这对工具- odt2txt 和 oodiff - 看起来很有希望。

答案2

您是否尝试过内置的比较功能?编辑 -> 跟踪更改 -> 比较文档...

如果您只想要文本差异,最好的办法可能是将两个文档都转换为纯文本,然后对它们运行常规差异。不过,您必须弄清楚如何规范化换行符,否则差异将不会很有用。

答案3

如果您不关心文本格式,您也可以将内容复制到纯文本文件并使用旧的 diff。

附言:您是一位正在寻找可能作弊者的老师吗?:p

答案4

我这样做的方法是使用 libreoffice 生成 .pdf 文件,然后使用 diffpdf 比较这两个 pdf 文件。这将在并行窗口中突出显示差异

相关内容