我偶然发现了unoconv
用于转换文档格式的 Linux 实用程序。我发现 unoconv 每次使用相同的输入文件调用时都会产生不同的输出。
bash$ unoconv -f doc test.html
bash$ md5sum test.doc
5895dee91a64699d04dfdb71c2be780b
bash$ rm test.doc
bash$ unoconv -f doc test.html
bash$ md5sum test.doc
33ec9298ef4c40c50cc4ade7bf1ab93a
如何克服这种行为?
答案1
您可以diff
查看结果以了解造成差异的原因 - 我猜是时间戳。文字处理器文档可以包含在“发布”时评估的函数和字段。
$ unoconv -f doc test1.html
$ unoconv -f doc test2.html
$ diff test1.htm test2.html