我知道这个问题之前有人问过,但我还是想试试,因为我一直在尝试各种免费软件。我想摆脱 DiffDoc 部门。问题是我找不到能满足我们需求的东西。WinMerge 是最新的尝试。
问题很简单。一个 Word 文档和一个 PDF 文档,其中一部分包含要比较的文本。
比较它们并完成。原始文本,忽略空格,忽略回车符等;并以某种报告的形式向我提供结果。
我们尝试了 ExamDiff、kdiff3、Tortoise 和其他一些工具。
答案1
您可以尝试研究 awk、sed 和一些 bash 脚本来帮助您。
答案2
目前,我的解决方案是一个大杂烩应用程序。PDFBox 用于 PDF 提取,Word Interop 用于 Word 文档。它将它们拆分开来,用“ ”替换 \r\n,将每个文件推送到 .txt 文件,然后就可以在 WinMerge 中以简单的方式进行比较。
真的想要一些更强大和正式的东西......但截至目前......这是免费的答案......