我有两个很大的(2-3MB)文本文件,只有几百个字符不同。通常,diff 可以很好地比较它们以找出差异。但是,虽然它是一个文本文件,但这些文件中根本没有换行符,这使得“diff”毫无用处。整个文件是一行巨大的文本,所以即使是文本编辑器也讨厌它。
这些文件经常使用 :(冒号),因此如果我可以在每个 : 字符后插入一个换行符,diff 可能会产生一些有意义的东西。(每 N 个字符插入换行符是行不通的,因为在第一个不同的字符之后,所有行都会不同,所以我认为它需要基于一些常见的模式或字符。)
如何使用 sed 来做到这一点?