智能地将一个文本日志文件与另一个文本日志文件“减去”

Question 1

diff（及其各种选项）将向您显示两种方式的差异，并保留消息顺序。但是，它不会删除差异的重复项（因为您可以uniq在之后应用）或处理不同的顺序。这样够好吗？

Answer

diff（及其各种选项）将向您显示两种方式的差异，并保留消息顺序。但是，它不会删除差异的重复项（因为您可以uniq在之后应用）或处理不同的顺序。这样够好吗？

Question 2

使用diff（在正常输出模式下，即没有-c或-u）。新行将以为前缀>。

diff A B | sed -ne 's/> //p'

如果日志包含时间戳，则必须先将其删除。

有时，在上下文中查看新/更改的部分会更好，突出显示差异并导航不同的块。Emacs 有一个不错的界面（工具 | 比较菜单，M-x ediff-files）。还有许多独立工具（名称中通常带有“diff”或“compare”）。

顺便说一句，如果您对行的顺序不感兴趣，那么对两个文件进行排序comm会比您在问题中给出的过程更容易、更漂亮。

Answer

使用diff（在正常输出模式下，即没有-c或-u）。新行将以为前缀>。

diff A B | sed -ne 's/> //p'

如果日志包含时间戳，则必须先将其删除。

有时，在上下文中查看新/更改的部分会更好，突出显示差异并导航不同的块。Emacs 有一个不错的界面（工具 | 比较菜单，M-x ediff-files）。还有许多独立工具（名称中通常带有“diff”或“compare”）。

顺便说一句，如果您对行的顺序不感兴趣，那么对两个文件进行排序comm会比您在问题中给出的过程更容易、更漂亮。

Question 3

这是一个难题，从某种意义上说，也是一个活跃的研究问题。我认为目前还没有一个程序只需要插入几个正则表达式即可。

我会将您的程序表述为尝试比较网络程序的踪迹。我怀疑比较网络或并发程序踪迹的人遇到过这个问题并编写了自己的工具，但我脑子里没有具体的例子。

Answer

这是一个难题，从某种意义上说，也是一个活跃的研究问题。我认为目前还没有一个程序只需要插入几个正则表达式即可。

我会将您的程序表述为尝试比较网络程序的踪迹。我怀疑比较网络或并发程序踪迹的人遇到过这个问题并编写了自己的工具，但我脑子里没有具体的例子。

相关内容