比较 2 个文件中的每第 n 行并保存（非对称）上下文

Question 1

对于更新的输入，严格基于 4 行记录，您可以使用模算术来维护当前记录的数组，并每隔 4 行检查第 3 行是否匹配：

$ awk '
    {a[FNR%4] = $0; getline b[FNR%4] < "fileB"} 
    !(FNR%4) && b[3] != a[3] {
      for(i=0;i<4;i++) print b[i%4]
    }
  ' fileA
record2 line1=header
record2 line2
record2 line3 id GHI <= this is different
record2 line4

（请注意，确实应该检查命令的返回值getline，并在失败时执行一些明智的操作）。

对于您最初发布的输入，您可以使用段落模式:

$ awk -vRS= -F'\n' '{A3 = $3}; getline "fileB" > -1 && $3 != A3' fileA
record2 line1=header
record2 line2
record2 line3 id DEF <= this is different
record2 line4

对于正常处理（来自的输入）和（来自的输入），空RS会导致读取整个空行分隔的记录。将字段分隔符设置为换行符 ( ) 然后允许我们保存其中的整行并与另一行进行比较。如果它们不相等，则默认打印输出（这是of 的整个记录）。fileAgetlinefileB\n$3$0getlinefileB

Answer

对于更新的输入，严格基于 4 行记录，您可以使用模算术来维护当前记录的数组，并每隔 4 行检查第 3 行是否匹配：

$ awk '
    {a[FNR%4] = $0; getline b[FNR%4] < "fileB"} 
    !(FNR%4) && b[3] != a[3] {
      for(i=0;i<4;i++) print b[i%4]
    }
  ' fileA
record2 line1=header
record2 line2
record2 line3 id GHI <= this is different
record2 line4

（请注意，确实应该检查命令的返回值getline，并在失败时执行一些明智的操作）。

对于您最初发布的输入，您可以使用段落模式:

$ awk -vRS= -F'\n' '{A3 = $3}; getline "fileB" > -1 && $3 != A3' fileA
record2 line1=header
record2 line2
record2 line3 id DEF <= this is different
record2 line4

对于正常处理（来自的输入）和（来自的输入），空RS会导致读取整个空行分隔的记录。将字段分隔符设置为换行符 ( ) 然后允许我们保存其中的整行并与另一行进行比较。如果它们不相等，则默认打印输出（这是of 的整个记录）。fileAgetlinefileB\n$3$0getlinefileB

Question 2

这是一个可以执行您想要的操作的 Python 脚本：

#!/usr/bin/env python3
# -*- encoding: utf-8 -*-
"""compare.py"""

import sys

file_A = open(sys.argv[1], "r")
file_B = open(sys.argv[2], "r")

records_A = file_A.read().split("\n\n")
records_B = file_B.read().split("\n\n")

for record_A, record_B in zip(records_A, records_B):
    lines_A = record_A.split("\n")
    lines_B = record_B.split("\n")
    if lines_A[2] != lines_B[2]:
        print("{}\n".format(record_B))

你可以像这样运行它：

python compare.py fileA fileB

当我在示例数据上运行它时，我得到了所需的输出：

record2 line1=header
record2 line2
record2 line3 id GHI <= this is different
record2 line4

Answer

这是一个可以执行您想要的操作的 Python 脚本：

#!/usr/bin/env python3
# -*- encoding: utf-8 -*-
"""compare.py"""

import sys

file_A = open(sys.argv[1], "r")
file_B = open(sys.argv[2], "r")

records_A = file_A.read().split("\n\n")
records_B = file_B.read().split("\n\n")

for record_A, record_B in zip(records_A, records_B):
    lines_A = record_A.split("\n")
    lines_B = record_B.split("\n")
    if lines_A[2] != lines_B[2]:
        print("{}\n".format(record_B))

你可以像这样运行它：

python compare.py fileA fileB

当我在示例数据上运行它时，我得到了所需的输出：

record2 line1=header
record2 line2
record2 line3 id GHI <= this is different
record2 line4

比较 2 个文件中的每第 n 行并保存（非对称）上下文

答案1

答案2

相关内容