查找两个文件中重复的段落并删除一个

Question

就像我们有线条一样，但现在我们有了段落。解析两个文件，将第一个文件的段落放入哈希中，仅当第二个文件不存在时才打印第二个段落。

awk -v RS="" -v ORS="\n\n" 'FNR==NR{a[$0]; next} !($0 in a)' a.bib b.bib

输出：

@InProceedings{,
  title  = {This Is My Father's World Standard Tuning Traditional Fast Tempo - “Thumbpicking” Style Arrangement by Mark Hanson},
  year   = {2005},
  file   = {:MyFathersWorld_p2.pdf:PDF},
  groups = {Solo Tab},
}

请小心，因为任何地方的空白字符都可能导致其丢失重复项。也许您想diff一起运行一些来确认结果。

Answer 1

就像我们有线条一样，但现在我们有了段落。解析两个文件，将第一个文件的段落放入哈希中，仅当第二个文件不存在时才打印第二个段落。

awk -v RS="" -v ORS="\n\n" 'FNR==NR{a[$0]; next} !($0 in a)' a.bib b.bib

输出：

@InProceedings{,
  title  = {This Is My Father's World Standard Tuning Traditional Fast Tempo - “Thumbpicking” Style Arrangement by Mark Hanson},
  year   = {2005},
  file   = {:MyFathersWorld_p2.pdf:PDF},
  groups = {Solo Tab},
}

请小心，因为任何地方的空白字符都可能导致其丢失重复项。也许您想diff一起运行一些来确认结果。

查找两个文件中重复的段落并删除一个

答案1

相关内容