给出命令删除重复行，但重复行在 .txt 文件中存在一些变化

Question 1

$ awk -F: '$1 != p && /RESULT/ { print; p = $1 }' file
ligand_06278/out.pdbqt:REMARK VINA RESULT:      -8.3      2.094      2.612
ligand_06279/out.pdbqt:REMARK VINA RESULT:      -6.1      9.841     13.115
ligand_06280/out.pdbqt:REMARK VINA RESULT:     -10.0      3.811      7.264

RESULT这将输出输入文件中提到的每个文件的第一行。它通过将第一列（文件名）与上一行的第一列进行比较并测试当前行是否包含单词来实现此目的RESULT。当找到与前一行具有不同文件名的行时，将按原样打印该行，并更新RESULT的值。p

我注意到输入文件看起来非常像grep运行多个文件的结果，可能是 grep 查找REMARK.

要查找所有文件并获取每个文件的第一行匹配REMARK VINA RESULT：

find . -type f -path './ligand_*' -name 'out.pdbqt' -exec sed -n '/REMARK VINA RESULT/{p;q;}' {} ';'

或者，作为一个简单的循环：

for name in ligand_*/out.pdbqt; do
    grep -F 'REMARK VINA RESULT' "$name" | head -n 1
done

我在这里使用了不同的方法，您选择感觉最自然的一种。

Answer

$ awk -F: '$1 != p && /RESULT/ { print; p = $1 }' file
ligand_06278/out.pdbqt:REMARK VINA RESULT:      -8.3      2.094      2.612
ligand_06279/out.pdbqt:REMARK VINA RESULT:      -6.1      9.841     13.115
ligand_06280/out.pdbqt:REMARK VINA RESULT:     -10.0      3.811      7.264