文件内字符串部分唯一 - 仅保留第一个可用字符串

Question

一个简单的 awk 就足够了。形成一个哈希映射，由唯一标识符字符串作为键并仅打印这些行

awk -F_ '{ key = $1 FS $2 FS $3 $4 } !unique[key]++ ' file

将分隔符设置为时_，通过符号访问各个作品$1并形成直至包含的密钥$4。仅当该行（形成）的!unique[key]++键为不是已经看过。

这假设你的tasmax字符串出现在$1和historicalat 处$4，否则不起作用。

或者只是使用该工具，通过使用 fields进行定界sort来要求其唯一的 ( ) 行。适用于 BSD 和 GNU变体-u_1-4sort

sort -u -t_ -k1,4 < file

Answer 1

一个简单的 awk 就足够了。形成一个哈希映射，由唯一标识符字符串作为键并仅打印这些行

awk -F_ '{ key = $1 FS $2 FS $3 $4 } !unique[key]++ ' file

将分隔符设置为时_，通过符号访问各个作品$1并形成直至包含的密钥$4。仅当该行（形成）的!unique[key]++键为不是已经看过。

这假设你的tasmax字符串出现在$1和historicalat 处$4，否则不起作用。

或者只是使用该工具，通过使用 fields进行定界sort来要求其唯一的 ( ) 行。适用于 BSD 和 GNU变体-u_1-4sort

sort -u -t_ -k1,4 < file

相关内容