awk：删除字段 1 和 2 重复的行

Question

不需要两次处理同一个文件，应用以下逻辑就足够了：

awk -F, '!a[$1,$2]++' blueprint_param_file.csv

!a[$1,$2]++- 确保至关重要的key（第一个和第二个字段的串联）在 array 中仅出现一次a，从而排除重复项

输出：

spark2-env,spark_thrift_cmd_opts,--driver-memory 15g --executor-cores 7
spark2-thrift-sparkconf,spark.memory.offHeap.enabled,true
mapred-site,yarn.app.mapreduce.am.command-opts,-Xmx5324m -Dhdp.version=${hdp.version}

Answer 1

不需要两次处理同一个文件，应用以下逻辑就足够了：

awk -F, '!a[$1,$2]++' blueprint_param_file.csv

!a[$1,$2]++- 确保至关重要的key（第一个和第二个字段的串联）在 array 中仅出现一次a，从而排除重复项

输出：

spark2-env,spark_thrift_cmd_opts,--driver-memory 15g --executor-cores 7
spark2-thrift-sparkconf,spark.memory.offHeap.enabled,true
mapred-site,yarn.app.mapreduce.am.command-opts,-Xmx5324m -Dhdp.version=${hdp.version}

awk：删除字段 1 和 2 重复的行

答案1

相关内容