我的文件有 4 个数字列。下面测试列是否被正确识别。tail -n +2
是删除标题。
tail -n +2 file.txt | awk '{print $1,$2,$3,$4}' | head
41261311 41261568 2798880 2799128
-115939711 -115940021 2799541 2799827
-115939159 -115939706 2800137 2800685
-115939033 -115939106 2801113 2801186
-115938419 -115938978 2801191 2801726
-115937404 -115937535 2812511 2812642
-115937075 -115937323 2813756 2814011
-115910025 -115910146 2818095 2818198
-115909932 -115909986 2818205 2818262
-115909723 -115909789 2818703 2818768
我想添加第五列,即 col4 减去 col3。
tail -n +2 file.txt | awk '{print $1,$2,$3,$4,$4-$3}' | head
2481311 41261568 2798880 2799128
286939711 -115940021 2799541 2799827
548939159 -115939706 2800137 2800685
735939033 -115939106 2801113 2801186
535938419 -115938978 2801191 2801726
131937404 -115937535 2812511 2812642
255937075 -115937323 2813756 2814011
103910025 -115910146 2818095 2818198
575909932 -115909986 2818205 2818262
655909723 -115909789 2818703 2818768
它没有添加第五列,而是对第一列做了一些奇怪的事情。
答案1
您的文件以 (Windows) 结尾,CR LF
而不是 (Unix) LF
。
该CR
角色将行移动到开头,然后新计算列的值将打印在第一列上。
要么使用dos2unix
,要么使用过滤文件,tr -d '\r'
或者简单地使用:
awk 'NR>2 { gsub(/\r/,""); print $1,$2,$3,$4,$4-$3 } NR>12{exit}' file
删除最后一个NR>12{exit}
以处理整个文件。