我有一个 CSV 文件,其中包含 10 个不同的字段(,
是分隔符)。示例数据:
student-id,last,first,hwk1,hwk2,hwk3,exam1,hwk4,hwk5,exam2
pts-avail,,,100,150,100,200,150,100,300
991-78-7872,Thompson,Ken,95,143,79,185,135,95,259
我需要交换field2
和field3
使用sed
,但很难理解如何编写正则表达式。
我尝试过其他变体:
sed 's/\(.*[,]\)\(.*[,]\)\(.*[,]\)/\1\3\2/g' test
在我的测试文件中:
abc,def,ghi,jkl
1234,5678,abcd,efgh
它工作得很好......我已经看这个有一段时间了但无法弄清楚。有人可以提供一些指导吗?
答案1
尝试:
sed 's/^\([^,]*,\)\([^,]*,\)\([^,]*\)/\1\3\2/'
细分:
'^' start at the beginning of the line
\( \) a grouping
[^,] any character except ','
* zero or more times
, the character ','
重复\([^,]*,\)
三遍。该行的其余部分保持不变且不匹配。
使用 awk:
awk 'BEGIN {FS=OFS=","}{t=$2;$2=$3;$3=t;print}'
答案2
非sed
溶液使用q:
$ q -d, -H -O 'select [student-id],first,last,hwk1,hwk2,hwk3,exam1,hwk4,hwk5,exam2 from sample.csv'
student-id,first,last,hwk1,hwk2,hwk3,exam1,hwk4,hwk5,exam2
pts-avail,,,100,150,100,200,150,100,300
991-78-7872,Ken,Thompson,95,143,79,185,135,95,259