有条件地更改csv中的第二列

Question

bash解决方案：

readarray -t filename < <(cut -d ',' -f1 train.csv)
readarray -t class < <(cut -d ',' -f2 train.csv)

for (( i=0; i<${#filename[@]}; i++ )); do
    printf '%s,%s\n' "${filename[$i]}" "${class[$((i-1))]}";
done > new_file.csv

等效awk解决方案：

awk -F, '
    {
        filename[NR]=$1
        class[NR]=$2
    }
    END {
        OFS=","
        print filename[1],class[NR]
        for (i=2;i<=NR;i++) {
            print filename[i],class[i-1]
        }
    }
' train.csv > new_file.csv

两种解决方案都首先将行读入数组filename和 class。唯一的区别是bash数组以开头0，awk数组以开头1。

然后，我们循环遍历数组并打印所需的输出。在awk解决方案中，我们需要单独处理第一行，因为与不同bash，array[-1]它不返回最后一个元素。

解决awk方法比较快一点。

Answer 1

bash解决方案：

readarray -t filename < <(cut -d ',' -f1 train.csv)
readarray -t class < <(cut -d ',' -f2 train.csv)

for (( i=0; i<${#filename[@]}; i++ )); do
    printf '%s,%s\n' "${filename[$i]}" "${class[$((i-1))]}";
done > new_file.csv

等效awk解决方案：

awk -F, '
    {
        filename[NR]=$1
        class[NR]=$2
    }
    END {
        OFS=","
        print filename[1],class[NR]
        for (i=2;i<=NR;i++) {
            print filename[i],class[i-1]
        }
    }
' train.csv > new_file.csv

两种解决方案都首先将行读入数组filename和 class。唯一的区别是bash数组以开头0，awk数组以开头1。

然后，我们循环遍历数组并打印所需的输出。在awk解决方案中，我们需要单独处理第一行，因为与不同bash，array[-1]它不返回最后一个元素。

解决awk方法比较快一点。

有条件地更改csv中的第二列

答案1

相关内容