用于操作 csv 文件的 Bash 脚本

用于操作 csv 文件的 Bash 脚本

我有以下 csv 文件:

    "V1","V2","V3","V4","V5","V6","V7","V8","V9","V10","Class"
65,Female,0.7,0.1,187,16,18,6.8,3.3,0.9,1
62,Male,10.9,5.5,699,64,100,7.5,3.2,0.74,1
62,Male,7.3,4.1,490,60,68,7,3.3,0.89,1
58,Male,1,0.4,182,14,20,6.8,3.4,1,1
72,Male,3.9,2,195,27,59,7.3,2.4,0.4,1
46,Male,1.8,0.7,208,19,14,7.6,4.4,1.3,1

我只对 V1:age、V2:sex、V8:grade1、V9:grade2 列感兴趣。

我想创建一个 bash 脚本,它将输出 V9 等于 3 的数据,并按性别对输出进行排序,首先显示女性数据。

我是 bash 脚本的 100% 初学者,虽然我知道如何从 shell 获取此输出,但我只能在涉及 bash 脚本命令时想到这个:

#!/usr/bin/env bash

INPUT=./phpOJxGL9.csv
OLDIFS=$IFS
IFS=','
[ ! -f $INPUT ] && { echo "$INPUT file not found"; exit 99; }

echo Grade2 = 3
echo Age Sex Grade2 Grade1 
echo '************************'


while read V1 V2 V3 V4 V5 V6 V7 V8 V9 V10

do
      if [ $V9 -eg "3" ];
      then
      cut -d',' -f1,2,8,9 | sort -k2 -t','
      fi
      

done < $INPUT
IFS=$OLDIFS

输出应该看起来像这样:

在此输入图像描述

有人可以帮忙吗?

答案1

您自己的 bash 脚本是一个好的开始。但使用合适的工具可以让生活变得更轻松。这是一个示例:您的示例输入没有任何 v9=3,因此我使用 v9>=3 只是为了演示该命令。

tail -n+2 your-input | awk -F, '($9>=3){print $1, $2, $8, $9}' | sort -k2 | awk 'OFS="," {print $1,$2,$3,$4}'

65,Female,6.8,3.3
58,Male,6.8,3.4
62,Male,7,3.3
62,Male,7.5,3.2
46,Male,7.6,4.4

说明:tail -n+2 只是删除标题行。

请注意,在使用排序列选项之前,我们必须使用制表符或空格分隔

第二个 awk 是用逗号替换空格

答案2

你的剧本已经快完成了。剩下的唯一事情就是检查 if 条件 if V9is equal to 3。为了首先显示女性数据,我建议将 while 循环放入需要性别作为第一个参数的函数中,然后为每个性别运行该函数一次。

INPUT=phpOJxGL9.csv
OLDIFS=$IFS
IFS=','

[ ! -f $INPUT ] && { echo "$INPUT file not found"; exit 99; }

function readCsv {
    while read V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
    do
        requiredGender="$1"

        if [[ "$V2" == "$requiredGender" ]]
        then
            if [[ "$V9" == "3" ]]
            then
                echo "$V1,$V2,$V8,$V9"
            fi
        fi
    done < $INPUT
}

echo Grade2 = 3
echo Age Sex Grade2 Grade1 
echo '************************'

echo
echo "Women"
echo "--------------"

readCsv "Female"

echo
echo "Men"
echo "--------------"

readCsv "Male"

IFS=$OLDIFS

您必须使脚本可执行才能运行它:

chmod +x script.sh
./script.sh

请记住,您上面提供的 csv 文件不包含V9等于 的单个列3,因此运行上面的脚本不会输出任何数据。我添加了这两个示例列:

50,Female,,,,,,1,3,,
50,Male,,,,,,1,3,,

这是脚本的输出:

Grade2 = 3
Age Sex Grade2 Grade1
************************

Women
--------------
50,Female,1,3

Men
--------------
50,Male,1,3

相关内容