BASH：AWK 将 CSV 转入所需的表

Question 1

$ mlr --icsvlite --opprint \
    reshape -s status,count then unsparsify then reorder -e -f CLEARED finalcount.csv
state CONGESTED CLEARED
NW    11        9
ACT   7         7
QLD   -         5
WA    3         2
VIC   2         3

GNU 数据整合对于数据透视表（又名交叉表）之类的东西也很方便，尽管似乎没有任何简单的方法来控制列顺序：

datamash --header-in --filler=- -t, crosstab 1,2 unique 3 < finalcount.csv | csvformat -T
         CLEARED  CONGESTED
ACT      7          7
NW       9          11
QLD      5          -
VIC      3          2
WA       2          3

如果你确实需要使用 Awk，那么这样的东西应该可以工作：

awk -F, '
  NR>1 {s[$1]} 
  $2 == "CONGESTED" {a[$1]=$3} 
  $2 == "CLEARED" {b[$1]=$3} 
  END {
    printf "state\tcongested\tcleared\n"; 
    for (k in s) 
      printf "%s\t%s\t%s\n", k, a[k]=="" ? "-" : a[k], b[k]=="" ? "-" : b[k]      
  }
' finalcount.csv

Answer

使用磨坊主：

$ mlr --icsvlite --opprint \
    reshape -s status,count then unsparsify then reorder -e -f CLEARED finalcount.csv
state CONGESTED CLEARED
NW    11        9
ACT   7         7
QLD   -         5
WA    3         2
VIC   2         3

GNU 数据整合对于数据透视表（又名交叉表）之类的东西也很方便，尽管似乎没有任何简单的方法来控制列顺序：

datamash --header-in --filler=- -t, crosstab 1,2 unique 3 < finalcount.csv | csvformat -T
         CLEARED  CONGESTED
ACT      7          7
NW       9          11
QLD      5          -
VIC      3          2
WA       2          3

如果你确实需要使用 Awk，那么这样的东西应该可以工作：

awk -F, '
  NR>1 {s[$1]} 
  $2 == "CONGESTED" {a[$1]=$3} 
  $2 == "CLEARED" {b[$1]=$3} 
  END {
    printf "state\tcongested\tcleared\n"; 
    for (k in s) 
      printf "%s\t%s\t%s\n", k, a[k]=="" ? "-" : a[k], b[k]=="" ? "-" : b[k]      
  }
' finalcount.csv

Question 2

$ cat tst.awk
BEGIN { FS=","; OFS="\t" }
{ sub(/\r$/,"") }
NR > 1 {
    states[$1]
    statuses[$2]
    vals[$1,$2] = $NF
}
END {
    printf "%s", "state"
    for (status in statuses) {
        printf "%s%s", OFS, status
    }
    print ""

    for (state in states) {
        printf "%s", state
        for (status in statuses) {
            printf "%s%s", OFS, ((state,status) in vals ? vals[state,status] : "-")
        }
        print ""
    }
}

。

$ awk -f tst.awk file
state   CONGESTED       CLEARED
QLD     -       5
ACT     7       7
WA      3       2
NW      11      9
VIC     2       3

。

$ awk -f tst.awk file | column -s $'\t' -t
state  CONGESTED  CLEARED
QLD    -          5
ACT    7          7
WA     3          2
NW     11         9
VIC    2          3

Answer

$ cat tst.awk
BEGIN { FS=","; OFS="\t" }
{ sub(/\r$/,"") }
NR > 1 {
    states[$1]
    statuses[$2]
    vals[$1,$2] = $NF
}
END {
    printf "%s", "state"
    for (status in statuses) {
        printf "%s%s", OFS, status
    }
    print ""

    for (state in states) {
        printf "%s", state
        for (status in statuses) {
            printf "%s%s", OFS, ((state,status) in vals ? vals[state,status] : "-")
        }
        print ""
    }
}

。

$ awk -f tst.awk file
state   CONGESTED       CLEARED
QLD     -       5
ACT     7       7
WA      3       2
NW      11      9
VIC     2       3

。

$ awk -f tst.awk file | column -s $'\t' -t
state  CONGESTED  CLEARED
QLD    -          5
ACT    7          7
WA     3          2
NW     11         9
VIC    2          3

BASH：AWK 将 CSV 转入所需的表

答案1

答案2

相关内容