使用 awk 生成销售报告

Question 1

使用 printf 格式化输出。例如printf "%s, %.2f\n", i, a[i]。并通过管道输入sort对输出进行排序。例如：

按商店名称排序，使用 GNU 排序-V选项进行“版本”排序（也称为“自然排序”）：

$ awk -F, '{a[$2]+=$5;}END{for(i in a)printf "%s, %.2f\n", i, a[i]}' file.csv | sort -V -k1,1
Store1, 3285648.34
Store45, 1452589.89

按总销售额排序：

$ awk -F, '{a[$2]+=$5;}END{for(i in a)printf "%s, %.2f\n", i, a[i]}' file.csv | sort -k2,2
Store45, 1452589.89
Store1, 3285648.34

Answer

使用 printf 格式化输出。例如printf "%s, %.2f\n", i, a[i]。并通过管道输入sort对输出进行排序。例如：

按商店名称排序，使用 GNU 排序-V选项进行“版本”排序（也称为“自然排序”）：

$ awk -F, '{a[$2]+=$5;}END{for(i in a)printf "%s, %.2f\n", i, a[i]}' file.csv | sort -V -k1,1
Store1, 3285648.34
Store45, 1452589.89

按总销售额排序：

$ awk -F, '{a[$2]+=$5;}END{for(i in a)printf "%s, %.2f\n", i, a[i]}' file.csv | sort -k2,2
Store45, 1452589.89
Store1, 3285648.34

Question 2

使用for (i in a)循环会打乱输出索引的顺序a，请参阅https://www.gnu.org/software/gawk/manual/gawk.html#Scanning-an-Array。有更好的方法可以做到这一点，但由于您的商店已经在输入中排序，因此您根本不需要数组，只需一次处理一个商店即可在输出中以相同的方式保持商店排序。重新读取，这也更有内存和执行速度效率，因为您不需要将所有数据存储在内存中，然后循环遍历 END 部分中的所有存储。

$ cat tst.awk
BEGIN {
    FS = ","
    ofmt = "%s, %0.2f\n"
}
$2 != store {
    if ( NR > 2 ) {
        printf ofmt, store, tot
    }
    store = $2
    tot = 0
}
{ tot += $5 }
END {
    printf ofmt, store, tot
}

$ awk -f tst.awk file
Store1, 3285648.34
Store45, 1452589.89

Answer

使用for (i in a)循环会打乱输出索引的顺序a，请参阅https://www.gnu.org/software/gawk/manual/gawk.html#Scanning-an-Array。有更好的方法可以做到这一点，但由于您的商店已经在输入中排序，因此您根本不需要数组，只需一次处理一个商店即可在输出中以相同的方式保持商店排序。重新读取，这也更有内存和执行速度效率，因为您不需要将所有数据存储在内存中，然后循环遍历 END 部分中的所有存储。

$ cat tst.awk
BEGIN {
    FS = ","
    ofmt = "%s, %0.2f\n"
}
$2 != store {
    if ( NR > 2 ) {
        printf ofmt, store, tot
    }
    store = $2
    tot = 0
}
{ tot += $5 }
END {
    printf ofmt, store, tot
}

$ awk -f tst.awk file
Store1, 3285648.34
Store45, 1452589.89

使用 awk 生成销售报告

答案1

答案2

相关内容