如何在 awk 中编写脚本来告诉每个记录中字段的平均长度，而不计算空格？

Question

您可以按照您的建议，通过依赖默认字段分隔符并计算字段大小来跳过空格，并通过使用变量来考虑不同数量的字段NF。

因此对于每条记录的平均值：

NF > 0 {
    linesum = 0
    for (i = 1; i <= NF; i++) linesum += length($i)
    print "Average field length for record: " linesum / NF
}

对于整个文件：

{
    for (i = 1; i <= NF; i++) sum += length($i)
    count += NF
}

END { if (count > 0) { print "Average field length in file: " (sum / count) } }

这也解决了逐行计算平均值的问题。

根据您的示例，平均值为 4.17857（计算标点符号）。

Answer 1

您可以按照您的建议，通过依赖默认字段分隔符并计算字段大小来跳过空格，并通过使用变量来考虑不同数量的字段NF。

因此对于每条记录的平均值：

NF > 0 {
    linesum = 0
    for (i = 1; i <= NF; i++) linesum += length($i)
    print "Average field length for record: " linesum / NF
}

对于整个文件：

{
    for (i = 1; i <= NF; i++) sum += length($i)
    count += NF
}

END { if (count > 0) { print "Average field length in file: " (sum / count) } }

这也解决了逐行计算平均值的问题。

根据您的示例，平均值为 4.17857（计算标点符号）。

相关内容