关联文件中的数据

关联文件中的数据

我有一个包含按列组织的大量数据的文件,我想提取第一列 $1 中的数据数量,这些数据在列 $18 中具有相同的值。

答案1

这里的“列”是什么意思——这个制表符是分隔的吗?

假设情况是这样:

awk -F'\t' '$1 == $18'

如果您使用其他分隔符,请更改传递给 的值-F

答案2

您有空字段,并且没有指定字段是否没有换行符。一般来说,但当然,当无法确认这不是一个简单的 CSV 文件时,您应该使用适当的 CSV 解析库。例如来自 python 的:

import csv

fp = csv.reader(open('your_input.csv'))
for line in fp:
    if line[0] == line[17]:
        print(line[0])

此类库会自动处理 CSV 文件格式中的大多数差异(例如,因为根据您的区域设置/语言,可能会使用分号而不是逗号),并处理多行引用字段

相关内容