我有一个包含按列组织的大量数据的文件,我想提取第一列 $1 中的数据数量,这些数据在列 $18 中具有相同的值。
答案1
这里的“列”是什么意思——这个制表符是分隔的吗?
假设情况是这样:
awk -F'\t' '$1 == $18'
如果您使用其他分隔符,请更改传递给 的值-F
。
答案2
您有空字段,并且没有指定字段是否没有换行符。一般来说,但当然,当无法确认这不是一个简单的 CSV 文件时,您应该使用适当的 CSV 解析库。例如来自 python 的:
import csv
fp = csv.reader(open('your_input.csv'))
for line in fp:
if line[0] == line[17]:
print(line[0])
此类库会自动处理 CSV 文件格式中的大多数差异(例如,因为根据您的区域设置/语言,可能会使用分号而不是逗号),并处理多行引用字段