我有以下制表符分隔的数据:
数据集 | ID | 价值 |
---|---|---|
A | 1 | 10 |
A | 2 | 20 |
A | 3 | 30 |
乙 | 1 | 40 |
乙 | 2 | 50 |
乙 | 3 | 60 |
我想转换为以下内容:
ID | A | 乙 |
---|---|---|
1 | 10 | 40 |
2 | 20 | 50 |
3 | 30 | 60 |
我知道如何在 r 和 python 中执行此操作,但是这是一个非常大的文件,包含约 600 个不同的数据集和约 30,000 个不同的 ID
感谢您的时间和帮助
答案1
找到了。
datamash crosstab 2,1 unique 3 < input.tsv > output.tsv