datamash 交叉表,包含每行、每列的计数;后排序
对于每对看起来都像的巨大列表 incident_N, name_M ...我需要创建一个“高级”交叉表datamash: 对于每个incident,它还应该显示所name涉及的 s的计数 对于每个name,它还应该显示incident所涉及的 s的计数 之后,行和列最好按照“参与”的数量进行排序:请参阅下面示例表中以黄色突出显示的行/列: ...
对于每对看起来都像的巨大列表 incident_N, name_M ...我需要创建一个“高级”交叉表datamash: 对于每个incident,它还应该显示所name涉及的 s的计数 对于每个name,它还应该显示incident所涉及的 s的计数 之后,行和列最好按照“参与”的数量进行排序:请参阅下面示例表中以黄色突出显示的行/列: ...
我有一个将近 2000 行的文件。文件格式是这样的: 12 34 0 2 2 3 7 9 1 2 306 237 0 9 12 134 2 7 2 9 306 3 我正在尝试编写一个 bash 脚本来删除重复的第一列并按第二列进行组织。我期望这个输出: 0 2 9 1 2 2 3 7 9 7 9 12 34 134 306 237 3 我尝试了一些代码,但没有得到所需的输出。我怎样才能实现这一目标以及我应该使用什么? ...
请注意,我知道datamash并且是一位经验丰富的awk用户。我正在寻找比awk.假设我有以下内容: // data_file foo bar biz 10 100 1000 11 150 990 10 95 1010 9 99 950 // usage goal, in pseudo code cat data_file | <tool> --ratio foo,bar --ratio foo,biz --ratio bar,biz // desired output foo bar biz foo_bar foo_bi...
在GNU 数据混合,如何countunique在所有列上运行字段操作(在我的例子中为 )? 例如,在伪代码中: cat BFCSV.csv | datamash -t',' countunique * ...