这是我的制表符分隔文件 t.tsv:
$ cat t.tsv
2022/05/05 -258.03
2022/05/07 -18.10
2022/05/09 -10.74
2022/05/09 -132.60
2022/05/12 -18.56
2022/05/12 -20.20
2022/05/17 -11.00
2022/05/17 -112.91
2022/05/17 -51.43
2022/05/17 -64.78
2022/05/18 -13.96
2022/05/18 -13.96
2022/05/18 -7.51
2022/05/19 -17.08
2022/05/20 -33.08
我正在使用 MacOS 12.4 类型(来自手册页:排序实用程序符合 IEEE Std 1003.1-2008 (“POSIX.1”) 规范) 首先按 alpha seq 升序按 col 1 排序,然后按数字升序按 col2 排序。
$ cat t.tsv|sort --field-separator='\t' --key=1,1 --key=2,2n
2022/05/05 -258.03
2022/05/07 -18.10
2022/05/09 -10.74
2022/05/09 -132.60
2022/05/12 -18.56
2022/05/12 -20.20
2022/05/17 -11.00
2022/05/17 -112.91
2022/05/17 -51.43
2022/05/17 -64.78
2022/05/18 -13.96
2022/05/18 -13.96
2022/05/18 -7.51
2022/05/19 -17.08
2022/05/20 -33.08
我很困惑为什么第二列没有按升序排序数字当第一列相同时的顺序。许多 SE 对同一问题的回答都说 (a) 您将单个列指定为--key=1,1
,并且 (b) 您可以将诸如 之类的选项-n
应用于单个键定义,例如--key=2,2n
。
更新:我应该提到我的外壳是bash
.
答案1
我不知道有什么sort
实现可以理解\t
或其他此类字符表示,您需要使用ANSI-C 引用反而:
sort --field-separator=$'\t' --key=1,1 --key=2,2n t.tsv
另外,根据这个 macOS 手册页,”Apple 的 sort 手册页包含上述所有选项的 GNU 长选项,但这些选项(尚未)在 macOS 下实现。“ 在 macOS 的最新版本中, 和--key
都是--field-separator
针对 实现的sort
,但我仍然会使用标准的短选项来保证可移植性:
sort -t $'\t' -k 1,1 -k 2,2n t.tsv
上述命令在 macOS、GNU 和 busybox 中sort
返回:
$ sort -t $'\t' -k 1,1 -k 2,2n t.tsv
2022/05/05 -258.03
2022/05/07 -18.10
2022/05/09 -132.60
2022/05/09 -10.74
2022/05/12 -20.20
2022/05/12 -18.56
2022/05/17 -112.91
2022/05/17 -64.78
2022/05/17 -51.43
2022/05/17 -11.00
2022/05/18 -13.96
2022/05/18 -13.96
2022/05/18 -7.51
2022/05/19 -17.08
2022/05/20 -33.08