答案1
使用这个命令:
awk '{ name[$1]++ }
END { PROCINFO["sorted_in"] = "@ind_str_asc"
for (v1 in name) for (v2 in name) if (v1 < v2) print v1, v2 }
' files.dat
PROCINFO
可能是一个gawk
扩展。如果您awk
不支持它,只需省略该PROCINFO["sorted_in"] = "@ind_str_asc"
行并将输出通过管道传输到sort
(如果您希望对输出进行排序)。
(这确实不是要求对输入进行排序。)
答案2
如果您已经ruby
安装:
$ ruby -0777 -F'\n' -lane '$F.combination(2) { |c| puts c.join(" ")}' ip.txt
a b
a c
a d
a e
b c
b d
b e
c d
c e
d e
-0777
slurp整个文件(应该没问题,因为OP中提到文件大小很小)-F'\n'
基于换行符分割,因此每一行将是$F
数组中的一个元素$F.combination(2)
2
一次生成组合元素{ |c| puts c.join(" ")}
按要求打印- 如果输入文件可以包含重复项,请使用
$F.uniq.combination(2)
一次 3 个元素:
$ ruby -0777 -F'\n' -lane '$F.combination(3) { |c| puts c.join(" ")}' ip.txt
a b c
a b d
a b e
a c d
a c e
a d e
b c d
b c e
b d e
c d e
与perl
(非通用)
$ perl -0777 -F'\n' -lane 'for $i (0..$#F) {
for $j ($i+1..$#F) {
print "$F[$i] $F[$j]\n" } }' ip.txt
a b
a c
a d
a e
b c
b d
b e
c d
c e
d e
和awk
$ awk '{ a[NR]=$0 }
END{ for(i=1;i<=NR;i++)
for(j=i+1;j<=NR;j++)
print a[i], a[j] }' ip.txt
a b
a c
a d
a e
b c
b d
b e
c d
c e
d e
答案3
$ join -j 2 -o 1.1,2.1 file file | awk '!seen[$1,$2]++ && !seen[$2,$1]++'
a b
a c
a d
a e
b c
b d
b e
c d
c e
d e
这假设输入文件中没有行包含任何空格。它还假设该文件已排序。
该join
命令创建文件中各行的完整叉积。它通过在不存在的字段上将文件与其自身连接起来来实现此目的。非标准-j 2
可以被替换为-1 2 -2 2
(但不能被替换,-j2
除非您使用 GNU join
)。
该awk
命令读取此结果,并且仅输出尚未见过的对的结果。
答案4
这是一个纯外壳的。
test $# -gt 1 || exit
a=$1
shift
for f in "$@"
do
echo $a $f
done
exec /bin/sh $0 "$@"
例子:
~ (137) $ sh test.sh $(cat file.dat)
a b
a c
a d
a e
b c
b d
b e
c d
c e
d e
~ (138) $