使用 find 组合唯一的文件对

Question 1

这是我的建议。

#!/bin/bash
files="empty"
for i in A B C D ; do
    for j in B C D ; do
     fn="$i$j"
     nf="$( echo $fn | rev )"
     # if nn is 1 $nf wasn't found in $files
      nn=1
      for q in $files ; do
        if [[ "$q" == "$nf" ]] ; then
               nn=0
         fi
        done
        if  [[  $nn -eq 1 ]] && [[ "$fn" != "$nf" ]] 
        then
           echo "cat $i.txt $j.txt >$fn.txt"
        fi
        files="$fn $nf $files"
    done
done

Answer

这是我的建议。

#!/bin/bash
files="empty"
for i in A B C D ; do
    for j in B C D ; do
     fn="$i$j"
     nf="$( echo $fn | rev )"
     # if nn is 1 $nf wasn't found in $files
      nn=1
      for q in $files ; do
        if [[ "$q" == "$nf" ]] ; then
               nn=0
         fi
        done
        if  [[  $nn -eq 1 ]] && [[ "$fn" != "$nf" ]] 
        then
           echo "cat $i.txt $j.txt >$fn.txt"
        fi
        files="$fn $nf $files"
    done
done

Question 2

您可以将命令的文件参数保存find到数组中。您也可以sort在保存之前进行操作。这里，使用了空分隔（-d ''for mapfile(== readarray), -print0forfind和-zfor sort），这需要 GNU 实用程序。

并为它们做一个双循环，从i整个长度到结束，并创建组合。您可以在那里处理文件参数的每个组合。ji+1

#!/bin/bash
mapfile -d '' arr < <(find . -type f -name '*.txt' -print0 | sort -z)

for ((i=0; i<"${#arr[@]}"; i++)); do
    for ((j=i+1; j<"${#arr[@]}"; j++)); do
        printf "Processing files: %s %s\n" "${arr[i]}" "${arr[j]}"
    done
done

Processing files: ./A.txt ./B.txt
Processing files: ./A.txt ./C.txt
Processing files: ./A.txt ./D.txt
Processing files: ./B.txt ./C.txt
Processing files: ./B.txt ./D.txt
Processing files: ./C.txt ./D.txt

对于您的具体示例，对于cat文件和具有所需的输出文件名（假设它们都在同一目录级别），您可以使用find ... -printf '%f\0', 仅打印文件名，并使用参数扩展删除子字符串，以创建命令。稍微修改后的版本，使用换行符作为文件名分隔符：

#!/bin/bash
mapfile -t arr < <(find . -type f -name '*.txt' -printf "%f\n" | sort)

for ((i=0; i<"${#arr[@]}"; i++)); do
    for ((j=i+1; j<"${#arr[@]}"; j++)); do
        cat "${arr[i]}" "${arr[j]}" > "${arr[i]%.*}${arr[j]}"
    done
done

Answer

您可以将命令的文件参数保存find到数组中。您也可以sort在保存之前进行操作。这里，使用了空分隔（-d ''for mapfile(== readarray), -print0forfind和-zfor sort），这需要 GNU 实用程序。

并为它们做一个双循环，从i整个长度到结束，并创建组合。您可以在那里处理文件参数的每个组合。ji+1

#!/bin/bash
mapfile -d '' arr < <(find . -type f -name '*.txt' -print0 | sort -z)

for ((i=0; i<"${#arr[@]}"; i++)); do
    for ((j=i+1; j<"${#arr[@]}"; j++)); do
        printf "Processing files: %s %s\n" "${arr[i]}" "${arr[j]}"
    done
done

Processing files: ./A.txt ./B.txt
Processing files: ./A.txt ./C.txt
Processing files: ./A.txt ./D.txt
Processing files: ./B.txt ./C.txt
Processing files: ./B.txt ./D.txt
Processing files: ./C.txt ./D.txt

对于您的具体示例，对于cat文件和具有所需的输出文件名（假设它们都在同一目录级别），您可以使用find ... -printf '%f\0', 仅打印文件名，并使用参数扩展删除子字符串，以创建命令。稍微修改后的版本，使用换行符作为文件名分隔符：

#!/bin/bash
mapfile -t arr < <(find . -type f -name '*.txt' -printf "%f\n" | sort)

for ((i=0; i<"${#arr[@]}"; i++)); do
    for ((j=i+1; j<"${#arr[@]}"; j++)); do
        cat "${arr[i]}" "${arr[j]}" > "${arr[i]%.*}${arr[j]}"
    done
done

Question 3

如果您可以使用perl并假设您的文件名“行为良好”：

find ... |
perl -0777 -MMath::Combinatorics -anE \
  'BEGIN{$,=" "}; say sort(@$_) for (combine(2, @F))' |
sort

输入时输出A\nB\nC\nD\n：

A B
A C
A D
B C
B D
C D

要重新创建您的示例（GNU sed）：

... |
sed -E 's/([^.]+).([^ ]+) ([^.]+).([^ ]+)/cat \1.\2 \3.\4 > \1\3.\2/'

cat A.txt B.txt > AB.txt
cat A.txt C.txt > AC.txt
cat A.txt D.txt > AD.txt
cat B.txt C.txt > BC.txt
cat B.txt D.txt > BD.txt
cat C.txt D.txt > CD.txt

然后可以通过管道传输到 shell 来执行或使用/eGNU sed 中的标志来完成。

Answer

如果您可以使用perl并假设您的文件名“行为良好”：

find ... |
perl -0777 -MMath::Combinatorics -anE \
  'BEGIN{$,=" "}; say sort(@$_) for (combine(2, @F))' |
sort

输入时输出A\nB\nC\nD\n：

A B
A C
A D
B C
B D
C D

要重新创建您的示例（GNU sed）：

... |
sed -E 's/([^.]+).([^ ]+) ([^.]+).([^ ]+)/cat \1.\2 \3.\4 > \1\3.\2/'

cat A.txt B.txt > AB.txt
cat A.txt C.txt > AC.txt
cat A.txt D.txt > AD.txt
cat B.txt C.txt > BC.txt
cat B.txt D.txt > BD.txt
cat C.txt D.txt > CD.txt

然后可以通过管道传输到 shell 来执行或使用/eGNU sed 中的标志来完成。

使用 find 组合唯一的文件对

答案1

答案2

答案3

相关内容