从文件夹中的多个文件中删除重复行：仅检查某个范围内的文件

Question

我修改了脚本以 4 乘 4 循环文件 - 在大约 20 个文件上进行了测试，看起来它正在工作。该脚本会将文件名存储在一个数组中，然后将它们 4 by 4 循环：

    temp=$(mktemp)

    declare -a files=($(echo *.json|sort))
    length=$(echo ${#files[@]})

    for ((i=0;i<length;i++))
    do
      for ((j=0;j<=3;j++))
      do
        [ "${files[i]}" == "${files[i+j]}" ] && continue
        [ "$((i+j))" -ge "$length" ] && continue
        echo ${files[i]} ${files[i+j]}
        #grep -w -Ff ${files[i]} -v ${files[i+j]} > ${temp}
        #mv ${temp} ${files[i+j]}
      done
    done

我这里只是echo输出，如果你认为它工作正常，那么删除注释。

Answer 1

我修改了脚本以 4 乘 4 循环文件 - 在大约 20 个文件上进行了测试，看起来它正在工作。该脚本会将文件名存储在一个数组中，然后将它们 4 by 4 循环：

    temp=$(mktemp)

    declare -a files=($(echo *.json|sort))
    length=$(echo ${#files[@]})

    for ((i=0;i<length;i++))
    do
      for ((j=0;j<=3;j++))
      do
        [ "${files[i]}" == "${files[i+j]}" ] && continue
        [ "$((i+j))" -ge "$length" ] && continue
        echo ${files[i]} ${files[i+j]}
        #grep -w -Ff ${files[i]} -v ${files[i+j]} > ${temp}
        #mv ${temp} ${files[i+j]}
      done
    done

我这里只是echo输出，如果你认为它工作正常，那么删除注释。

从文件夹中的多个文件中删除重复行：仅检查某个范围内的文件

答案1

相关内容