n 个文件的通讯

Question 1

meld（然而它是一个图形程序）仍然可以管理文件之间的三向比较（即n=3），但是对于任何更大的东西，实现这一点在计算上会变得越来越复杂，所以我不知道是否有一个真正的“广义” diff（或comm）工具”是完全可行的。

Answer

meld（然而它是一个图形程序）仍然可以管理文件之间的三向比较（即n=3），但是对于任何更大的东西，实现这一点在计算上会变得越来越复杂，所以我不知道是否有一个真正的“广义” diff（或comm）工具”是完全可行的。

Question 2

你可以尝试下面的方法。它具有以下特点：

输出完全遵循您的示例
值在处理过程中进行排序
- => 可以跳过预排序
- => 不保留原始订单
输入文件名已排序。
重复的值被清理并合并为仅出现一次（从而还修复了脚本中的一个错误，该错误显示重复值的奇怪行为）
需要最新的 GNU AWK，因为它使用其内置的数组排序功能
为 UNIX 行结尾量身定制，不同行结尾样式的混合会导致奇怪的效果。（对于程序“ a”和“ a\r”是不同的东西！）

只需将代码保存到文本文件中并提供执行权限即可将其用作 shell 脚本的直接替代品。您的处理速度应该会有所加快。（实际上是几个数量级。）：）

#!/usr/bin/gawk -f
{
    all[$0]
    filenames[FILENAME]
    input[$0,FILENAME]=$0
    # if you only wanted to to mark existence
    # then uncomment the following line 
    # input[$0,FILENAME]="*"
}

END {
    PROCINFO["sorted_in"]="@ind_str_asc"
    printf "all"
    for (i in filenames) {
        printf("\t%s",i)
    }
    for (i in all) {
        printf("\n%s",i)
        for (j in filenames) {
            printf("\t%s",input[i,j])
        }
    }
    print ""
}

Answer

你可以尝试下面的方法。它具有以下特点：

输出完全遵循您的示例
值在处理过程中进行排序
- => 可以跳过预排序
- => 不保留原始订单
输入文件名已排序。
重复的值被清理并合并为仅出现一次（从而还修复了脚本中的一个错误，该错误显示重复值的奇怪行为）
需要最新的 GNU AWK，因为它使用其内置的数组排序功能
为 UNIX 行结尾量身定制，不同行结尾样式的混合会导致奇怪的效果。（对于程序“ a”和“ a\r”是不同的东西！）

只需将代码保存到文本文件中并提供执行权限即可将其用作 shell 脚本的直接替代品。您的处理速度应该会有所加快。（实际上是几个数量级。）：）

#!/usr/bin/gawk -f
{
    all[$0]
    filenames[FILENAME]
    input[$0,FILENAME]=$0
    # if you only wanted to to mark existence
    # then uncomment the following line 
    # input[$0,FILENAME]="*"
}

END {
    PROCINFO["sorted_in"]="@ind_str_asc"
    printf "all"
    for (i in filenames) {
        printf("\t%s",i)
    }
    for (i in all) {
        printf("\n%s",i)
        for (j in filenames) {
            printf("\t%s",input[i,j])
        }
    }
    print ""
}

n 个文件的通讯

答案1

答案2

相关内容