如何从 txt 文件中的两列中获取值并将它们与另一个文件中的值进行匹配

如何从 txt 文件中的两列中获取值并将它们与另一个文件中的值进行匹配

我有两个文本文件,格式如下:

例如文件1:

   900        480   10060.62       2740 -266864.19 3843493.50    2740.00       2740     176.07
   900        479   10046.50       2741 -266874.34 3843486.00    2741.00       2741     176.07
   900        478   10032.38       2742 -266884.47 3843478.50    2742.00       2742     176.07
   900        477   10018.26       2743 -266894.62 3843471.00    2743.00       2743     176.07

例如文件2:

   -2.68785700E+05  3.84401270E+06         313.33   2740.00    313.33 2740 1.401298E-044 2 LY1-0900
   -2.68783800E+05  3.84400040E+06         313.35   2741.00    313.35 2741 1.401298E-044 2 LY1-0900
   -2.68781900E+05  3.84398810E+06         313.36   2742.00    313.36 2742 1.401298E-044 2 LY1-0900
   -2.68780000E+05  3.84397580E+06         313.38   2743.00    313.38 2743 1.401298E-044 2 LY1-0900

我需要根据文件 1 中的第 1 列和第 7 列以及文件 2 中的第 9 列和第 4 列中的值的匹配,将文件 2 中的前两列替换为文件 1 中的第 5 列和第 6 列。

让我举例说明脚本的作用听起来很令人困惑......

取出文件 2 中的第一行,找到文件 1 中第一列值 (900) 与第 9 列 (0900) 的最后 4 位数字匹配且第 7 列值 (2740.00) 与第 4 列值 (2740.00) 匹配的行,然后替换列 1 file2 中的 2 包含文件 1 中的第 5 列和第 6 列。

IE

   -2.68785700E+05  3.84401270E+06         313.33   2740.00    313.33 2740 1.401298E-044 2 LY1-0900

变成

   -266864.19           3843493.50         313.33   2740.00    313.33 2740 1.401298E-044 2 LY1-0900

然后移动到下一行等,最后输出一个新文件。

所需的输出如下所示:

   -266864.19     3843493.50         313.33   2740.00    313.33 2740 1.401298E-044 2 LY1-0900
   -266874.34     3843486.00         313.35   2741.00    313.35 2741 1.401298E-044 2 LY1-0900
   -266884.47     3843478.50         313.36   2742.00    313.36 2742 1.401298E-044 2 LY1-0900
   -266894.62     3843471.00         313.38   2743.00    313.38 2743 1.401298E-044 2 LY1-0900

我基本上是想查找二维表面的新空间坐标。

这些值可能并不总是按顺序排列,并且文件可能相对较大(600 万行),因此如果脚本高效,它将很有用。

答案1

您可以使用以下脚本作为示例:

#!/bin/sh
outfile="outfile"
echo "testfile1:"
cat testfile1
echo "testfile2:"
cat testfile2
cat /dev/null > $outfile
cat testfile1 | while read line; do
    matchfirst="`echo $line | awk '{print $3}'`"
    matchsecond="`echo $line | awk '{print $4}'`"
    finded="false"
    while read defline; do
        tplfirst="`echo $defline | awk '{print $3}'`"
        tplsecond="`echo $defline | awk '{print $4}'`"
        if [ "$tplfirst" = "$matchfirst" ] && [ "$tplsecond" = "$matchsecond" ]; then
            echo -n "`echo $defline | awk '{print $1}'` `echo $defline | awk '{print $2}'` `echo $line | awk '{print $3}'` `echo $line | awk '{print $4}'`"  >> $outfile
            echo >> $outfile
            finded="true"
        fi
    done < testfile2 
    if [ "$finded" = "false" ]; then
        echo $line >> $outfile
    fi
done

echo "outfile:"
cat outfile

使用示例:

➜ sild@$work 15:29:55 [test]$ ./replacer.sh 
testfile1:
1 2 3 4
5 6 7 8
9 10 11 12
testfile2:
11 21 3 4
51 61 7 8
9 10 111 121
outfile:
11 21 3 4
51 61 7 8
9 10 11 12

这是你的目标吗?

答案2

尝试这个:

awk 'FNR==NR{
    a[$1"@"$7]=$5" "$6;
    next
}
{
    i=length($NF);
    n=substr( $NF, i-2, i);
    if( n"@"$4 in a) {
        split(a[n"@"$4],b," ")
    };
    $1=b[1];
    $2=b[2]
}
1' file1 file2

相关内容