我有两个文本文件,格式如下:
例如文件1:
900 480 10060.62 2740 -266864.19 3843493.50 2740.00 2740 176.07
900 479 10046.50 2741 -266874.34 3843486.00 2741.00 2741 176.07
900 478 10032.38 2742 -266884.47 3843478.50 2742.00 2742 176.07
900 477 10018.26 2743 -266894.62 3843471.00 2743.00 2743 176.07
例如文件2:
-2.68785700E+05 3.84401270E+06 313.33 2740.00 313.33 2740 1.401298E-044 2 LY1-0900
-2.68783800E+05 3.84400040E+06 313.35 2741.00 313.35 2741 1.401298E-044 2 LY1-0900
-2.68781900E+05 3.84398810E+06 313.36 2742.00 313.36 2742 1.401298E-044 2 LY1-0900
-2.68780000E+05 3.84397580E+06 313.38 2743.00 313.38 2743 1.401298E-044 2 LY1-0900
我需要根据文件 1 中的第 1 列和第 7 列以及文件 2 中的第 9 列和第 4 列中的值的匹配,将文件 2 中的前两列替换为文件 1 中的第 5 列和第 6 列。
让我举例说明脚本的作用听起来很令人困惑......
取出文件 2 中的第一行,找到文件 1 中第一列值 (900) 与第 9 列 (0900) 的最后 4 位数字匹配且第 7 列值 (2740.00) 与第 4 列值 (2740.00) 匹配的行,然后替换列 1 file2 中的 2 包含文件 1 中的第 5 列和第 6 列。
IE
-2.68785700E+05 3.84401270E+06 313.33 2740.00 313.33 2740 1.401298E-044 2 LY1-0900
变成
-266864.19 3843493.50 313.33 2740.00 313.33 2740 1.401298E-044 2 LY1-0900
然后移动到下一行等,最后输出一个新文件。
所需的输出如下所示:
-266864.19 3843493.50 313.33 2740.00 313.33 2740 1.401298E-044 2 LY1-0900
-266874.34 3843486.00 313.35 2741.00 313.35 2741 1.401298E-044 2 LY1-0900
-266884.47 3843478.50 313.36 2742.00 313.36 2742 1.401298E-044 2 LY1-0900
-266894.62 3843471.00 313.38 2743.00 313.38 2743 1.401298E-044 2 LY1-0900
我基本上是想查找二维表面的新空间坐标。
这些值可能并不总是按顺序排列,并且文件可能相对较大(600 万行),因此如果脚本高效,它将很有用。
答案1
您可以使用以下脚本作为示例:
#!/bin/sh
outfile="outfile"
echo "testfile1:"
cat testfile1
echo "testfile2:"
cat testfile2
cat /dev/null > $outfile
cat testfile1 | while read line; do
matchfirst="`echo $line | awk '{print $3}'`"
matchsecond="`echo $line | awk '{print $4}'`"
finded="false"
while read defline; do
tplfirst="`echo $defline | awk '{print $3}'`"
tplsecond="`echo $defline | awk '{print $4}'`"
if [ "$tplfirst" = "$matchfirst" ] && [ "$tplsecond" = "$matchsecond" ]; then
echo -n "`echo $defline | awk '{print $1}'` `echo $defline | awk '{print $2}'` `echo $line | awk '{print $3}'` `echo $line | awk '{print $4}'`" >> $outfile
echo >> $outfile
finded="true"
fi
done < testfile2
if [ "$finded" = "false" ]; then
echo $line >> $outfile
fi
done
echo "outfile:"
cat outfile
使用示例:
➜ sild@$work 15:29:55 [test]$ ./replacer.sh
testfile1:
1 2 3 4
5 6 7 8
9 10 11 12
testfile2:
11 21 3 4
51 61 7 8
9 10 111 121
outfile:
11 21 3 4
51 61 7 8
9 10 11 12
这是你的目标吗?
答案2
尝试这个:
awk 'FNR==NR{
a[$1"@"$7]=$5" "$6;
next
}
{
i=length($NF);
n=substr( $NF, i-2, i);
if( n"@"$4 in a) {
split(a[n"@"$4],b," ")
};
$1=b[1];
$2=b[2]
}
1' file1 file2