我有一个数据文件 abc.txt,格式如下:
BALT 1
54.500 -161.070
3.95863757
0.01691576
BARM 2
-9.200 67.120
4.07529868
0.01951653
BKSR 3
43.830 142.520
4.08919819
0.00587340
我需要将其转换为以下格式:
BALT 1
54.5000000 -161.070000
0.3958637E+01
0.1691576E-01
BARM 2
-9.20000000 67.1200000
0.4075298E+01
0.1951653E-01
BKSR 3
43.8300000 142.520000
0.4089198E+01
0.5873400E-02
第二行中的数字所占的总空格应为 10(不包括 -ve 符号)(例如,54.500 为 54.5000000,-161.070 为 -161.070000)。第 3 行和第 4 行的空格应为 13(例如 3.95863757 为 0.3958637E+01)。而BALT或BARM是变量,它可能是另一个具有四个字符的单词。
谢谢。
答案1
版本3使用 awk 文件,例如
function tenth(x) {
u = x ; if ( u < 0 ) u = -x ;
b=10 ;
a=b-2 ;
if ( u >= 10 ) {
d=int(log(u)/log(10)) ;
a=b-d-1 ;
}
printf "%*.*f",b,a,x ;
}
length($1) == 4 { print ; next ;}
NF == 1 { d=int(log($1)/log(10)) ;if (d> -1) d++ ; printf " %.7fE%+03d\n",$1/(10^d),d ;}
NF == 2 { printf " " ; tenth($1); printf " " ; tenth($2) ; printf "\n" ;}
在哪里
lengtht$1) == 4 { print ; next ;}
将保留第一个字段为四个字母的行(尽管可能是 1234)function tenth(x)
:定义调整格式的函数。"%*.*f"
字符串调整%f
转换的大小/精度。第一个 * 替换为 b,第二个 * 替换为 a。int(log()/log(10))
给出十进制日志来根据您的特定需求调整表示形式?
与它一起使用
awk -f f.awk input
结果给出
BALT 1
54.5000000 -161.070000
0.3958638E+01
0.1691576E-01
BALT 2
-9.20000000 67.1200000
0.4075299E+01
0.1951653E-01
BALT 3
43.8300000 142.520000
0.4089198E+01
0.5873400E-02
0.00000000 1.00000000
-3.14150000 2.71828183
答案2
也许是这样的:
awk '
!/[[:alpha:]]/{
if (NF == 1)
$0 = sprintf(" %.7E", $0 * 10)
else
$0 = sprintf(" %.8f %.8f", $1, $2)
}
{print}' | sed '
s/\([0-9.]\{10\}\)[0-9]*/\1/g
s/\([1-9]\)\.\(.*\).E/0.\1\2E/'
答案3
你可以在没有 awk 的情况下得到它:
while read line; do echo $line; read a; read b; read c; printf "%.7f %.7f\n %.7e\n %.7e\n" $a $b $c; done < data.txt
但是,如果您使用逗号而不是句点来使用某些区域设置,则以这种方式使用 printf 可能会导致一些问题。在这种情况下,您应该能够通过以下方式修复它:
while read line; do echo $line; read a; read b; read c; LC_NUMERIC="en_US.UTF-8" printf "%.7f %.7f\n %.7e\n %.7e\n" $a $b $c; done < data.txt
当然,在脚本中,您应该使用回车和缩进来更好地格式化它。