我根本不是程序员,但我需要编写一个脚本来剪切文件并从该文件生成多维数组。
我是一名化学家,所以我的数组应该是这样的:
[pe][pH][element][concentration].
这样,我将能够绘制单个元素的浓度变化酸碱度和佩。
所以我写了这个脚本来剪切我的输入文件和索引佩,酸碱度和物种,但现在我被困住了。我不知道如何完成它。
#!/bin/bash
inputFile='test.inp'
awk '/Distribution of species/ {f=1} /Saturation indices/ {f=0} f' $inputFile > distriPack.inout
csplit -z -f distri_ distriPack.inout /Distribution/ {*}
sed -i '1,5d; $d' distri_*
sed -i 's/^ *//' distri_*
cut -d ' ' -f1 distri_* | sort | uniq > especes.inp
grep -E "pH = " $inputFile | cut -d '=' -f 2 | cut -d ' ' -f 4 > ph.inp
grep -E "pe = " $inputFile | cut -d '=' -f 2 | cut -d ' ' -f 4 > pe.inp
declare -a tableVariable=(ipe ipH ies)
ipe=0
tablepe=0
for pe in cat "$pe.inp"
do
if ([ $ipe -eq 0 ] || pePrev=pe)
then
tablepe=$((tablepe+1))
ipe=$((ipe+1))
pePrev=$pe
fi
ipH=0
tablepH=0
for pH in cat "$pH.inp"
do
if ([ $ipH -eq 0 ] || pHPrev=pH )
then
tablepH=$((tablepH+1)) > tablepH.inp
ipH=$((ipH+1))
pHPrev=$pH
fi
ies=0
tablees=0
for espece in cat "$espece.inp"
do
if ([ $ies -eq 0 ] || especePrev=espece )
then
# indEspece=0
# for espece in distri_$pe
# do
# if ([ $indEspece -eq 0 ])
maVariable= grep -E "espece" < distri_10 | cut -d ' ' -f 1
${tableVariable[ $((ipe)) $((ipH)) $((ies)) ]}=$((maVariable))
# done
ies=$((ies+1))
tablees=$((tablees+1))
especePrev=$espece
fi
done
done
done
val=${monTableau[${i_pe} ${i_pH} ${es} ${pa}]}>monTableau.inp
我想要这样的东西:for [pe][pH][specie]=[0][12][15]
索引表=浓度。
但我不知道如何在 bash 和文件 Distri_(pe/pH 索引值) 的第二列中表示与for pe = i, pH = j
索引k 的种类相对应的行。这里有我的输入文件中的“一些”行:specie=k
do indexTable[i][j][k]=value
>Initial solution 1. \newline
>Description of solution
>pH = 0.0
>pe = 0.0
>Distribution of species
>Species Molality log Activity
>H+ 1.1e+00 1.0e+00
>OH- 1.5e-14 9.5e-15
>Am+2 0.0e+00 0.0e+00
>Initial solution 2. pe 0 pH 0.5
>Description of solution
>pH = 0.5
>pe = 0.0
>Distribution of species
>Species Molality Log Activity
>H+ 4.1e-01 3.1e-01
>OH- 4.5e-14 3.1e-14
>Am+2 0.0e+00 0.0e+00
我想得到类似的东西:outputfile_[pe value].out,其中数据将按如下方式排序:
>Column 1 C2 ..... Cn
>Specie\pH 0 n
>H+ [H+] at pH=0 [H+] at pH=n
ETC
答案1
强调的文本我不确定您是否想在输出中打印“>”符号,或者它是否存在于输入中...请给我反馈,以便我可以在脚本中进行更正。
这应该做这份工作如果输入和输出是确切地正如你所描述的:
#!/usr/bin/awk
{
# Set the INDEX for each 'Initial Solution'
if ($1==">Initial"){
gsub(/\./,"",$3);
INDEX=$3;}
#Discard lines with 'Species' or 'Description'
if (($1==">Description")||($1==">Species")) next;
#Remove '>' from the first field
gsub(/>/,"",$1)
#Set the labels of the rows
PH[0]="Column"
PE[0]="Specie\\ph"
H[0]="H+"
OH[0]="OH-"
AM[0]="Am+2"
#Set other values (pH, pe, etc)
if ($1=="pH") PH[INDEX]=$3
if ($1=="pe") PE[INDEX]=$3
if ($1=="H+") H[INDEX]=$2" "$3
if ($1=="OH-") OH[INDEX]=$2" "$3
if ($1=="Am+2") AM[INDEX]=$2" "$3
}
# Print each array.
END {
for (i = 0; i <= INDEX; i++) printf("%s\t",i)
printf("\n")
for (i = 0; i <= INDEX; i++) printf("%s\t",PH[i])
printf("\n")
for (i = 0; i <= INDEX; i++) printf("%s\t",PE[i])
printf("\n")
for (i = 0; i <= INDEX; i++) printf("%s\t",H[i])
printf("\n")
for (i = 0; i <= INDEX; i++) printf("%s\t",OH[i])
printf("\n")
for (i = 0; i <= INDEX; i++) printf("%s\t",AM[i])
printf("\n")
}
一些注意事项:
- 第一行 (#!/usr/bin/awk) 应该指向 awk 在你的机器中的位置(
whereis awk
在提示符下尝试) - 在最后一个块中,\t 在字段之间插入一个“制表符”。您可以将其替换为 2 个制表符的 \t\t、逗号 ',' 或简单的空格 ' ' 以满足您的需要。
- 保存此脚本并使用它,只需执行以下操作:
awk -f script.name.awk input.file.inp