使用 Bash 将多个文本文件的某些特定行中的某些字符串连接到单个文件中

Question 1

对于，假设每个文件gawk只有一个rhoc/ ：M

gawk '
  BEGIN {print "rhoc M"}
  BEGINFILE {delete field}
  $3 == "=" {field[$2] = $4}
  ENDFILE {
    if (("rhoc" in field) && ("M" in field))
      print field["rhoc"], field["M"]
  }' ./*.txt

这将按照文件名的字典顺序处理文件。如果使用zsh，则替换./*.txt为./*.txt(n)，以便顺序为数字（file2.txt因此前 file10.txt例如）。

Answer

对于，假设每个文件gawk只有一个rhoc/ ：M

gawk '
  BEGIN {print "rhoc M"}
  BEGINFILE {delete field}
  $3 == "=" {field[$2] = $4}
  ENDFILE {
    if (("rhoc" in field) && ("M" in field))
      print field["rhoc"], field["M"]
  }' ./*.txt

这将按照文件名的字典顺序处理文件。如果使用zsh，则替换./*.txt为./*.txt(n)，以便顺序为数字（file2.txt因此前 file10.txt例如）。

Question 2

对于非 gawk 使用（在 linux (mawk) 和 FreeBSD 上测试），请尝试

LC_ALL=C awk -vHD="rhoc M" '
BEGIN           {for (MX=m=split(HD, IX); m; m--) FLDS[IX[m]]
                 print HD
                }
FNR == 1        {CNT++
                }               
$2 in FLDS      {OUT[$2, CNT] = $4+0
                }
END             {for (i=1; i<=CNT; i++) {for(j=1; j<=MX; j++) printf "%.6g%s", OUT[IX[j],i], (j==MX?ORS:OFS)}
                }
'  *.txt
rhoc M
0.001 1.53786

它将允许您通过简单地预先扩展 HD 变量来扩展数据提取。它对输入文件进行计数，将每个文件所需的数据收集到 OUT 数组中，并在 END 部分中按照遇到的文件的顺序打印所有数据。

Answer

对于非 gawk 使用（在 linux (mawk) 和 FreeBSD 上测试），请尝试

LC_ALL=C awk -vHD="rhoc M" '
BEGIN           {for (MX=m=split(HD, IX); m; m--) FLDS[IX[m]]
                 print HD
                }
FNR == 1        {CNT++
                }               
$2 in FLDS      {OUT[$2, CNT] = $4+0
                }
END             {for (i=1; i<=CNT; i++) {for(j=1; j<=MX; j++) printf "%.6g%s", OUT[IX[j],i], (j==MX?ORS:OFS)}
                }
'  *.txt
rhoc M
0.001 1.53786

它将允许您通过简单地预先扩展 HD 变量来扩展数据提取。它对输入文件进行计数，将每个文件所需的数据收集到 OUT 数组中，并在 END 部分中按照遇到的文件的顺序打印所有数据。

Question 3

sed:

sed -n '/rhoc/{s/^yy| rhoc *= *\([0-9.e+-]*\) *;/\1/;h;};/ M /{s/^yy| M *= *\([0-9.e+-]*\) *;/\1/;x;G;s/\n/ /p}' sample

以多行方式：

sed -n '
    /rhoc/{
        s/^yy| rhoc *= *\([0-9.e+-]*\) *;/\1/
        h
    }
    / M /{
        s/^yy| M *= *\([0-9.e+-]*\) *;/\1/
        x;G;s/\n/ /p
    }
' sample

Answer

sed:

sed -n '/rhoc/{s/^yy| rhoc *= *\([0-9.e+-]*\) *;/\1/;h;};/ M /{s/^yy| M *= *\([0-9.e+-]*\) *;/\1/;x;G;s/\n/ /p}' sample

以多行方式：

sed -n '
    /rhoc/{
        s/^yy| rhoc *= *\([0-9.e+-]*\) *;/\1/
        h
    }
    / M /{
        s/^yy| M *= *\([0-9.e+-]*\) *;/\1/
        x;G;s/\n/ /p
    }
' sample

使用 Bash 将多个文本文件的某些特定行中的某些字符串连接到单个文件中

答案1

答案2

答案3

相关内容