将以特殊字符开头的行合并到新文件中

将以特殊字符开头的行合并到新文件中

以下情况:我有大约 2000 个名为“dens_Run0_set0.#”的文件,其中 # 是一些数字,它们的填充方式如下

       1   0 1.000000e-01  6.3043370127282594e-01 -9.0687990423248266e-03  255 9.4509489123595358e-10 
       1   1 1.000000e-01  6.4071465952974904e-01  2.1357878278801461e-02  254 9.6824903650372107e-10 
       1   2 1.000000e-01  6.6258330124264830e-01 -8.3797056064819717e-03  255 9.5136742928048079e-10 
       1   3 1.000000e-01  6.2986715737376164e-01 -8.3306463914899122e-03  254 9.8325203534699313e-10 
       1   4 1.000000e-01  6.2984096793040101e-01 -2.2874605754168442e-03  255 9.7199825965788023e-10 
       1   5 1.000000e-01  6.3544494921916339e-01  4.0850692190967192e-04  255 9.3920704546945899e-10 
       1   6 1.000000e-01  6.1993535905745978e-01  1.6905867851164658e-03  255 9.2219992753328484e-10 
       1   7 1.000000e-01  6.6403589120818651e-01 -7.7065063672989709e-03  255 9.5683005962854395e-10 
       1   8 1.000000e-01  6.6151286798685760e-01  2.2987801390020952e-02  255 9.5036933878134278e-10 
       1   9 1.000000e-01  6.4426718104580993e-01 -9.1829913570412227e-03  255 9.5504193442508267e-10 
       6   0 1.000000e-01  4.0147426676412579e-02 -1.0968071205388696e-01  281 9.5556063062218755e-10 
       6   1 1.000000e-01  3.1792618041921133e-01  1.5324342699326129e-01  281 9.4066654465763122e-10 
       6   2 1.000000e-01  2.0570344663186310e-01 -5.7959543075412512e-02  281 9.4459629007559442e-10 
       6   3 1.000000e-01  1.4426831089076586e-01 -8.0085259971383493e-02  281 9.3488350394466124e-10 
       6   4 1.000000e-01  1.2697447761062600e-01 -7.9212954607404143e-02  281 9.4211360934792765e-10 
       6   5 1.000000e-01  9.4787370490545683e-02 -1.0902733768125472e-01  281 9.6087293677271646e-10 
       6   6 1.000000e-01 -3.6135020945645614e-02 -6.3683751812277478e-02  281 9.6366270518899455e-10 
       6   7 1.000000e-01  1.8645702206170731e-01 -1.1584221723023802e-01  281 9.7691299494329087e-10 
       6   8 1.000000e-01  3.4541099054452690e-01  5.8025780529230055e-02  281 9.4433605379862229e-10 
       6   9 1.000000e-01  2.6448819749081548e-01 -1.3873411819319395e-01  281 9.3928487210348521e-10 

现在我想将以“1”开头的所有 2000 个文件的所有行合并到一个新文件中,并将所有以“6”开头的文件合并到另一个文件中。我怎样才能做到这一点?

答案1

使用find和调用awk

find . -maxdepth 1 -type f -name 'dens_Run0_set0.*' \
    -exec awk '{ print >>$1 ".output" }' {} +

find命令将(仅)查找当前目录中名称满足给定模式的所有常规文件。对于批量的这些文件,awk将执行一个非常短的程序。

awk程序只是将找到的文件中的每一行输出到名称类似于1.output6.output取决于第一个字段中的数据的新文件。

假设输出文件尚不存在(或者将附加现有文件)。进一步假设第一个字段始终形成有效的安全文件名(没有检查来防止覆盖文件系统中其他位置的现有文件)。

您是否希望限制awk程序仅处理第一个字段中恰好包含两个数字 1 或 6 的行(以防万一还有其他行包含您想要的其他数字)想要提取),然后将awk代码更改为

$1 == 1 || $1 == 6 { print >>$1 ".output" }

根据您的系统,以下较短的命令也可能有效。如果没有,您会因为文件太多而收到“参数列表太长”的信息。

awk '{ print >$1 ".output" }' dens_Run0_set0.*

上面的命令通过对批量文件(可能不是一次所有文件)find执行多次来解决此错误。awk

相关内容