用特定模式分割文件

Question

在awk关联数组中，遍历的顺序是不确定的。替换你的

for (i in a)

经过

n = i
for(i=1;i<=n;i++)

要将 awk 包含在 bash 脚本中，你可以使用类似

#!/bin/bash
for file
do  awk -v file="$file" '....' "$file"
done

确保chmod a+rx在脚本文件上运行。同时替换以下行

fn="file" c;

在你的 awk 脚本中

fn = c "_" file;

此行是新文件名的构建方式：awk 变量file最初被赋予正在处理的文件的名称作为值（语法为：awk -v 变量=值）。awk 变量是您的新文件名，是保存数字、字符和文件名变量的fn变量。c_

您可以使用多个文件作为参数来运行此 bash 命令。它们将由 awk 逐一处理。

最后结果：

#!/bin/bash
for file
do awk -v file="$file" 'function print_vals() {
   fn = c "_" file;
   print hdr > fn;
   print "REGION  chr", sn, en >> fn;
   n = i
   for(i=1;i<=n;i++)
      print a[i] >> fn;
 } NR == 1 {
   hdr=$0;
   c=0;
   next
 } NF==2 && $1 >= 1000000*c {
   if (c)
      print_vals();
   delete a;
   i=0;
   c++;
   sn=$1;
 } NF==2 {
   a[++i]=$0;
   en=$1;
 } END {
   print print_vals();
 }'  "$file"
done

Answer 1