在文件列表上运行脚本

Question 1

您将script "$f"google 输出转换为shell 循环脚本中的grep -v "#"（即缺少），然后您在脚本中的错误位置使用它而不是使用它。"$f""$f"{}xargs

无论如何，当您使用 awk 时，您永远不需要在管道中使用一堆 sed 和 grep。您没有提供任何示例输入/输出，因此以下 awk 脚本只是现有管道的直接翻译，可能有更好的方法来编写它，但是这个 awk 脚本就是您所需要的，没有 shell 循环或其他任何内容:

awk '
    FNR == 1 {
        close(out)
        out = FILENAME
        sub(/\.vcf$/,".txt",out)
    }
    !/#/ {
        sub(/chrM/,"MT")
        sub(/chrX/,"X")
        sub(/chrY/,"Y")
        $0 = $1 OFS $2 OFS $2 OFS $4 "/" $5 OFS "+"
        gsub(/chr/,"")
        print > out
    }
' *.vcf

如果您想像使用 grep+seds+awk 管道那样将其塞入更少的行中，则可以在所有想要删除的换行符处使用分号，除了每个之后{，例如：

awk 'FNR==1{close(out); out=FILENAME; sub(/\.vcf$/,".txt",out)} !/#/{sub(/chrM/,"MT"); sub(/chrX/,"X"); sub(/chrY/,"Y"); $0=$1 OFS $2 OFS $2 OFS $4 "/" $5 OFS "+"; gsub(/chr/,""); print > out}' *.vcf

Answer

您将script "$f"google 输出转换为shell 循环脚本中的grep -v "#"（即缺少），然后您在脚本中的错误位置使用它而不是使用它。"$f""$f"{}xargs

无论如何，当您使用 awk 时，您永远不需要在管道中使用一堆 sed 和 grep。您没有提供任何示例输入/输出，因此以下 awk 脚本只是现有管道的直接翻译，可能有更好的方法来编写它，但是这个 awk 脚本就是您所需要的，没有 shell 循环或其他任何内容:

awk '
    FNR == 1 {
        close(out)
        out = FILENAME
        sub(/\.vcf$/,".txt",out)
    }
    !/#/ {
        sub(/chrM/,"MT")
        sub(/chrX/,"X")
        sub(/chrY/,"Y")
        $0 = $1 OFS $2 OFS $2 OFS $4 "/" $5 OFS "+"
        gsub(/chr/,"")
        print > out
    }
' *.vcf

如果您想像使用 grep+seds+awk 管道那样将其塞入更少的行中，则可以在所有想要删除的换行符处使用分号，除了每个之后{，例如：

awk 'FNR==1{close(out); out=FILENAME; sub(/\.vcf$/,".txt",out)} !/#/{sub(/chrM/,"MT"); sub(/chrX/,"X"); sub(/chrY/,"Y"); $0=$1 OFS $2 OFS $2 OFS $4 "/" $5 OFS "+"; gsub(/chr/,""); print > out}' *.vcf

Question 2

您可以使用 find 和 xargs 来实现。

查找将列出所有文件。

find -type f -name "*.vcf"

使用 xargs，我们可以对找到的每个文件进行操作。

find -type f -name "*.vcf" | xargs grep -v "#" | sed 's/chrM/MT/' | sed 's/chrX/X/' | sed 's/chrY/Y/' | awk '{print $1,$2,$2,$4"/"$5,"+"}' | sed 's/chr//g' "$f" > "${f%.*}.txt"

应该做这份工作吗？

问候

Answer