SED/AWK：将字符串添加到与另一个源文件中的正则表达式值匹配的多个文件

Question 1

复杂的Grep+ GNUAwk解决方案：

关键的awk脚本内容，比方说add_param_by_id.awk：

#!/bin/awk -f
BEGIN{ FS=":[[:space:]]+" }
NR==FNR{ a[$1] = $2; next }
match($0, /\<id="([^"]+)"/, b) && b[1] in a{ 
    sub(/\<id="[^"]+"/, "& some_param=\042"a[b[1]]"\042") 
}1

主要命令：

export pat="($(cut -d':' -f1 source.yml | paste -s -d'|'))"
grep -ElZr "\<id=\"$pat\"" --include=*.txt | xargs -0 -I{} sh -c \
'awk -f add_param_by_id.awk source.yml "$1" > "/tmp/$$" && mv "/tmp/$$" "$1"' _ {}

pat- 包含带有标识符的正则表达式交替组的变量，即(apples|grapes|trees|strawberry)
grep -ElZr id=\"$pat\" --include=*.txt- 打印与任何指定标识符匹配的所有文件名

处理后的示例文件内容：

This is some plain text
Toreplace string contains id="apples" some_param="Apples are very tasty"
The most vitamin-rich berry is id="strawberry" some_param="Yummy"

Answer

复杂的Grep+ GNUAwk解决方案：

关键的awk脚本内容，比方说add_param_by_id.awk：

#!/bin/awk -f
BEGIN{ FS=":[[:space:]]+" }
NR==FNR{ a[$1] = $2; next }
match($0, /\<id="([^"]+)"/, b) && b[1] in a{ 
    sub(/\<id="[^"]+"/, "& some_param=\042"a[b[1]]"\042") 
}1

主要命令：

export pat="($(cut -d':' -f1 source.yml | paste -s -d'|'))"
grep -ElZr "\<id=\"$pat\"" --include=*.txt | xargs -0 -I{} sh -c \
'awk -f add_param_by_id.awk source.yml "$1" > "/tmp/$$" && mv "/tmp/$$" "$1"' _ {}

pat- 包含带有标识符的正则表达式交替组的变量，即(apples|grapes|trees|strawberry)
grep -ElZr id=\"$pat\" --include=*.txt- 打印与任何指定标识符匹配的所有文件名

处理后的示例文件内容：

This is some plain text
Toreplace string contains id="apples" some_param="Apples are very tasty"
The most vitamin-rich berry is id="strawberry" some_param="Yummy"

Question 2

带有某些警告，例如“文件名中没有奇怪的字符”和“/匹配或替换数据值中没有字符”，这应该适合您。它的效率不是很高，因为它会遍历 YAML 文件中每一行可以找到的每个文件，但为了解决这个问题，我需要更多有关 YAML 文件相对大小与目标文件数量的信息。

while IFS=: read -r id sp
do
    id="id=\"$id\"" sp="some_param=\"${sp:1}\""

    find . -type f -name '*.txt' |
        while IFS= read -r file
        do
            sed -i "/\<$id/s/$/ $sp/" "$file"
        done
done <source.yml

Answer

带有某些警告，例如“文件名中没有奇怪的字符”和“/匹配或替换数据值中没有字符”，这应该适合您。它的效率不是很高，因为它会遍历 YAML 文件中每一行可以找到的每个文件，但为了解决这个问题，我需要更多有关 YAML 文件相对大小与目标文件数量的信息。

while IFS=: read -r id sp
do
    id="id=\"$id\"" sp="some_param=\"${sp:1}\""

    find . -type f -name '*.txt' |
        while IFS= read -r file
        do
            sed -i "/\<$id/s/$/ $sp/" "$file"
        done
done <source.yml

SED/AWK：将字符串添加到与另一个源文件中的正则表达式值匹配的多个文件

答案1

答案2

相关内容