如何读取字符串输入文件，进行匹配并就地更改匹配？

Question 1

假设results.txt文件名后的相关行不包含空格，则以下awk程序将起作用：

awk -v prefix="h-19/US/CA-" 'NR==FNR{fnames[$1]; next} \
    /^>/{name=substr($0,2); if (name in fnames) {sub(/^>/, ">" prefix)} }1' filenames.txt results.txt

这将首先解析filenames.txt然后results.txt.
在解析时filenames.txt（其中FNR，每个文件行计数器，等于NR全局行计数器），它将在数组中注册所有文件名（这是行上的唯一字段）fnames，但随后立即跳到下一行执行。
解析时results.txt它将检查一行是否以>.如果是，它将检查该字符后面的子字符串（临时存储在中name）是否在的“数组索引”中找到fnames。如果是这种情况，它将使用+ 前缀sub()替换前导>，并作为变量>传递（通过指令）。awkprefix-v
看似“杂散”1将指示awk打印当前行，包括所有可能的修改（但仅限results.txt于在处理第一个文件期间我们没有到达该部分）。

请注意，awk它本身无法就地修改文件，因此您需要使用临时文件。如果您有足够新的 GNU Awk 版本 (> 4.1.0)，则可以使用该inplace扩展；当然，您需要关闭该filenames.txt文件的选项：

awk -i inplace -v prefix=" ... " ' ... ' inplace=0 filenames.txt inplace=1 results.txt

这将关闭filenames.txt并再次打开的就地编辑results.txt。

Answer

假设results.txt文件名后的相关行不包含空格，则以下awk程序将起作用：

awk -v prefix="h-19/US/CA-" 'NR==FNR{fnames[$1]; next} \
    /^>/{name=substr($0,2); if (name in fnames) {sub(/^>/, ">" prefix)} }1' filenames.txt results.txt

这将首先解析filenames.txt然后results.txt.
在解析时filenames.txt（其中FNR，每个文件行计数器，等于NR全局行计数器），它将在数组中注册所有文件名（这是行上的唯一字段）fnames，但随后立即跳到下一行执行。
解析时results.txt它将检查一行是否以>.如果是，它将检查该字符后面的子字符串（临时存储在中name）是否在的“数组索引”中找到fnames。如果是这种情况，它将使用+ 前缀sub()替换前导>，并作为变量>传递（通过指令）。awkprefix-v
看似“杂散”1将指示awk打印当前行，包括所有可能的修改（但仅限results.txt于在处理第一个文件期间我们没有到达该部分）。

请注意，awk它本身无法就地修改文件，因此您需要使用临时文件。如果您有足够新的 GNU Awk 版本 (> 4.1.0)，则可以使用该inplace扩展；当然，您需要关闭该filenames.txt文件的选项：

awk -i inplace -v prefix=" ... " ' ... ' inplace=0 filenames.txt inplace=1 results.txt

这将关闭filenames.txt并再次打开的就地编辑results.txt。

Question 2

您sed可以收集保留空间中的文件名，然后检查所有行results.txt是否匹配，以过滤要更改的行：

sed -e '1,/^$/{H;1h;d;}' -e 'G;/^>\(.*\).*\n\1\n/s_^>_>h-19/US/CA-_;P;d' filename.txt <((echo)) results.txt

<((echo))您会看到我在文件之间传递了一个空行，因此1,/^$/解决了第一个文件的所有行（以及空行）
这些行被附加到保留空间，然后删除H;1h;d（1h避免以换行符开始保留空间）
G将保留空间附加到的所有行result.txt并/^>$.*$.*\n\1\n/匹配以和开头的行>，该字符串是文件名（包含在保留空间中的换行符中）
s_^>_>h-19/US/CA-_是否更换这些线路
P;d仅打印第一行，不包含附加的垃圾内容。你可以s/\n.*//这样做

Answer

您sed可以收集保留空间中的文件名，然后检查所有行results.txt是否匹配，以过滤要更改的行：

sed -e '1,/^$/{H;1h;d;}' -e 'G;/^>\(.*\).*\n\1\n/s_^>_>h-19/US/CA-_;P;d' filename.txt <((echo)) results.txt

<((echo))您会看到我在文件之间传递了一个空行，因此1,/^$/解决了第一个文件的所有行（以及空行）
这些行被附加到保留空间，然后删除H;1h;d（1h避免以换行符开始保留空间）
G将保留空间附加到的所有行result.txt并/^>$.*$.*\n\1\n/匹配以和开头的行>，该字符串是文件名（包含在保留空间中的换行符中）
s_^>_>h-19/US/CA-_是否更换这些线路
P;d仅打印第一行，不包含附加的垃圾内容。你可以s/\n.*//这样做

Question 3

用于perl输入文件的就地编辑：

pfx='h-19/US/CA-' \
perl -pi -e '
  BEGIN { %h = map { tr/\n//dr => $ENV{pfx}} <STDIN>}
  s/^>\K(?=(.*))/$h{$1}/;
' results.txt < filename.txt

Answer

用于perl输入文件的就地编辑：

pfx='h-19/US/CA-' \
perl -pi -e '
  BEGIN { %h = map { tr/\n//dr => $ENV{pfx}} <STDIN>}
  s/^>\K(?=(.*))/$h{$1}/;
' results.txt < filename.txt

如何读取字符串输入文件，进行匹配并就地更改匹配？

答案1

答案2

答案3

相关内容