按模式拆分文件，仅保留包含第二个模式的片段

Question

您可以拆分文件，然后grep -q some_method在每个部分上运行并删除它，如果错误的例如

for file in part-*.txt; do
grep -q some_method "$file"
  if [ $? -ne 0 ]
    then
      rm "$file"
  fi
done

或
使用两遍 - 从输入中删除包含的“部分”，some_method然后分割结果，例如用于sed第一遍和awk第二遍的代码：

sed -e '1{h;d;}' -e '/ID/!{H;$!d;}' -e 'x;/some_method/!d' infile | \
awk '/ID/{++part}{print > sprintf("part-%03d.txt", part)}'

sed将第一行复制到h旧缓冲区上并删除它，然后附加与旧缓冲区d不匹配的每一行，如果不是最后一行则将其删除，并且 e更改匹配的行上的缓冲区，如果不包含则删除模式空间。然后结果通过管道传输到.如果出现错误，则必须使用以下文件：IDHxIDsome_methodawktoo many open filesclose()

sed -e '1{h;d;}' -e '/ID/!{H;$!d;}' -e 'x;/some_method/!d' infile | \
awk '/ID/{++part}{close(fn);fn=sprintf("part-%03d.txt", part);print >> fn}'

或者，如果你在gnu/anything 上，你可以使用csplit而不是awk：

sed '1{h;d};/ID/!{H;$!d};x;/some_method/!d' infile | \
csplit -f 'part-' -b '%03d.txt' -sz - /ID/ '{*}'

Answer 1

您可以拆分文件，然后grep -q some_method在每个部分上运行并删除它，如果错误的例如

for file in part-*.txt; do
grep -q some_method "$file"
  if [ $? -ne 0 ]
    then
      rm "$file"
  fi
done

或
使用两遍 - 从输入中删除包含的“部分”，some_method然后分割结果，例如用于sed第一遍和awk第二遍的代码：

sed -e '1{h;d;}' -e '/ID/!{H;$!d;}' -e 'x;/some_method/!d' infile | \
awk '/ID/{++part}{print > sprintf("part-%03d.txt", part)}'

sed将第一行复制到h旧缓冲区上并删除它，然后附加与旧缓冲区d不匹配的每一行，如果不是最后一行则将其删除，并且 e更改匹配的行上的缓冲区，如果不包含则删除模式空间。然后结果通过管道传输到.如果出现错误，则必须使用以下文件：IDHxIDsome_methodawktoo many open filesclose()

sed -e '1{h;d;}' -e '/ID/!{H;$!d;}' -e 'x;/some_method/!d' infile | \
awk '/ID/{++part}{close(fn);fn=sprintf("part-%03d.txt", part);print >> fn}'

或者，如果你在gnu/anything 上，你可以使用csplit而不是awk：

sed '1{h;d};/ID/!{H;$!d};x;/some_method/!d' infile | \
csplit -f 'part-' -b '%03d.txt' -sz - /ID/ '{*}'

按模式拆分文件，仅保留包含第二个模式的片段

答案1

相关内容