使用 GNU sed 提取可能由空行分隔的两个模式行之间的标头名称

Question 1

这将打印至少包含一个字母或数字字符的行，只要它们位于标题内即可。

sed -n '/^-----/,/^-----/{/[[:alnum:]]/p;}' file

Answer

这将打印至少包含一个字母或数字字符的行，只要它们位于标题内即可。

sed -n '/^-----/,/^-----/{/[[:alnum:]]/p;}' file

Question 2

我提出这个解决方案：

$ sed -n '/\-\{5,\}/,/\-\{5,\}/p' file | sed '/\-\+\|^$/d'
Introduction
Chapter1: Foo
Chapter bar

Answer

我提出这个解决方案：

$ sed -n '/\-\{5,\}/,/\-\{5,\}/p' file | sed '/\-\+\|^$/d'
Introduction
Chapter1: Foo
Chapter bar

Question 3

虽然您确实可以在sed其他工具中执行此操作~~会让事情变得更容易（IMO）~~¹也可以工作。例如，在awk：

$ awk '/-----/ && !a{a=1;next} /-----/ && a{a=0}a' file 

Introduction
Chapter1: Foo
Chapter bar

要摆脱空行，您可以这样做：

$ grep . file | awk '/-----/ && !a{a=1;next} /-----/ && a{a=0}a'
Introduction
Chapter1: Foo
Chapter bar

或者：

$ awk '!/./{next};/-----/ && !a{a=1;next} /-----/ && a{a=0}a' file 
Introduction
Chapter1: Foo
Chapter bar

这里的想法是，如果变量当前为 0 或未设置 ( a) ，并且当前行至少匹配 5 ，则将其设置为。如果在设置为 1时找到另一行包含 5 的行，则将其重新设置为。然后，我们打印所有设置了的行（这就是 final所做的：如果计算结果为非 0，它将打印）。1!a-0-aaaa

这是以更容易理解的方式编写的相同内容：

awk '{ 
        if(!/./){ next } 
        if(/-----/ && !a){ a=1; next} 
        if(/-----/ && a){ a=0 } 
        if(a){ print }
    }' file

¹_{卡西莫多的回答就更简单了！}

Answer

虽然您确实可以在sed其他工具中执行此操作~~会让事情变得更容易（IMO）~~¹也可以工作。例如，在awk：

$ awk '/-----/ && !a{a=1;next} /-----/ && a{a=0}a' file 

Introduction
Chapter1: Foo
Chapter bar

要摆脱空行，您可以这样做：

$ grep . file | awk '/-----/ && !a{a=1;next} /-----/ && a{a=0}a'
Introduction
Chapter1: Foo
Chapter bar

或者：

$ awk '!/./{next};/-----/ && !a{a=1;next} /-----/ && a{a=0}a' file 
Introduction
Chapter1: Foo
Chapter bar

这里的想法是，如果变量当前为 0 或未设置 ( a) ，并且当前行至少匹配 5 ，则将其设置为。如果在设置为 1时找到另一行包含 5 的行，则将其重新设置为。然后，我们打印所有设置了的行（这就是 final所做的：如果计算结果为非 0，它将打印）。1!a-0-aaaa

这是以更容易理解的方式编写的相同内容：

awk '{ 
        if(!/./){ next } 
        if(/-----/ && !a){ a=1; next} 
        if(/-----/ && a){ a=0 } 
        if(a){ print }
    }' file

¹_{卡西莫多的回答就更简单了！}

Question 4

您可以使用：

sed -n '/^-\+$/,/^-\+$/{/^-*$/!p}' input.txt

或者，您也可以使用sed -z：

sed -Ez 's/[^-]*-+[\n]*([^\n]*\n)[\n]*-+[^-]*/\1/g' input.txt

没有-E：

sed -z 's/[^-]*-\+[\n]*\([^\n]*\n\)[\n]*-\+[^-]*/\1/g' input.txt

注意：虽然这对于您的示例来说效果很好，但如果-出现在文本中的某个位置，则可能会出现问题。但我认为，你可以详细说明这一点。

Answer

您可以使用：

sed -n '/^-\+$/,/^-\+$/{/^-*$/!p}' input.txt

或者，您也可以使用sed -z：

sed -Ez 's/[^-]*-+[\n]*([^\n]*\n)[\n]*-+[^-]*/\1/g' input.txt

没有-E：

sed -z 's/[^-]*-\+[\n]*\([^\n]*\n\)[\n]*-\+[^-]*/\1/g' input.txt

注意：虽然这对于您的示例来说效果很好，但如果-出现在文本中的某个位置，则可能会出现问题。但我认为，你可以详细说明这一点。

相关内容