使用 sed 删除连字符

Question 1

Perl 中的 Oneliner（感谢 terdon！）：

perl -0 -pe 's/\s+(\S+)-(<\/page>\s+<page>)(\S+)/$2$1$3/g' filename

它的作用：与正则表达式匹配，并使用匹配的部分来重建您的单词。

Answer

Perl 中的 Oneliner（感谢 terdon！）：

perl -0 -pe 's/\s+(\S+)-(<\/page>\s+<page>)(\S+)/$2$1$3/g' filename

它的作用：与正则表达式匹配，并使用匹配的部分来重建您的单词。

Question 2

某种怪物）使用perl应该更容易

cat file
ba bla bla hyphe-</page>
<page>nated bla bla bla
and the output should look like

bla bla bla</page>
<page>hyphenated bla bla bla

它是 GNU sed （在其他一些 sed -s -E 选项中用于扩展正则表达式）

sed -nr '/[[:alpha:]]+-<\/[[:alpha:]]+>$/{
N
s!([[:alpha:]]+)-(</[[:alpha:]]+>)\n(<[[:alpha:]]+>)([[:alpha:]]+)!\2\n\3\1\4!}
p' file
ba bla bla </page>
<page>hyphenated bla bla bla
and the output should look like

bla bla bla</page>
<page>hyphenated bla bla bla

Answer

某种怪物）使用perl应该更容易

cat file
ba bla bla hyphe-</page>
<page>nated bla bla bla
and the output should look like

bla bla bla</page>
<page>hyphenated bla bla bla

它是 GNU sed （在其他一些 sed -s -E 选项中用于扩展正则表达式）

sed -nr '/[[:alpha:]]+-<\/[[:alpha:]]+>$/{
N
s!([[:alpha:]]+)-(</[[:alpha:]]+>)\n(<[[:alpha:]]+>)([[:alpha:]]+)!\2\n\3\1\4!}
p' file
ba bla bla </page>
<page>hyphenated bla bla bla
and the output should look like

bla bla bla</page>
<page>hyphenated bla bla bla

使用 sed 删除连字符

答案1

答案2

相关内容