将正则表达式从 BBEdit 转换为 sed 以强制换行时出现问题

Question 1

怎么样：

sed -r 's/(.{1,26}) /\1\n/g' file.txt

我不得不承认我不明白你的意思(\h+\R?|\R)——也许有一些复杂的事情正在发生。

Answer

怎么样：

sed -r 's/(.{1,26}) /\1\n/g' file.txt

我不得不承认我不明白你的意思(\h+\R?|\R)——也许有一些复杂的事情正在发生。

Question 2

\h并且\R不是标准的。我认为\h是[[:blank:]]，并且\R 被描述为 (?>\x0D\x0A|\v)，它与 Windows CRLF 换行符或任何垂直空格匹配。除非有一些 Unicode 差异，或者我错过了其他东西。

您几乎可以直接使用 Perl 来实现这一点：

$ cat file.txt
Perl is a weird programming language that has taken some influences from
sed, among other things.

$ perl -pe 's/(.{1,25})([[:blank:]]+\n?|\n)/$1\n/g' < file.txt
Perl is a weird
programming language that
has taken some influences
from
sed, among other things.

或者使用 sed，您需要将\hand替换\R为例如[[:blank:]]and \n。尽管您可能需要 GNU sed 才能正常\n工作。另外，要让 sed 在缓冲区中包含尾随换行符以便可以进行匹配，您需要 GNU sed 的-z选项来使其考虑以 NUL 分隔的“行”，从而形成\n常规字符。您还可以将模式修改为具有(...|\n|$)，但随后您将在文件中已存在的任何换行符之前添加额外的换行符。

$ sed -z -E 's#(.{1,40})([[:blank:]]+\n?|\n)#\1\n#g' < file.txt
Perl is a weird programming language
that has taken some influences from
sed,
among other things.

尽管如上所示，正则表达式不会删除任何现有的换行符，如上所示。

Answer

\h并且\R不是标准的。我认为\h是[[:blank:]]，并且\R 被描述为 (?>\x0D\x0A|\v)，它与 Windows CRLF 换行符或任何垂直空格匹配。除非有一些 Unicode 差异，或者我错过了其他东西。

您几乎可以直接使用 Perl 来实现这一点：

$ cat file.txt
Perl is a weird programming language that has taken some influences from
sed, among other things.

$ perl -pe 's/(.{1,25})([[:blank:]]+\n?|\n)/$1\n/g' < file.txt
Perl is a weird
programming language that
has taken some influences
from
sed, among other things.

或者使用 sed，您需要将\hand替换\R为例如[[:blank:]]and \n。尽管您可能需要 GNU sed 才能正常\n工作。另外，要让 sed 在缓冲区中包含尾随换行符以便可以进行匹配，您需要 GNU sed 的-z选项来使其考虑以 NUL 分隔的“行”，从而形成\n常规字符。您还可以将模式修改为具有(...|\n|$)，但随后您将在文件中已存在的任何换行符之前添加额外的换行符。

$ sed -z -E 's#(.{1,40})([[:blank:]]+\n?|\n)#\1\n#g' < file.txt
Perl is a weird programming language
that has taken some influences from
sed,
among other things.

尽管如上所示，正则表达式不会删除任何现有的换行符，如上所示。

将正则表达式从 BBEdit 转换为 sed 以强制换行时出现问题

答案1

答案2

相关内容