匹配模式和空格之后的任意字符，并使用 sed 重新排列捕获的模式

Question

主要s#(.*k__)(k__\w\+)(.*)#\1\3\2#问题是第一个捕获组需要k__，第二个捕获组需要还需要。您的文件每行k__包含一个。k__

由于您希望k__与相邻文本一起移动到行尾，因此它应该属于第二组。在第一组中，有一个名为积极展望可用于确保k__之后正确。sed不支持该功能，但这里实际上不需要它。第二个捕获组紧跟在第一个捕获组之后，并且需要k__。

修复命令的最简单方法是k__从第一组中删除：

<test.file gsed -E 's#(.*)(k__\w+)(.*)#\1\3 \2#'

注意我使用了+而不是，\+因为这sed在我的 Debian 中的 GNU 中有效。我还在\3和之间添加了一个空格\2（另一种选择是：s#(.*)( k__\w+)(.*)#\1\3\2#，因此您不会在前导数字后得到四个空格；但您想要的文本确实在那里指定了四个空格）。

一个潜在的问题是第一组是贪婪的。当一行中.*只有一个时，这是可以的；否则第二组可能会匹配一些稍后的。至少有两个解决方案：k__k__

附注：为什么<test.file不是cat test.file |？请参阅后半部分我的这个答案。

Answer 1

主要s#(.*k__)(k__\w\+)(.*)#\1\3\2#问题是第一个捕获组需要k__，第二个捕获组需要还需要。您的文件每行k__包含一个。k__

由于您希望k__与相邻文本一起移动到行尾，因此它应该属于第二组。在第一组中，有一个名为积极展望可用于确保k__之后正确。sed不支持该功能，但这里实际上不需要它。第二个捕获组紧跟在第一个捕获组之后，并且需要k__。

修复命令的最简单方法是k__从第一组中删除：

<test.file gsed -E 's#(.*)(k__\w+)(.*)#\1\3 \2#'

注意我使用了+而不是，\+因为这sed在我的 Debian 中的 GNU 中有效。我还在\3和之间添加了一个空格\2（另一种选择是：s#(.*)( k__\w+)(.*)#\1\3\2#，因此您不会在前导数字后得到四个空格；但您想要的文本确实在那里指定了四个空格）。

一个潜在的问题是第一组是贪婪的。当一行中.*只有一个时，这是可以的；否则第二组可能会匹配一些稍后的。至少有两个解决方案：k__k__

附注：为什么<test.file不是cat test.file |？请参阅后半部分我的这个答案。

相关内容