使用正则表达式解析文件时，匹配一行直到 #，但不匹配 #

Question 1

使用grep：

grep -Po '(?<=^deb\s).*?(?=#|$)' inputFiles

grep -Po '(?<=^deb\s)[^#]*' inputFiles

使用sed：

sed -nr '/^deb\s/s;^deb\s([^#]*)#?.*$;\1;p' inputFiles

使用awk（该解决方案基于固定字段的数量）：

awk '/^deb /{print $2,$3,$4}' inputFiles

Answer

使用grep：

grep -Po '(?<=^deb\s).*?(?=#|$)' inputFiles

grep -Po '(?<=^deb\s)[^#]*' inputFiles

使用sed：

sed -nr '/^deb\s/s;^deb\s([^#]*)#?.*$;\1;p' inputFiles

使用awk（该解决方案基于固定字段的数量）：

awk '/^deb /{print $2,$3,$4}' inputFiles

Question 2

对于如此简单的匹配，无需使用sed或awk；只需让您的正则表达式使用否定字符类来抓取除哈希之外的任何字符：

grep -o "^deb [^#]*"

如果需要过滤掉前面的“deb”，一个简单的循环就可以完成：

while read line; do
    echo "${line#deb }"
done <(grep -o "^deb [^#]*")

编辑：一个更简洁的单行解决方案是使用 Perl 正则表达式grep -P，它允许后向断言（参见约翰·卫斯理王子的回答）。

Answer

对于如此简单的匹配，无需使用sed或awk；只需让您的正则表达式使用否定字符类来抓取除哈希之外的任何字符：

grep -o "^deb [^#]*"

如果需要过滤掉前面的“deb”，一个简单的循环就可以完成：

while read line; do
    echo "${line#deb }"
done <(grep -o "^deb [^#]*")

编辑：一个更简洁的单行解决方案是使用 Perl 正则表达式grep -P，它允许后向断言（参见约翰·卫斯理王子的回答）。

相关内容