将同一行的两个字段放在一起

Question 1

当文本处理对于基本工具来说太困难时，请尝试awk。

awk -F , '{last_name = $1; sub(/\).*/, ""); sub(/.*\(/, ""); print last_name, $0}'

sed 与此差不多——可读性较差，但 awk 缺乏反向引用。

sed -n 's/^\([^,]*\),[^(]*(\([^()]*\)).*/\1 \2/p'

对于这个特定的任务，Perl 总体上要容易一些。您可以使用非贪婪重复运算符*?来确保捕获该行的第一个括号部分。

perl -l -ne '/^([^,]*),.*?\(([^()]*)\)/ and print "$1 $2"'

Answer

当文本处理对于基本工具来说太困难时，请尝试awk。

awk -F , '{last_name = $1; sub(/\).*/, ""); sub(/.*\(/, ""); print last_name, $0}'

sed 与此差不多——可读性较差，但 awk 缺乏反向引用。

sed -n 's/^\([^,]*\),[^(]*(\([^()]*\)).*/\1 \2/p'

对于这个特定的任务，Perl 总体上要容易一些。您可以使用非贪婪重复运算符*?来确保捕获该行的第一个括号部分。

perl -l -ne '/^([^,]*),.*?\(([^()]*)\)/ and print "$1 $2"'

Question 2

我将您的代码片段放入名为 alois 的文件中：

sed -r 's/^([^ ,]+)[^0-9]+([0-9]+).*$/\1 \2/' alois 
Aloise-Young 1993
Banerjee 2002
Bennett 1989

快速解释：我们使用 sed 的搜索和替换功能s/模式/替换/

^([^ ,]+) 的意思是：从行的开头取出任何不是空格或 a 的内容，并记住它们。（这就是括号的作用）。

[^0-9]+ 查找任何非数值的内容，但忽略它。

([0-9]+) 获取并记住任何连续数字

.*$ 将其他所有内容匹配到行尾。

\1 \2 将所有匹配的内容（整行）替换为上面记住的值。

Answer