GREP 来自特定列的大写字符，将结果通过管道传输到与新列相同的文件

Question 1

grep 中有没有选项或参数来指定列？

grep没有字段分隔符选项。
使用以下内容awk相反的方法：

awk -F'\t' -v OFS='\t' '{match($19,/[A-Z]+/); $20=substr($19,RSTART,RLENGTH) FS $20}1' 1.table

match($19,/[A-Z]+/)- 捕获第 19 字段内的大写字母

$20=substr($19,RSTART,RLENGTH) FS $20- 从中提取匹配的大写字母19th 字段并将其插入为20第一个字段值

Answer

grep 中有没有选项或参数来指定列？

grep没有字段分隔符选项。
使用以下内容awk相反的方法：

awk -F'\t' -v OFS='\t' '{match($19,/[A-Z]+/); $20=substr($19,RSTART,RLENGTH) FS $20}1' 1.table

match($19,/[A-Z]+/)- 捕获第 19 字段内的大写字母

$20=substr($19,RSTART,RLENGTH) FS $20- 从中提取匹配的大写字母19th 字段并将其插入为20第一个字段值

Question 2

回答你关于如何做到这一点的字面问题grep 独自的。即使grep没有为此设计，但使用 GNUgrep并使用 PCRE 支持构建，您可以这样做：

grep -Po '(?:^(?:[^\t]*\t){18}|\G)[^\t]*?\K[[:upper:]]'

即搜索<not-TABs><tab>行首或上一个匹配项末尾的 18 个序列 ( \G)，后跟尽可能少的非制表符（因此我们仍在第 19 个字段），后跟大写字母角色，但是\K我们重置了匹配的大写字符之前的部分。

所以对于这样的输入：

X<tab>X<tab>....<tab>AbC<tab>X<tab>...

它会报告：

A
C

就像你的cut | grep做法一样。

如果您只对第 19 字段中的第一个大写字符感兴趣，可以将其简化为：

grep -Po '^(?:[^\t]*\t){18}[^\t]*?\K[[:upper:]]'

将其插入为第 20 个柱子，你可以这样做：

paste <(cut -f1-19 < file) <(grep ...above < file) <(cut -f20- < file) > newfile

或者将其插入为最后一列：

grep... < file | paste file - > newfile

Answer