扫描和抓取

Question 1

如果.ses'是静态扩展，只需将删除尾随 5 个字符的操作硬编码到 awk 中，方法是从开头打印字符串到末尾 5 个字符：

awk -F/ '{print substr($NF, 1, length($NF)-5)}'

如果扩展名的长度可能不同，则在打印之前将其替换为空字符串：

awk -F/ '{gsub(/\..+$/, "", $NF); print $NF}'

Answer

如果.ses'是静态扩展，只需将删除尾随 5 个字符的操作硬编码到 awk 中，方法是从开头打印字符串到末尾 5 个字符：

awk -F/ '{print substr($NF, 1, length($NF)-5)}'

如果扩展名的长度可能不同，则在打印之前将其替换为空字符串：

awk -F/ '{gsub(/\..+$/, "", $NF); print $NF}'

Question 2

如果您grep支持 perl 兼容的正则表达式 (PCRE) 语法：

$ grep -Po 'rea ses.*/\K[^.]*' file
abcd_efgh-A20_ABC-abcdefgh-Abcdefgh_Abcdef_123er_vb001

解释：

Answer

如果您grep支持 perl 兼容的正则表达式 (PCRE) 语法：

$ grep -Po 'rea ses.*/\K[^.]*' file
abcd_efgh-A20_ABC-abcdefgh-Abcdefgh_Abcdef_123er_vb001

解释：

Question 3

您可以放弃该管道并sed使用

sed -n '/rea ses/s!^.*/\(.*\)\.[^.]*$!\1!p' a4.ses

输出

abcd_efgh-A20_ABC-abcdefgh-Abcdefgh_Abcdef_123er_vb001

该sed命令的作用可以描述如下

Answer

您可以放弃该管道并sed使用

sed -n '/rea ses/s!^.*/\(.*\)\.[^.]*$!\1!p' a4.ses

输出

abcd_efgh-A20_ABC-abcdefgh-Abcdefgh_Abcdef_123er_vb001

该sed命令的作用可以描述如下

Question 4

您可以使用basename删除尾随扩展名：

cat a4.ses | grep -im1 'rea ses' | awk -F'[/]' '{print $NF}' | xargs basename -s .ses\'

（为了完整性而提交，考虑到您的流程，@steeldriver 的答案更好）

Answer

您可以使用basename删除尾随扩展名：

cat a4.ses | grep -im1 'rea ses' | awk -F'[/]' '{print $NF}' | xargs basename -s .ses\'

（为了完整性而提交，考虑到您的流程，@steeldriver 的答案更好）

相关内容