在单个文件中处理多种类型的字段分隔符

Question 1

鉴于您的示例输入，这似乎有效：

$ awk 'NR == 1 { print } /,/ && /\|/ { print }' input
FOOID|BIZNO|BARBIZ_CODE
00033567|0035952|A,KEEP
00034145|0036865|A,KEEP
00030527|0032479|Z4,KEEP
00034984|0037987|Z5,KEEP
00021826|0022008|Z5,KEEP
00026763|0029293|Z5,KEEP

始终打印第一条（标题）记录；此后仅打印带有逗号和竖线的记录。

Answer

鉴于您的示例输入，这似乎有效：

$ awk 'NR == 1 { print } /,/ && /\|/ { print }' input
FOOID|BIZNO|BARBIZ_CODE
00033567|0035952|A,KEEP
00034145|0036865|A,KEEP
00030527|0032479|Z4,KEEP
00034984|0037987|Z5,KEEP
00021826|0022008|Z5,KEEP
00026763|0029293|Z5,KEEP

始终打印第一条（标题）记录；此后仅打印带有逗号和竖线的记录。

Question 2

短的awk方法：

awk -F'|' 'NR==1{ h=$1; print }NF>1 && NR>1 && $0!~"^"h' file

-F'|'-|视为字段分隔符
NR==1{ h=$1; print }- 遇到第一个记录时，将第一个标头字段分配$1给变量h（作为标头行指示）
NF>1- 打印至少有 2 个“ |”分隔字段的记录
$0!~"^"h- 额外检查以确保记录不存在涉及到标题行

输出：

FOOID|BIZNO|BARBIZ_CODE
00033567|0035952|A,KEEP
00034145|0036865|A,KEEP
00030527|0032479|Z4,KEEP
00034984|0037987|Z5,KEEP
00021826|0022008|Z5,KEEP
00026763|0029293|Z5,KEEP

Answer

短的awk方法：

awk -F'|' 'NR==1{ h=$1; print }NF>1 && NR>1 && $0!~"^"h' file

-F'|'-|视为字段分隔符
NR==1{ h=$1; print }- 遇到第一个记录时，将第一个标头字段分配$1给变量h（作为标头行指示）
NF>1- 打印至少有 2 个“ |”分隔字段的记录
$0!~"^"h- 额外检查以确保记录不存在涉及到标题行

输出：

FOOID|BIZNO|BARBIZ_CODE
00033567|0035952|A,KEEP
00034145|0036865|A,KEEP
00030527|0032479|Z4,KEEP
00034984|0037987|Z5,KEEP
00021826|0022008|Z5,KEEP
00026763|0029293|Z5,KEEP

在单个文件中处理多种类型的字段分隔符

答案1

答案2

相关内容