如果列有多个值，请分别复制包含每个值的行

Question 1

awk您可以通过拆分复合列,并循环结果来完成此操作：

awk -F'\t' 'BEGIN{OFS=FS} {n=split($2,a,/,/); for(i=1;i<=n;i++){$2 = a[i]; print}}' file

也许更干净，你可以这样做磨坊主- 特别是，使用嵌套动词：

$ cat file
C1      C2      C3
a       b,c     d
e       f,g,h   i
j       k       l

$ mlr --tsv nest --explode --values --across-records --nested-fs ',' -f C2 file
C1      C2      C3
a       b       d
a       c       d
e       f       i
e       g       i
e       h       i
j       k       l

更紧凑的--explode --values --across-records --nested-fs ','可以替换为--evar ','

Answer

awk您可以通过拆分复合列,并循环结果来完成此操作：

awk -F'\t' 'BEGIN{OFS=FS} {n=split($2,a,/,/); for(i=1;i<=n;i++){$2 = a[i]; print}}' file

也许更干净，你可以这样做磨坊主- 特别是，使用嵌套动词：

$ cat file
C1      C2      C3
a       b,c     d
e       f,g,h   i
j       k       l

$ mlr --tsv nest --explode --values --across-records --nested-fs ',' -f C2 file
C1      C2      C3
a       b       d
a       c       d
e       f       i
e       g       i
e       h       i
j       k       l

更紧凑的--explode --values --across-records --nested-fs ','可以替换为--evar ','

Question 2

由于您还用标记了问题sed，我觉得有必要添加一个sed解决方案：

sed -e '/,/{s//\n/;h;s/[^\t]*\n//;x;s/\n[^\t]*//p;G;D;}'

_{（注意：为了便于阅读，我使用了\n换行符和\t制表符，就像使用 GNU 一样sed。对于可移植的解决方案，请使用带有实际换行符的反斜杠，而不是使用\n实际制表符\t，输入ctrlV如下tab）}

带有逗号的行被复制到保留空间，一个副本打印逗号之前的内容，另一个副本打印逗号之后的部分进入下一个循环。详细地：

为了避免与多个逗号混淆，我们用换行符替换一个逗号s//\n/
h在我们搞乱线路之前，将一份副本保存到旧空间
s/[^\t]*\n//删除第一个逗号之前的部分
然后我们x改变缓冲区
s/\n[^\t]*//p删除从逗号开始的部分并打印它
G将保留空间附加到模式空间。这可以包含附加逗号，所以
D删除第一行（已打印）并从该行的其余部分重新开始

Answer

由于您还用标记了问题sed，我觉得有必要添加一个sed解决方案：

sed -e '/,/{s//\n/;h;s/[^\t]*\n//;x;s/\n[^\t]*//p;G;D;}'

_{（注意：为了便于阅读，我使用了\n换行符和\t制表符，就像使用 GNU 一样sed。对于可移植的解决方案，请使用带有实际换行符的反斜杠，而不是使用\n实际制表符\t，输入ctrlV如下tab）}

带有逗号的行被复制到保留空间，一个副本打印逗号之前的内容，另一个副本打印逗号之后的部分进入下一个循环。详细地：

为了避免与多个逗号混淆，我们用换行符替换一个逗号s//\n/
h在我们搞乱线路之前，将一份副本保存到旧空间
s/[^\t]*\n//删除第一个逗号之前的部分
然后我们x改变缓冲区
s/\n[^\t]*//p删除从逗号开始的部分并打印它
G将保留空间附加到模式空间。这可以包含附加逗号，所以
D删除第一行（已打印）并从该行的其余部分重新开始

Question 3

awk（或perl在awk模式下）可能是最好的标准解决方案，但你能ksh在大多数 shell 中，尤其是那些带有数组 ( , bash, zsh)的 shell 中，可以相当有效地执行此操作：

set -f # split but don't glob unquoted substitutions
#bash
while IFS=$'\t' read -ra ary; do 
#ksh
while read -r line; do IFS=$'\t'; ary=($line)
#zsh I haven't worked out

  IFS=,; for v in ${ary[17]}; do 
    ary[17]=$v; IFS=$'\t'; printf '%s\n' "${ary[*]}"
  done
  # bash,ksh arrays are 0-origin versus 1-origin fields in awk
  # we don't need to special-case no-comma, it splits to a single value
done <input >output

对于没有数组的旧的/有限的 shell，请使用位置参数，例如（可能会有所不同）：

set -f
while read -r line; do IFS=$'\t'; set -- $line
  IFS=,; for v in ${18}; do
    # can't alter $num so yucky
    for i in $(seq $#); do
      case $i in (1);; (*) printf '\t';; esac
      case $i in (18) printf %s "$v";; (*) eval printf %s \"\${$i}\";; esac
    done
    # or maybe i=1; while [ $i -le $# ]; do ... i=$((i+1)); done
    # where [/test is likely shell builtin and seq is unlikely 
  done
done <input >output

Answer

awk（或perl在awk模式下）可能是最好的标准解决方案，但你能ksh在大多数 shell 中，尤其是那些带有数组 ( , bash, zsh)的 shell 中，可以相当有效地执行此操作：

set -f # split but don't glob unquoted substitutions
#bash
while IFS=$'\t' read -ra ary; do 
#ksh
while read -r line; do IFS=$'\t'; ary=($line)
#zsh I haven't worked out

  IFS=,; for v in ${ary[17]}; do 
    ary[17]=$v; IFS=$'\t'; printf '%s\n' "${ary[*]}"
  done
  # bash,ksh arrays are 0-origin versus 1-origin fields in awk
  # we don't need to special-case no-comma, it splits to a single value
done <input >output

对于没有数组的旧的/有限的 shell，请使用位置参数，例如（可能会有所不同）：

set -f
while read -r line; do IFS=$'\t'; set -- $line
  IFS=,; for v in ${18}; do
    # can't alter $num so yucky
    for i in $(seq $#); do
      case $i in (1);; (*) printf '\t';; esac
      case $i in (18) printf %s "$v";; (*) eval printf %s \"\${$i}\";; esac
    done
    # or maybe i=1; while [ $i -le $# ]; do ... i=$((i+1)); done
    # where [/test is likely shell builtin and seq is unlikely 
  done
done <input >output

Question 4

 while read line
 do
 fic=$(echo $line | awk '{print $1}')
 laco=$(echo $line | awk '{print $NF}')
 secon_colu=$(echo $line| awk '$2 ~ /,/{print $2}')
 if [[ "$secon_colu" =~ "," ]]
 then
 for ko in $(echo $line | awk '$2 ~ /,/{print $2}'| sed 's/,/ /g')
 do
 echo "$fic $ko  $laco"
 done
 else
 echo $line
 fi
 done<file.txt

输出

C1 C2 C3
a b  d
a c  d
e f  i
e g  i
e h  i
j k l

Answer

 while read line
 do
 fic=$(echo $line | awk '{print $1}')
 laco=$(echo $line | awk '{print $NF}')
 secon_colu=$(echo $line| awk '$2 ~ /,/{print $2}')
 if [[ "$secon_colu" =~ "," ]]
 then
 for ko in $(echo $line | awk '$2 ~ /,/{print $2}'| sed 's/,/ /g')
 do
 echo "$fic $ko  $laco"
 done
 else
 echo $line
 fi
 done<file.txt

输出

C1 C2 C3
a b  d
a c  d
e f  i
e g  i
e h  i
j k l

如果列有多个值，请分别复制包含每个值的行

答案1

答案2

答案3

答案4

相关内容