对文本文件进行排序和编辑以输出新文件

Question 1

对于 SQL 来说，这似乎是一项简单的任务。

csv+ sql==csvsql来自csvkit！

您可以通过 pip 安装它。

在开始之前，您可能需要在执行此操作之前修复文件：删除空行和每行末尾的空格：

sed -i.bak '2d;s/[[:blank:]]*$//' file

你可以半途而废：

csvsql \
    -d' ' -S \
    --query 'select cable,grnd_sta || "-" || chan_pdu,group_concat(fldr) from file group by cable' \
    file \
| csvformat -D' '

如果您的文件是制表符分隔的，您可能需要-t而不是。-d' '
用于 csvformat -D' '获取以空格分隔的输出，因为csvsql仅输出以逗号分隔的输出。处理起来更容易awk，但 csvsql 会在最后一列周围加上引号，我们不希望这样！

输出：

cable "grnd_sta || ""-"" || chan_pdu" group_concat(fldr)
1 97-108 79,817,946
3 145-156 64,66,117,240,255,263,291

从这里您可以继续使用awk：

... \
| awk 'NR>1{printf "Cable %s\n\n%s\n%s\n\n",$1,$2,$3}' \
| head -n-1

输出：

Cable 1

97-108
79,817,946

Cable 3

145-156
64,66,117,240,255,263,291

Answer

对于 SQL 来说，这似乎是一项简单的任务。

csv+ sql==csvsql来自csvkit！

您可以通过 pip 安装它。

在开始之前，您可能需要在执行此操作之前修复文件：删除空行和每行末尾的空格：

sed -i.bak '2d;s/[[:blank:]]*$//' file

你可以半途而废：

csvsql \
    -d' ' -S \
    --query 'select cable,grnd_sta || "-" || chan_pdu,group_concat(fldr) from file group by cable' \
    file \
| csvformat -D' '

如果您的文件是制表符分隔的，您可能需要-t而不是。-d' '
用于 csvformat -D' '获取以空格分隔的输出，因为csvsql仅输出以逗号分隔的输出。处理起来更容易awk，但 csvsql 会在最后一列周围加上引号，我们不希望这样！

输出：

cable "grnd_sta || ""-"" || chan_pdu" group_concat(fldr)
1 97-108 79,817,946
3 145-156 64,66,117,240,255,263,291

从这里您可以继续使用awk：

... \
| awk 'NR>1{printf "Cable %s\n\n%s\n%s\n\n",$1,$2,$3}' \
| head -n-1

输出：

Cable 1

97-108
79,817,946

Cable 3

145-156
64,66,117,240,255,263,291

Question 2

我建议使用包含所有必要计算的 Awk 脚本：

NR==1 { next }
NF==0 { next }
      { a[$2][1]= $5 "-" $6;    
        a[$2][2]= a[$2][2] $1 "," ; }
END   { for (c in a) printf "Channel %d\n%s\n%s\n\n",c,a[c][1],a[c][2] }

用法：

$awk -f x.awk data
Channel 1
97-108
79,817,946,

Channel 3
145-156
64,66,117,240,255,263,291,

Answer

我建议使用包含所有必要计算的 Awk 脚本：

NR==1 { next }
NF==0 { next }
      { a[$2][1]= $5 "-" $6;    
        a[$2][2]= a[$2][2] $1 "," ; }
END   { for (c in a) printf "Channel %d\n%s\n%s\n\n",c,a[c][1],a[c][2] }

用法：

$awk -f x.awk data
Channel 1
97-108
79,817,946,

Channel 3
145-156
64,66,117,240,255,263,291,

对文本文件进行排序和编辑以输出新文件

答案1

答案2

相关内容