我有超过 100 个 lz4 文件,其命名如下:
-rw-r--r-- 1 root root 210M Apr 11 10:11 compressedfile.1-0.lz4
-rw-r--r-- 1 root root 208M Apr 11 11:35 compressedfile.1-1.lz4
-rw-r--r-- 1 root root 185M Apr 11 12:49 compressedfile.2-0.lz4
-rw-r--r-- 1 root root 193M Apr 11 13:06 compressedfile.2-1.lz4
-rw-r--r-- 1 root root 201M Apr 11 14:28 compressedfile.3-0.lz4
-rw-r--r-- 1 root root 236M Apr 11 15:02 compressedfile.3-1.lz4
....
这些文件是巨大的 csv 文件,如下所示:
10.27.221.233,11,TCP,SSL,66,8578,0,,(null),510-12
10.133.205.134,10,UDP,ICMP,26,3470,1,,(null),515-10
10.92.160.173,10,TCP,SSL,66,8578,0,,(null),510-15
10.132.81.71,11,TCP,SSL,0,2,0,,(null),511-10
我需要过滤掉使用 SSL 的 IP 地址。我的方法是这样的:
lz4 -dc compressedfile.1-0.lz4 | awk -F, '{if ($4=="SSL") print $1}'
这仅适用于一个文件。我尝试使用通配符处理多个文件,如下所示:
lz4 -dc compressedfile.*.lz4 | awk -F, '{if ($4=="SSL") print $1}'
Warning : compressedfile.1-1.lz4 won't be used ! Do you want multiple input files (-m) ?
Warning : compressedfile.2-0.lz4 won't be used ! Do you want multiple input files (-m) ?
Warning : compressedfile.2-1.lz4 won't be used ! Do you want multiple input files (-m) ?
....
10.27.221.233
10.92.160.173
10.132.81.71
10.140.81.238
10.92.5.90
....
<it ends with the IP (with SSL) on compressedfile.1-0.lz4>
然后我尝试-m
向 lz4 添加选项:
lz4 -mdc compressedfile.*.lz4 | awk -F, '{if ($4=="SSL") print $1}'
创建了压缩文件。*未压缩文件:(
我需要您关于在 lz4 上使用通配符的建议。如果可能的话,我试图避免使用for
循环。
答案1
lz4
文件可以作为一个单元连接和处理,因此这将起作用:
cat compressedfile.*.lz4 | lz4 -dc | awk -F, '{if ($4=="SSL") print $1}'