使用 linux、awk 或 sed 编辑 gen.gz 文件的内容

Question

假设字段由空格字符分隔，您可以解压缩文件，将其输入awk以进行修改，然后将结果数据压缩为新文件名。这可以在单个管道中完成，而无需将未压缩的数据存储在磁盘上。操作完成后，检查结果，如果看起来正常，则用它替换原来的结果。

gzip -d -c gen.gz |
awk '{ sub(":[^:]*:[^:]*$", "", $2); print }' |
gzip -c >new-gen.gz

# look at new-gen.gz, and then

mv new-gen.gz gen.gz   # only if you want to discard the original data!

该awk代码可以通过多种不同的方式完成。我选择:从第二个字段中删除最后两个分隔字符串，而不是按照您的建议删除最后四个字符。如果那里总是只有单个字符，则:[^:]*:[^:]*$可以将正则表达式写为:.:.$：

由于您正在修改压缩文件中的数据，因此您无法真正对文件进行就地编辑（与一样sed -i）。

Answer 1

假设字段由空格字符分隔，您可以解压缩文件，将其输入awk以进行修改，然后将结果数据压缩为新文件名。这可以在单个管道中完成，而无需将未压缩的数据存储在磁盘上。操作完成后，检查结果，如果看起来正常，则用它替换原来的结果。

gzip -d -c gen.gz |
awk '{ sub(":[^:]*:[^:]*$", "", $2); print }' |
gzip -c >new-gen.gz

# look at new-gen.gz, and then

mv new-gen.gz gen.gz   # only if you want to discard the original data!

该awk代码可以通过多种不同的方式完成。我选择:从第二个字段中删除最后两个分隔字符串，而不是按照您的建议删除最后四个字符。如果那里总是只有单个字符，则:[^:]*:[^:]*$可以将正则表达式写为:.:.$：

由于您正在修改压缩文件中的数据，因此您无法真正对文件进行就地编辑（与一样sed -i）。

使用 linux、awk 或 sed 编辑 gen.gz 文件的内容

答案1

相关内容