gzip -t 输出“gzip:文件名.gz:忽略 X 字节的额外字段”

gzip -t 输出“gzip:文件名.gz:忽略 X 字节的额外字段”

我有一堆 .gz 文件,我正在使用 gzip -t -v file 检查数据传输后的完整性,我得到的输出是

gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
....
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
OK

这些重复的行表示什么以及如何获得最终的 OK 作为输出?

答案1

这是正常现象,文件没有任何问题。只是他们是压缩包文件而不是 gzip 文件。 Bgzip 有一些 gzip 不知道的额外字段:

bgzip 编写的 BGZF 格式在 SAM 格式规范中进行了描述,可从http://samtools.github.io/hts-specs/SAMv1.pdf。它利用 gzip 功能来连接压缩文件。输入数据在压缩前后被分成不大于64KB的块(包括压缩头)。每个块都被压缩成一个 gzip 文件。 gzip 标头包括一个带有标识符“BC”的额外子字段和压缩块的长度(包括所有标头)。

因此,您可以忽略这些消息,或者您可以删除-v无论如何都不需要的选项,或者您可以bgzip -t使用gzip -t.

相关内容