我有一堆 .gz 文件,我正在使用 gzip -t -v file 检查数据传输后的完整性,我得到的输出是
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
....
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
gzip: C2_CRRA200017850-1a_H3LJWDSXY_L1_2.fq.gz: extra field of 6 bytes ignored
OK
这些重复的行表示什么以及如何获得最终的 OK 作为输出?
答案1
这是正常现象,文件没有任何问题。只是他们是压缩包文件而不是 gzip 文件。 Bgzip 有一些 gzip 不知道的额外字段:
bgzip 编写的 BGZF 格式在 SAM 格式规范中进行了描述,可从http://samtools.github.io/hts-specs/SAMv1.pdf。它利用 gzip 功能来连接压缩文件。输入数据在压缩前后被分成不大于64KB的块(包括压缩头)。每个块都被压缩成一个 gzip 文件。 gzip 标头包括一个带有标识符“BC”的额外子字段和压缩块的长度(包括所有标头)。
因此,您可以忽略这些消息,或者您可以删除-v
无论如何都不需要的选项,或者您可以bgzip -t
使用gzip -t
.