我正在尝试解压 fastq.gz 文件,然后分析其中的测序数据。但是,后续分析依赖于解压文件中行的保存顺序(压缩文件的第 1 行必须是解压文件的第 1 行)。
当我手动查看文件时,我发现使用 gunzip 解压 fatsq.gz 文件时行顺序被保留了(我并不指望其他的)。但是,下游分析失败,因为原始文件的顺序没有保留。我是否遗漏了解压过程的某些内容?谢谢。
看起来类似下面的事情正在发生。
Sequencer 将数据写入 fastq.txt:
line1
line2
line3
lin4
然后将其压缩为 fastq.gz。然后我使用 gunzip 解压缩,似乎得到类似以下内容,其中行顺序被打乱:
line2
line1
line4
line3