Wget 下载 github tar.gz 文件作为 html 文档,UTF-8 Unicode 文本?

Wget 下载 github tar.gz 文件作为 html 文档,UTF-8 Unicode 文本?

我需要下载这个文件: https://github.com/cbherer/Bherer_etal_SexualDimorphismRecombination/blob/master/Refined_genic_map_b37.tar.gz

这是我的命令:

wget https://github.com/cbherer/Bherer_etal_SexualDimorphismRecombination/blob/master/Refined_genetic_map_b37.tar.gz

文件已下载,但我想访问其中的文本文件。我试过 :

tar -zxvf Refined_genetic_map_b37.tar.gz
gzip: stdin: not in gzip format
tar: Child returned status 1
tar: Error is not recoverable: exiting now

我检查了文件:

file Refined_genetic_map_b37.tar.gz
Refined_genetic_map_b37.tar.gz: HTML document, UTF-8 Unicode text, with very long lines

那么,我应该如何提取它的文本文件呢?

答案1

您使用了错误的 URL 来访问该文件。您正在获取的是一个网页。正确的网址是

https://github.com/cbherer/Bherer_etal_SexualDimorphismRecombination/raw/master/Refined_EUR_genetic_map_b37.tar.gz

注意raw而不是blob.

如果您转到原始 URL 并检查连接到页面上“下载”按钮的链接,您将看到此 URL。

答案2

正如所指出的@Kusalananda,您需要下载raw,这里是另一个链接(也可以通过浏览器下载):

wget https://raw.githubusercontent.com/cbherer/Bherer_etal_SexualDimorphismRecombination/master/Refined_genetic_map_b37.tar.gz

相关内容