从终端下载文件

从终端下载文件

我正在尝试使用终端下载 .txt 文件。这是链接(打开链接后立即开始下载):

https://es.osdn.net/projects/sfnet_kaldi/downloads/wsj0-train-spkrinfo.txt

我尝试使用命令下载它

wget "https://es.osdn.net/projects/sfnet_kaldi/downloads/wsj0-train-spkrinfo.txt"

不幸的是,运行该命令后我得到的唯一结果是页面源:(

有人能告诉我从终端下载此文件的正确方法是什么吗?

提前致谢!

答案1

如果您遵循他们的 HTML,他们会采取一些技巧来隐藏内容的实际来源。

您想要下载的文件可以使用以下命令从获取文件的源中下载:

 wget http://jaist.dl.sourceforge.net/project/kaldi/wsj0-train-spkrinfo.txt

所以,并不是你缺乏 Unix 知识,归根结底,他们只是故意迟钝。

您还可以在其主页中访问该项目(kaldi)的所有文件:https://sourceforge.net/projects/kaldi/files/(旧版本,由您的原始链接指向)

去那里,你会看到有一个更新的版本https://github.com/kaldi-asr/kaldi

答案2

您的链接“看起来”像一个文本文件链接,应该按照您尝试的方式下载wget- 您正确地完成了所有操作。问题是,运行该网站的人的行为是“狡猾的”——他们配置了网站,使链接不是真正的文本文件,他们想强迫你浏览他们的网络界面并至少执行再按一下。我讨厌这样的网站,但它的内容就是它的规则。

也许其他人会提出解决方法,但请注意,没有任何解决方法可以适用于所有网站,甚至不一定适用于同一网站上的不同页面。

答案3

正如页面本身实际所说:

wget -O wsj0-train-spkrinfo.txt \
     'https://es.osdn.net/frs/g_redir.php?m=kent&f=kaldi%2Fwsj0-train-spkrinfo.txt'

但不幸的是,这没有通用规则,这取决于页面的实现。

相关内容