wget 批处理文件失败,curl 有效,我做错了什么?

wget 批处理文件失败,curl 有效,我做错了什么?

我正在尝试从该网站下载整个目录:https://data.geobasis-bb.de/geobasis/daten/dgm/xyz/

我尝试的是:

wget --show-progress -A 'dgm_*.zip' https://data.geobasis-bb.de/geobasis/daten/dgm/xyz/ -P /run/media/usr1/exthdd/dgm

据我了解,它应该做的是下载所有符合名称 schmea 的文件dgm_.zip*。但是它仅返回:

--2020-01-13 14:50:11--  https://data.geobasis-bb.de/geobasis/daten/dgm/xyz/
CA-Zertifikat »/etc/ssl/certs/ca-certificates.crt« wurde geladen
Auflösen des Hostnamens data.geobasis-bb.de (data.geobasis-bb.de)… 194.99.76.18, 194.76.232.112
Verbindungsaufbau zu data.geobasis-bb.de (data.geobasis-bb.de)|194.99.76.18|:443 … verbunden.
HTTP-Anforderung gesendet, auf Antwort wird gewartet … 200 OK
Länge: nicht spezifiziert [text/html]
Wird in »/run/media/lgoldmann/lg_backup_diss/dgm/index.html.tmp.2« gespeichert.

index.html.tmp.2                             [   <=>                                                                             ]   2,65M  4,69MB/s    in 0,6s    

2020-01-13 14:50:15 (4,69 MB/s) - »/run/media/lgoldmann/lg_backup_diss/dgm/index.html.tmp.2« gespeichert [2778920]

该网站还提供了用于 curl 的预输入命令,它运行良好,但我试图找出我的 wget 命令出了什么问题。

答案1

您需要使用该-r选项来获取页面上的所有链接,否则,wget将只获取 Web 服务器提供的第一个页面(即默认页面或索引)并退出。

-r使用时最好-np排除父链接并确保wget不跟踪上一级或更高级别的链接。

另外,您可能不想wget在本地重建站点的目录结构,而只是下载文件,因此也可以使用-nd如下选项:

wget --show-progress -A 'dgm_*.zip' -r -np -nd https://data.geobasis-bb.de/geobasis/daten/dgm/xyz/ -P /run/media/usr1/exthdd/dgm

相关内容