我正在尝试从该网站下载整个目录:https://data.geobasis-bb.de/geobasis/daten/dgm/xyz/
我尝试的是:
wget --show-progress -A 'dgm_*.zip' https://data.geobasis-bb.de/geobasis/daten/dgm/xyz/ -P /run/media/usr1/exthdd/dgm
据我了解,它应该做的是下载所有符合名称 schmea 的文件dgm_.zip*。但是它仅返回:
--2020-01-13 14:50:11-- https://data.geobasis-bb.de/geobasis/daten/dgm/xyz/
CA-Zertifikat »/etc/ssl/certs/ca-certificates.crt« wurde geladen
Auflösen des Hostnamens data.geobasis-bb.de (data.geobasis-bb.de)… 194.99.76.18, 194.76.232.112
Verbindungsaufbau zu data.geobasis-bb.de (data.geobasis-bb.de)|194.99.76.18|:443 … verbunden.
HTTP-Anforderung gesendet, auf Antwort wird gewartet … 200 OK
Länge: nicht spezifiziert [text/html]
Wird in »/run/media/lgoldmann/lg_backup_diss/dgm/index.html.tmp.2« gespeichert.
index.html.tmp.2 [ <=> ] 2,65M 4,69MB/s in 0,6s
2020-01-13 14:50:15 (4,69 MB/s) - »/run/media/lgoldmann/lg_backup_diss/dgm/index.html.tmp.2« gespeichert [2778920]
该网站还提供了用于 curl 的预输入命令,它运行良好,但我试图找出我的 wget 命令出了什么问题。
答案1
您需要使用该-r
选项来获取页面上的所有链接,否则,wget
将只获取 Web 服务器提供的第一个页面(即默认页面或索引)并退出。
-r
使用时最好-np
排除父链接并确保wget
不跟踪上一级或更高级别的链接。
另外,您可能不想wget
在本地重建站点的目录结构,而只是下载文件,因此也可以使用-nd
如下选项:
wget --show-progress -A 'dgm_*.zip' -r -np -nd https://data.geobasis-bb.de/geobasis/daten/dgm/xyz/ -P /run/media/usr1/exthdd/dgm