我是一名学生,需要从我的教授的网站上下载很多东西,最好保留一些文件夹结构。
我在 Windows 机器上工作,可以访问 Windows XP、Windows 7 和 Windows Server 2008 R2。很久以前(2-3 年前),我尝试过一些镜像网页之类的实用程序,但由于各种原因,它们从未正常工作,或者我从未从中获得我想要的东西。
例如,这些文件夹:
http://myUniversity.edu/professor/classLectures/folder1/programmaticFolderABCXYZ
http://myUniversity.edu/professor/classLectures/folder1/programmaticFolder123456
http://myUniversity.edu/professor/classLectures/folder1/programmaticFolder4321
http://myUniversity.edu/professor/classLectures/folder1/programmaticFolder2345
http://myUniversity.edu/professor/classLectures/folder2/programmaticFolderABCXYZ2
http://myUniversity.edu/professor/classLectures/folder2/programmaticFolder1234563
http://myUniversity.edu/professor/classLectures/folder2/programmaticFolder43214
http://myUniversity.edu/professor/classLectures/folder2/programmaticFolder23455
本质上,尝试手动下载以供以后使用真的很麻烦。
我试过了此实用程序并且它要么是过度的,要么是不够简单,因为我永远无法让它只将文件下载到我的硬盘上。
理想情况下,我想递归扫描文件夹,在某个指定文件夹中重新创建文件夹结构,然后将文件从远程服务器复制到本地计算机上的相应文件夹中。
答案1
以递归方式从网站下载文件的最简单的实用程序是 WGET:
答案2
答案3
看看使用HT轨道:
它允许您将万维网站点从 Internet 下载到本地目录,递归构建所有目录,将 HTML、图像和其他文件从服务器下载到您的计算机。HTTrack 会安排原始网站的相对链接结构。只需在浏览器中打开“镜像”网站的页面,您就可以逐个链接浏览该网站,就像您在线查看一样。HTTrack 还可以更新现有的镜像网站,并恢复中断的下载。HTTrack 完全可配置,并具有集成的帮助系统。