我的组织正在建立一个新的托管网站,我需要从当前网站下载大量文件。这些文件托管在其他地方。不幸的是,我们现有网站处理文件的方式对我来说是一个黑匣子,我必须绕过它才能获得所需的文件。我得到了所需文件的长列表,但它们是链接,而不是文件名,我可以直接将其放入浏览器并保存。例如,这是其中一个条目。
2023 年 9 月 19 日审计委员会会议议程和链接 .../AgendaCenter/ViewFile/Agenda/_09192023-804
当您访问该链接时,它会显示一个 PDF 文件,其名称与链接不匹配。在本例中,文件名为09-19-2023 Audit Committee Agenda.pdf
。
理想情况下,我希望有一个应用程序或脚本,我可以输入此条目列表,它会下载访问链接时找到的所有文件,然后可以选择在文件名后附加唯一标识符,这样我们就可以知道哪个文件与哪个条目对应。有超过 700 个条目,因此很难根据名称进行匹配,而且很容易混淆。但是,即使没有重命名文件的选项,只要能够通过批量处理做到这一点,这将是一个巨大的进步。
非常感谢您的任何建议!
答案1
最好通过 FTP 访问该站点,因为这样您可以同时下载文件夹和文件结构。
如果您不想经历这些,或者您将没有被授予 FTP 访问权限,那么具有 FTP 访问权限的人将更适合完成此操作,但是...如果这绝对不是一个选择:
使用全部放下实用程序。我在 Firefox 中广泛使用了它,但显然他们也为 Opera、Edge 和 Chrome 发布了插件。
- 将包含链接列表的文档保存为 HTML 文件,确保每个链接都是实际的超链接(您可以单击以直接下载文件)。
- 在安装了 DownThemAll 插件的浏览器中打开此 HTML 文件。
- (可选)如果您愿意,请打开 DownThemAll 插件设置并配置默认保存位置。如果您现在不配置,它也可能会在第一次使用时提示您执行此操作。
- 右键单击页面并使用适当的 DownThemAll 插件命令下载页面上的所有链接。如果您之前未完成第 3 步,系统将提示您选择保存位置。请确保选择将所有下载内容保存到该位置的选项,这样您就不必为每个单独的文件处理该提示。
- 利润...