使用 wget 通过 FTP 仅下载最近修改的文件

使用 wget 通过 FTP 仅下载最近修改的文件

从 FTP 服务器递归获取时wget,如何仅下载给定日期之后修改的文件?

用例是我需要每晚与多个服务器同步,但我只需要几天前的数据。该--mirror标志就足够了,只是同步其余数据(即使只同步一次)将花费很长时间。

答案1

wget可以镜像一次,然后只能获取带有该--timestamp标志的后续项目。我建议阅读info它的页面,其中有很好的解释,并检查这是否为您提供了您正在寻找的行为。

答案2

不,wget 不支持这一点,除非您已经同步过一次,无论是否通过 wget(在这种情况下,请参阅 参考资料--timestamp)。

您可以尝试以下一些解决方法:

  • 如果文件的名称或路径中包含日期,而不仅仅是文件修改时间,则您可以使用正则表达式/目录来排除旧文件。
  • 使用 . 之外的其他东西wget。这似乎是专用脚本的良好候选者。您仍然可以一次对一个文件使用 wget。您还可以查看 wpull,我没有使用过它,但我知道它与 wget 类似,通过脚本来确定是否下载页面。
  • 如果除了 FTP 之外还有 HTTP 下载选项,则可以发送自定义 HTTP 缓存指令标头,该标头仅在特定日期之后修改文件时才下载该文件。

相关内容