使用 wget 作为 cron 任务来每日获取 PDF 内容

使用 wget 作为 cron 任务来每日获取 PDF 内容

我想获取每日更新的 PDF 内容。我想将其设置为 cron 作业,并让其获取 PDF 文件名并标注日期(每日),这样我每天都会拥有一份 PDF VERSION-COPY 的副本。

所以:

  • Cron 每天运行
  • 从服务器下载 PDF
  • 将 PDF 复制到“/user/site-xxx”磁盘
  • 根据系统日期打印 PDF 文件名或文件夹名称。

这应该允许我保留每天的 PDF 内容的副本,并按文件夹/文件名注明日期,以便进行索引和搜索。

使用 wget 是否可行?欢迎提供反馈!

答案1

使用 编辑 cron 作业crontab -e。添加此命令:

0 3 * * * /usr/bin/wget --output-file="/pathtofolder/wget.log" --output-document="/pathtofolder/Document$(date +\%Y-\%m-\%d-\%H-\%M).pdf" http://example.com/pathtopdf

这将于每天凌晨 3:00 运行。

此配置更适合 fcron:

%daily,mail(no) * * /usr/bin/wget --output-file="/pathtofolder/wget.log" --output-document="/pathtofolder/Document$(date +\%Y-\%m-\%d-\%H-\%M).pdf" http://example.com/pathtopdf 

更好的选择是制作一个脚本并将其放入 /etc/cron.daily/ 并使其可执行

#!/usr/bin/env bash

wget --output-file="/pathtofolder/wget.log" --output-document="/pathtofolder/Document$(date +%Y-%m-%d-%H-%M).pdf" http://example.com/pathtopdf 

这将在指定文件夹中生成文件,如“Document2019-04-24-20-36.pdf”

相关内容