我想获取每日更新的 PDF 内容。我想将其设置为 cron 作业,并让其获取 PDF 文件名并标注日期(每日),这样我每天都会拥有一份 PDF VERSION-COPY 的副本。
所以:
- Cron 每天运行
- 从服务器下载 PDF
- 将 PDF 复制到“/user/site-xxx”磁盘
- 根据系统日期打印 PDF 文件名或文件夹名称。
这应该允许我保留每天的 PDF 内容的副本,并按文件夹/文件名注明日期,以便进行索引和搜索。
使用 wget 是否可行?欢迎提供反馈!
答案1
使用 编辑 cron 作业crontab -e
。添加此命令:
0 3 * * * /usr/bin/wget --output-file="/pathtofolder/wget.log" --output-document="/pathtofolder/Document$(date +\%Y-\%m-\%d-\%H-\%M).pdf" http://example.com/pathtopdf
这将于每天凌晨 3:00 运行。
此配置更适合 fcron:
%daily,mail(no) * * /usr/bin/wget --output-file="/pathtofolder/wget.log" --output-document="/pathtofolder/Document$(date +\%Y-\%m-\%d-\%H-\%M).pdf" http://example.com/pathtopdf
更好的选择是制作一个脚本并将其放入 /etc/cron.daily/ 并使其可执行
#!/usr/bin/env bash
wget --output-file="/pathtofolder/wget.log" --output-document="/pathtofolder/Document$(date +%Y-%m-%d-%H-%M).pdf" http://example.com/pathtopdf
这将在指定文件夹中生成文件,如“Document2019-04-24-20-36.pdf”