Wget 网站“钻研”广播节目元素

Wget 网站“钻研”广播节目元素

我经营一家 Low Power FM 社区广播电台,除了现场直播节目外,我们还播放来自世界各地制作人的联合节目。每周我都会花太多时间下载节目元素并将它们放在各自的文件夹中,以便 Win 10 自动播放。

有些是通过 RSS 访问的,有些是通过 FTP 访问的,有些是通过电子邮件链接访问的,还有不少是通过网站访问的(有些是公开的,有些需要密码)。我玩过 Windows 程序,比如网络下载管理器但我敢打赌,如果使用专用的 Linux PC 使用 wget 和 cron 来处理一些每周任务,我就能加快速度。我仍在学习如何使用这些工具,并着眼于只下载最新的文件。

我已经得到了获得在一些网站上工作顺利;其他网站则需要耐心、研究和侦查工作。我不能做的事情是开始需要弄清楚的是如何处理那些我必须“深入”才能获得最新内容的网站。最新文件的 URL 每周都会更改。看看这个: 网页“钻探”层级结构图

我转到主页(例如,h++p://www.广播节目.org/stationdownload/index.php),它会将我带到另一个页面,在那里我可以选择我想要的文件格式(.mp2、.mp3 等),它会将我带到另一个页面,在那里我可以选择我想要的日期,它会将我带到另一个页面,在那里我可以找到本周要下载的文件。

我已经证明 wget 可以毫无问题地处理来自此类站点的单个文件,但不知道如何告诉程序深入到适当的目录并每周下载新文件。

我并不是一个彻头彻尾的菜鸟,但也没有足够的经验可以说“嘘!小孩都能做到!”或“你疯了吗?事情不是那样运作的!”

有什么想法吗?

相关内容