如何从单一来源聚合一段时间内的 RSS 提要?

如何从单一来源聚合一段时间内的 RSS 提要?

我想存档特定的 RSS 源并随着时间的推移扩大数据库。我注意到较旧的文章会从 RSS 源中消失,而新文章则会添加。我希望能够将它们存档在我的磁盘上,因此,几年后,我建立了一个档案。我更喜欢 Linux 终端工具,但 GUI 也可以。

我可以使用什么工具来做到这一点? 如果有人可以给我推荐一些库,我也可以用python自己编写代码...

答案1

Python feed 解析器似乎是一个很好的解决方案。

https://pypi.python.org/pypi/feedparser

看起来很容易使用...

import feedparser d = feedparser.parse('https://www.eff.org/rss/updates.xml') for item in d.entries: print (item.title)

item.id检查饲料是否新鲜似乎是唯一的方法。

相关内容