我想存档特定的 RSS 源并随着时间的推移扩大数据库。我注意到较旧的文章会从 RSS 源中消失,而新文章则会添加。我希望能够将它们存档在我的磁盘上,因此,几年后,我建立了一个档案。我更喜欢 Linux 终端工具,但 GUI 也可以。
我可以使用什么工具来做到这一点? 如果有人可以给我推荐一些库,我也可以用python自己编写代码...
答案1
Python feed 解析器似乎是一个很好的解决方案。
https://pypi.python.org/pypi/feedparser
看起来很容易使用...
import feedparser d = feedparser.parse('https://www.eff.org/rss/updates.xml') for item in d.entries: print (item.title)
item.id
检查饲料是否新鲜似乎是唯一的方法。