对于非编码人员来说,是否有比 Google doc 的 importxml 和 xpath 更有效的抓取方法?

对于非编码人员来说,是否有比 Google doc 的 importxml 和 xpath 更有效的抓取方法?

我在网上搜索了一个简单的解决方案,但似乎每个人都有自己独特的方法(编码语言)来实现这一点。我才刚刚开始学习Linux,我的编码技能完全缺乏(不存在)。我喜欢使用importxml和xpath的简单性,但在达到50个电子表格限制后复制和粘贴值已经过时了。现在我已经看到了曙光,我真的很想知道一个简单而可扩展的解决方案,以便将更多数据放入更多电子表格/数据库中。

在我真正开始动手之前,我很想知道你们是如何实现这一目标的?

答案1

我可以热情推荐http://www.scraperwiki.com

您可以复制他人的示例,无需编码技能即可取得长足进步。有一个邮件列表,您可以在其中请求抓取工具并雇用他们进行抓取。

相关内容