我担心我把这些混淆了。
我有自己的用 PhantomJS 编写的网络爬虫,它为 m 收集一些数据(来自不提供 API 的站点),我一直在自己的计算机上测试它,它看起来相当不错,我现在想要做的是拥有一些远程计算机,我可以在其上运行我的爬虫并查看它全天候的运行情况。
我不太确定我到底需要什么。如果我只想爬取网页,我是否需要一台虚拟机,带有 GUI 和其他东西?我发现Windows Azure但最便宜的选择是每月 12-20 美元,这相当多。实现我想要的最便宜的方法是什么?特别是如果我想一次运行超过 1 个爬虫,可能需要运行更多机器,即使每月 10 美元也可能花费很多!
答案1
您可能会考虑查看 DigitalOcean 容器。
容器是虚拟机的一种形式,但内核位于虚拟机的主机上,这意味着容器的大小和资源使用率较低。还有很多其他容器提供服务,所以请对此进行一些研究。