是否有人知道已经为大数据处理设置了环境的沙箱?
它可以是 hadoop、cassandra、pig 等等...
我是一名 SQL 服务器程序员,正在尝试进入大数据/nosql 解决方案,但在 Linux 中建立自己的环境时遇到了非常困难。
是否有任何免费/付费服务允许您上传大数据并使用它并设置集群?
答案1
亚马逊、Windows Azure。
您可以在短时间内轻松获得100或1000台虚拟机。
任何此类外部事物的问题在于“大数据”难以移动。大量处理很容易,但如何将 TB 级的数据发送到亚马逊进行测试呢?