我的公司正在根据一个大型公开数据集构建一个数据库。当我们完成它时,我们将拥有大约 500GB 的数据,但数据永远不会超过这个数字。它利用了 Postgres 的多边形处理功能,因此必须保留在 Postgres 中。
我们如何才能以最具成本效益的方式托管该数据库?
编辑:我应该提到,我们希望在云中托管这个数据库,因为我们没有自己的现场服务器。
编辑 2:抱歉,让我详细说明一下。此数据库将集成到 SAAS Web 应用程序中,因此可能有许多用户会同时访问数据库。但是,一旦我们将其安装到位,数据将很少发生变化,即使发生变化,也只会被添加,而不会被删除。我们用于托管网站其余部分的 Linode 之类的东西没有足够的存储空间。我们想优化成本,但其次我们更愿意自己不接触任何硬件,因此购买大型驱动器并不理想。
答案1
这取决于使用模式。
但实际上 - 500gb 的 SSD 成本并没有那么高 - 而且它的巨大优势在于它有大量的 IO,否则你将需要数十个(复数)驱动器来应对这一点。
我很可能会说这是你能做的最好的事情了 - 买一块不错的 512gb 固态硬盘 (ssd)。
答案2
使用亚马逊实例。500GB 的空间很便宜,每月只需 50 美元(每 GB 10 美分),而且您可以执行诸如多个卷之类的操作来传播 pgsql 数据等等。
还有像 newservers.com 这样的服务,您可以在其中启动具有真实磁盘等的类似实例的真实服务器,从而无需数据中心。
答案3
本地存储绝对是文件系统高效的。
本地SSD具有明显的速度优势。
目前,很多 RAM 内存都很便宜。
对于您计划的 500 GB,您实际上需要 500+ GB 用于文件系统开销,无论声明“数据永远不会超过这个数字”。
对于上述存储,您需要冗余和备份,并且需要不间断电源来运行设置。
同样,您必须注意文件系统日志。
本地运营确实成本高昂且需要大量劳动力,但我希望能帮助人们解决成本问题。
答案4
如果您没有现场服务器,只需购买带有 SSD 的优质专用服务器即可。我不确定您是否真的想要像 Rackspace 或 Amazon 等云提供商,或者数据中心是否足以满足您的需求?