云中的数据冗余和路由

云中的数据冗余和路由

云存储提供商(例如 Dropbox、Apple iCloud、Evernote 等)如何提供冗余数据存储,同时将我的查询路由到具有我的数据相应副本的服务器。

举个例子,我有一个文档“CV.docx”,我将其存储在 Dropbox 中。Dropbox 需要保留此文件的冗余副本(以防硬件故障、连接丢失等),假设他们将其存储在服务器 1 和服务器 2 上。当我稍后请求下载此文件时,Dropbox 如何知道哪些服务器存储了我的文件,并将我的请求路由到服务器 1 或 2,而不是服务器 500。

这种将存储位置与存储在中央数据库中的文档配对的做法是否需要我的请求通过?如果是这样,这是否会出现单点故障?我猜这个数据库是复制的,但这可以扩展到数百万用户吗?

答案1

云可以有很多不同的东西……在我的世界里……云意味着“自动化多租户”。对某些人来说,云意味着地理冗余。

因此,在文件存储领域,这取决于提供商。Apple 可能会使用某种增量存储同步将数据复制到两个或更多地方。他们还可能会将其分解为前端和后端,并想出一些巧妙的方法来高效存储数据。

我认为我能给你的最好答案是,我们无法真正权威地回答别人在做什么。你必须自己做研究。

相关内容