社交媒体网站如何存储帖子

社交媒体网站如何存储帖子

社交媒体网站(例如 Facebook 和 Twitter)是否将帖子存储在数据库中?像 mysql 那样?数据库不会非常大吗?Facebook 或社交媒体网站会删除旧帖子吗?

答案1

他们使用像 Hadoop 这样的大型分布式“数据库”系统。数据库非常庞大,我知道 Facebook 的数据库已经超过 2Pb(PB)。我认为他们不会删除旧帖子,但他们确实会将其转移到较旧/较慢的技术上。保持最新数据新鲜且在线,最好在 RAM 中。

基本思想是将数据存储在各个地方的小块中,并让智能程序在需要时找出数据的位置。同时让每个位进行自己的计算,这样您就不必将所有数据放在一个地方。像 facebook 这样的网站非常适合这种情况,因为您通常一次只处理 1 个人的数据 - 因此即使 joe 的信息与 sam 的信息位于不同的服务器中,也不会有太大影响。

http://en.wikipedia.org/wiki/Apache_Hadoop

相关内容