Hadoop/Hive 元存储

Hadoop/Hive 元存储

人们将他们的多用户元存储放在哪里?我打算使用 mysql,但我不知道应该把它放在哪里。在名称节点上还是在它自己的服务器上?

答案1

Hadoop 确实会破坏数据节点上的页面缓冲区,因此最好让 mySQL 远离其中任何一个。

在集群外运行 Hive 的建议非常好,因为如果在集群内运行它,将会遇到严重的平衡问题。

答案2

它确实可以在任何机器上。

我们在非集群成员节点上安装了 hive(但仅用于暂存要加载到 hive 中的数据)并在那里设置了元存储 mysql 实例。

相关内容