人们将他们的多用户元存储放在哪里?我打算使用 mysql,但我不知道应该把它放在哪里。在名称节点上还是在它自己的服务器上?
答案1
Hadoop 确实会破坏数据节点上的页面缓冲区,因此最好让 mySQL 远离其中任何一个。
在集群外运行 Hive 的建议非常好,因为如果在集群内运行它,将会遇到严重的平衡问题。
答案2
它确实可以在任何机器上。
我们在非集群成员节点上安装了 hive(但仅用于暂存要加载到 hive 中的数据)并在那里设置了元存储 mysql 实例。
人们将他们的多用户元存储放在哪里?我打算使用 mysql,但我不知道应该把它放在哪里。在名称节点上还是在它自己的服务器上?
Hadoop 确实会破坏数据节点上的页面缓冲区,因此最好让 mySQL 远离其中任何一个。
在集群外运行 Hive 的建议非常好,因为如果在集群内运行它,将会遇到严重的平衡问题。
它确实可以在任何机器上。
我们在非集群成员节点上安装了 hive(但仅用于暂存要加载到 hive 中的数据)并在那里设置了元存储 mysql 实例。