我有一个集群,正在设置 Cloudera 3,但不清楚我是否应该像以前使用标准 Apache Hadoop 设置那样使用这些启动/停止脚本(我有一个运行所有 Hadoop 内容的特定用户帐户)。使用 CDH3,我以 root 身份运行这些服务。
使用 Cloudera 3 发出全局启动和停止建议的安全便捷方法是什么?想要使用这些脚本的用户是否设置了密钥,以便 root 可以登录到其他框?如果是这样,sudo 用户如何设置(仅sudo su
设置密钥?)?
另外,当我尝试运行sudo /usr/lib/hadoop-0.20/bin/start-all.sh
(没有为 root 用户设置密钥来连接到删除框)时,我得到以下输出:
starting namenode, logging to /usr/lib/hadoop-0.20/bin/../logs/hadoop-root-namenode-meez01.out
May not run daemons as root. Please specify HADOOP_NAMENODE_USER
<asks me for root@myserver's password>
....
<similar message for jobtracker>
更新:我知道某人那里肯定有人在使用 Cloudera。这是不是阴谋,让我为他们的支持付费?!开玩笑的。如果有的话,请让我知道你是如何使用它的
答案1
我正在寻找类似的信息,并在这里找到了:
http://www.migrate2cloud.com/blog/hadoop-cluster-with-hadoop-0-20-and-ubuntu-10-04
您可以使用 /etc/init.d/hadoop* 脚本启动/停止