在 ec2 和 HADOOP_HOME 变量上运行 Hadoop?

在 ec2 和 HADOOP_HOME 变量上运行 Hadoop?

我正在关注Hadoop 实际应用开始使用带有 ec2 的 Hadoop。我在 ubuntu 上运行,并下载并安装了最新版本的 Hadoop。我在执行以下命令时遇到了障碍:

hadoop-ec2 launch-cluster mycluster 2

书中说“Hadoop EC2 工具位于 Hadoop 安装下的 src/contrib/ec2/bin 目录中。回想一下,我们的 ec2-init.sh 脚本已将该目录添加到您的系统 PATH。该目录中是 hadoop-ec2,它是用于执行其他命令的元命令。要在 ec2 上启动 Hadoop 集群,请使用:

hadoop-ec2 launch-cluster <集群名称> <从属数量>


我得到的答复是:hadoop-ec2: command not found

我注意到该变量$HADOOP_HOME尚未设置。

这本书看上去已经过时了。

  1. 有人可以给我提供最近几个月创建的关于如何使用 ec2 设置 Hadoop 的教程吗?
  2. 经过一番快速谷歌搜索,似乎HADOOP_HOME已被弃用。这是真的吗?
  3. 我可以毫无问题地执行ec2-describe-images. 并获取所有可用的图像。为什么hadoop-ec2命令不起作用?

谢谢您的指导。

我知道hadoop/bin 应该存在,当我这样做时:

sudo find / -wholename '*hadoop/bin*'

我什么也没找到。

答案1

为什么不尝试一下亚马逊电子病历或者丰盛让集群自动启动并运行?您也可以尝试使用 Cloudera Manager、Whirr 或 Ambari 在 EC2 上配置 Hadoop 集群

相关内容