如何为hadoop集群指定硬盘?

如何为hadoop集群指定硬盘?

我在一台 Azure VM 上安装了 Hadoop,它使用其 OS 磁盘运行良好。但是,我将一个硬盘连接到我的 VM,我想知道如何配置 Hadoop 以仅使用这个新硬盘作为其默认存储磁盘。有人能告诉我如何更改配置吗?

任何帮助都将不胜感激。谢谢。

答案1

具体来说,Datanode 需要具有dfs.datanode.数据.目录配置属性,设置允许写入数据的每个挂载点或目录的路径。此属性是一组以逗号分隔的值。

例如:

<property>
  <name>dfs.datanode.data.dir</name>
  <value>/hdfs/01/hdfs,/hdfs/02/hdfs,/hdfs/03/hdfs</value>
</property>

这定义了Datanode可以将块写入的三个不同目录。

答案2

问题解决了。我必须编辑 hdfs-site.xml。谢谢大家。

相关内容