强制使用 hadoop 进行 S3 连接

Question

为此，您需要使用 distcp 而不是 hadoop fs 命令，因为 hadoop fs 在您本地 HDFS 集群上工作，而 distcp 是在集群之间复制的方式（S3 si 被视为集群）。

为了使其工作，我将所有属性放在每个节点的 hdfs-site.xml 中（因为 distcp 分布在所有节点上），而不是命令行中。

因此，在每个节点上的 hdfs-site.xml 文件中添加以下属性：

<property>
  <name>fs.s3a.access.key</name>
  <value>your_access_key</value>
</property>
<property>
  <name>fs.s3a.secret.key</name>
  <value>your_secret_key</value>
</property>
<property>
  <name>fs.s3a.proxy.host</name>
  <value>your_proxy_host</value>
</property>
<property>
  <name>fs.s3a.proxy.port</name>
  <value>your_proxy_port</value>
</property>

Answer 1

为此，您需要使用 distcp 而不是 hadoop fs 命令，因为 hadoop fs 在您本地 HDFS 集群上工作，而 distcp 是在集群之间复制的方式（S3 si 被视为集群）。

为了使其工作，我将所有属性放在每个节点的 hdfs-site.xml 中（因为 distcp 分布在所有节点上），而不是命令行中。

因此，在每个节点上的 hdfs-site.xml 文件中添加以下属性：

<property>
  <name>fs.s3a.access.key</name>
  <value>your_access_key</value>
</property>
<property>
  <name>fs.s3a.secret.key</name>
  <value>your_secret_key</value>
</property>
<property>
  <name>fs.s3a.proxy.host</name>
  <value>your_proxy_host</value>
</property>
<property>
  <name>fs.s3a.proxy.port</name>
  <value>your_proxy_port</value>
</property>

强制使用 hadoop 进行 S3 连接

答案1

相关内容