如何配置在 Docker 容器中运行的 Spark 客户端以便与远程 Spark 集群进行双向通信？

Question

您可以使用网络模式运行 docker 容器host。在您的 compose 文件中添加以下配置：

services:
  worker0:
    container_name: container0
    cpuset: 0-4
    entrypoint: /entrypoint.sh
    environment:
        - SPARK_MASTER=10.34.221.247
        - RAM=16g
        - NUM_WORKERS=5
        - SHUFFLE_PORT=7338
    expose:
        - 7000-64000
    image: 10.47.7.214/spark-worker
    mem_limit: 16g
    network_mode: bridge
    tty: true

不过，我仍然面临此配置的问题。作业正常启动，但最终 docker 驱动程序无法连接到执行程序。您至少可以尝试一下。

Answer 1

您可以使用网络模式运行 docker 容器host。在您的 compose 文件中添加以下配置：

services:
  worker0:
    container_name: container0
    cpuset: 0-4
    entrypoint: /entrypoint.sh
    environment:
        - SPARK_MASTER=10.34.221.247
        - RAM=16g
        - NUM_WORKERS=5
        - SHUFFLE_PORT=7338
    expose:
        - 7000-64000
    image: 10.47.7.214/spark-worker
    mem_limit: 16g
    network_mode: bridge
    tty: true

不过，我仍然面临此配置的问题。作业正常启动，但最终 docker 驱动程序无法连接到执行程序。您至少可以尝试一下。

如何配置在 Docker 容器中运行的 Spark 客户端以便与远程 Spark 集群进行双向通信？

答案1

相关内容