我正在看这个例子阿帕奇火花文档。它似乎将一个名为 local[4] 的变量传递到 --master 变量中。我以前没见过。这是什么意思?我在 OS X 上使用 bash。有“本地”数组吗?它是一个 Maven 构造吗?
# Package a jar containing your application
$ mvn package
...
[INFO] Building jar: {..}/{..}/target/simple-project-1.0.jar
# Use spark-submit to run your application
$ YOUR_SPARK_HOME/bin/spark-submit \
--class "SimpleApp" \
--master local[4] \
target/simple-project-1.0.jar
...
Lines with a: 46, Lines with b: 23
答案1
这是 Spark 问题,而不是 bash 或 Maven 问题。对于 Spark,主名称可以采用以下形式:
local[K]:使用 K 个工作线程在本地运行 Spark(应设置为计算机上的核心数)。
查看https://github.com/mesos/spark/wiki/Spark-Programming-Guide#master-names了解更多信息。