在扭矩作业中运行 TensorFlow 代码

在扭矩作业中运行 TensorFlow 代码

我有一个使用 Torque 运行的集群,用于分配作业。我想使用 TensorFlow 代码运行作业,但遇到了 TensorFlow 无法识别的问题。

我使用 anaconda 在我的 LDAP 用户上安装了 tensorflow,因此我可以在任何节点中进入 tensorflow 环境并手动运行我的代码。我的问题是 Torque 作业在运行时不会打开环境,因此我收到“ImportError:没有名为 tensorflow 的模块”,并且我的代码无法运行。

我如何告诉节点在 tensorflow 环境中运行我的 python 文件?

这是我的扭矩作业文件的样子

注意:在这里我尝试运行打开环境的命令,在其他版本中我没有。

在此先感谢任何可以提供的帮助。

答案1

抱歉,我忘了在得到答案后回复。如果将来有人看到这个问题,解决我的问题的方法是将 PATH 变量导出到 anaconda bin 文件夹(在那里它可以找到 anaconda 使用的 python 二进制文件并可以访问 tensorflow):

export PATH="<path_to_anaconda_folder>/anaconda3/bin:$PATH"

感谢 Tux_DEV_NULL 的帮助!

另外,为了避免将来出现任何 cuda 问题(我正在使用 gpu),我实际上不知道是否有必要,但也许最终会对某人有所帮助..:

export PATH=$PATH:/usr/local/cuda-8.0/bin

相关内容