pbs

为什么 qdel 命令返回“未知作业 ID”
pbs

为什么 qdel 命令返回“未知作业 ID”

操作系统版本: CentOS 版本 4.6(最终版)内核 \r 位于 \m 2.6.9-100.ELsmp 上 问题 当我运行 qdel 时出现以下错误: qdel: Unknown Job Id 20432.scyld.localdomain 信息 qstat -n 的输出: head0.localdomain:Req'd Req'd Elap 作业 ID 用户名 队列 作业名称 SessID NDS TSK 内存 时间 S 时间 20432.head0.localdom 用户名 标准 pc-iw-1 327...

Admin

当我尝试通过 PBS 提交作业时,我收到错误 qsub: Bad UID for job performing
pbs

当我尝试通过 PBS 提交作业时,我收到错误 qsub: Bad UID for job performing

操作系统版本:CentOS 版本 4.6(最终版)内核 \r 位于 \m 2.6.9-100.ELsmp 上 当我尝试运行一项作业时,它给出了如下错误。 qsub: Bad UID for job execution 我创建了一个新的用户帐户,并且出现了同样的错误,但同一台机器上的其他用户可以毫无问题地运行作业。 我该如何修复此问题? ...

Admin

如何在 SLURM 集群上设置仅交互式作业或仅批处理作业的分区?
pbs

如何在 SLURM 集群上设置仅交互式作业或仅批处理作业的分区?

我正在管理一个 PBS/torque HPC 集群,现在我正在设置另一个集群斯拉普在 PBS 集群上,我可以设置一个队列,使其只接受交互式作业,qmgr -c "set queue interactive_q disallowed_types = batch"并使其只接受批处理作业qmgr -c "set queue cu disallowed_types = interactive"。 但是,浏览 SLURM 官方文档后,我没有找到与 SLURM 等效的设置。 如何在 SLURM 集群上设置分区以仅接受交互式或批处理作业? ...

Admin

如何使用混合 MPI/Openmp 启动 PBS 作业
pbs

如何使用混合 MPI/Openmp 启动 PBS 作业

我想了解使用混合并行化 MPI/OpenMPI 的 PBS/Torque 在我的 SGI 集群上启动的 GROMACS 作业的工作原理。 该集群启用了超线程,每个节点有 16 个物理核心(32 个逻辑核心)。 我期望:使用 4 个节点和每个节点的所有可用 CPU(因此每个节点有 16 个物理 CPU 和 32 个线程,如果我没记错的话,总共有 64 个核心和 128 个线程)。 我做了一个测试工作,应该能满足我的期望。这些是我在 PBS 脚本中用于询问资源的行: ... #PBS -l select=4:ncpus=16:mpiprocs=16...

Admin

PBS/Torque 优先级与 MPI 程序优先级
pbs

PBS/Torque 优先级与 MPI 程序优先级

我们有一个执行不同任务的集群。它使用 Torque 调度程序计算模拟。我们还有一个交互式模拟,它也需要全部计算能力。交互式模拟是一个 OpenMPI 程序,在每个节点上启动进程。 因此,我们希望实现以下目标:如果启动了交互式模拟,则所有 pbs 作业都应转移到后台,从而释放交互式模拟的工作负载。 使用这两种不同的并行化方案是否可能实现这一点? 我尝试了以下操作:我在 /etc/security/limits.conf 中附加了一行,为扭矩队列的用户分配了较低的优先级 user hard priority 10 对于每个节点上的每...

Admin

仅当从 PBS 文件执行应用程序时才找不到库。
pbs

仅当从 PBS 文件执行应用程序时才找不到库。

我有一个编译好的文件 a.out,直接从我的终端执行时运行良好。但是,尝试从我的 PBS 文件执行该文件时会出现缺少库的情况libmkl_intel_lp64.so。我已经尝试过 将库的路径导出到 LD_LIBARY_PATH 用于source a.out intel64链接我的 PBS 文件中的可执行文件 有什么建议么? ...

Admin

提交给 Torque 的作业未生成错误/日志文件
pbs

提交给 Torque 的作业未生成错误/日志文件

如上所述,我刚刚在 Ubuntu 16.04 机器上安装了 Torque。提交的作业完成得很好,但-e和-o标志似乎不起作用。没有创建错误和日志文件,尽管我有 给标志一个日志目录的绝对路径。 提交作业之前在目录中创建日志文件。 我确信 PBS 文件可以正常工作,因为我是从一台可以正常运行该作业的机器上复制来的。 以下是提到的 PBS 文件。对于我无法缩进代码块,我提前表示歉意。 #! /bin/bash #PBS -e /path/to/error.err #PBS -o /path/to/log.log #PBS -l nodes=1:pp...

Admin

如何在 Torque PBS 中设置 bash 环境?为什么 source ~/.bashrc 不起作用?
pbs

如何在 Torque PBS 中设置 bash 环境?为什么 source ~/.bashrc 不起作用?

我已经成功在我的 ubuntu 服务器上安装了 Torque PBS。作业提交正常。然而有一件烦人的事情。我发现 PBS 中的 bash 环境不正确 例如 echo 'echo $PATH > ~/res.txt' | qsub res.txt 的内容是 /home/admin-pc/bin:/home/admin-pc/.local/bin:/bin:/usr/bin:/snap/bin 这绝对不是我的路径。 所以我尝试了 echo 'source ~/.bashrc;echo $PATH > ~/res.txt' | qsu...

Admin

PBS 扭矩限制资源(按时间)
pbs

PBS 扭矩限制资源(按时间)

我使用 Torque 来管理我拥有有限数量许可证(确切地说是 4 个)的软件。白天我需要保留 2 个许可证用于处理案件,晚上和周末我可以使用所有 4 个许可证来解决案件。有没有办法设置 Torque,使其在周一至周五早上 6 点到下午 6 点保留 2 个许可证,但在其他时间仍然使用所有 4 个许可证? ...

Admin

Torque PBS 队列系统以反向方式运行队列
pbs

Torque PBS 队列系统以反向方式运行队列

我在 Redhat 7.1 上设置了一个小型计算集群。它运行 PBS 扭矩队列系统,版本为 5.1.1。 当我将多个作业排队时,它开始以“向后”优先级运行这些作业。它从最后提交的作业开始。 是否有任何设置可以改变这种行为,以便首先提交的作业首先启动? ...

Admin

扭矩队列问题
pbs

扭矩队列问题

我在使用 Torque + Maui 时遇到了麻烦。 问题如下:我有 2 个队列,每个队列有 10 个关联节点。如果我向第一个队列提交 10k 个作业,向第二个队列提交 1 个作业,则第二个队列中的作业仍处于 Q 状态。 [root@localhost bin]# ./showstart 366808 job 366808 requires 2 procs for 1:00:50 Earliest start in         00:00:00 on Fri Dec 18 16:27:21 Earliest c...

Admin

我们如何为工作站配置具有多个节点的扭矩?
pbs

我们如何为工作站配置具有多个节点的扭矩?

我有一台配备 48 核 CPU + 4 个 NVIDIA GPU 的 GPU 工作站。我将把这台机器变成一个小型集群,其中包含: 4 个节点 12 核 +1 CPU/节点 我已经使用以下命令在这台机器上安装了 Torque: ./configure --without-tcl --enable-nvidia-gpus --prefix=/soft/torque-5.1.1 --with-nvml-include=/usr/local/cuda/gpukit/usr/include/nvidia/gdk -...

Admin

PBS,正在添加作业 - 作业已添加,但似乎根本没有运行
pbs

PBS,正在添加作业 - 作业已添加,但似乎根本没有运行

首先,我对集群和 PBS 系统非常陌生。我被要求准备一个简单的脚本(我照做了): #PBS -S /bin/bash #PBS -o host_out #PBS -e host_err #PBS -q batch hostname date exit 0 然后,我使其可执行并使用以下命令提交: qsub job.sh 并获取了它的 ID(所以看起来作业已正确提交,对吗?)但我看不到任何答案,我的意思是,甚至文件都host_out没有host_err创建。可能出了什么问题?我还需要做什么才能提交作业? ...

Admin

防止普通用户在 PBS 系统之外的集群上运行代码
pbs

防止普通用户在 PBS 系统之外的集群上运行代码

在我们的集群中安装了 PBS 批处理系统(torque),我们希望所有用户都通过 qsub 执行他们的作业,以便可以很好地管理 CPU 资源。但是,我们发现集群中的用户仍然可以直接在他们的 bash shell 中运行他们的程序。 我注意到其他一些集群系统限制用户运行自己的二进制文件。他们的命令提示符与完全特权的命令提示符不同。(从~>开始) qczhan2@barrine1:~>echo $0 -bash 在他们的配置中,用户可以运行基本命令,例如 ls、pwd、cp 和 cd,但是当我们运行自己的二进制文件时,系统会提醒“权限不允许”...

Admin