portable-batch-system

有没有办法检查用户队列中有多少个作业?
portable-batch-system

有没有办法检查用户队列中有多少个作业?

我知道命令,例如 qsub、qstat -a、qstat -an 等。 但是,如何才能在任何给定时间内找到单个用户在队列中有多少个作业(不一定所有作业都在运行)? ...

Admin

使 SGE 作业输出标准输出到源终端
portable-batch-system

使 SGE 作业输出标准输出到源终端

我想将单个作业提交给 Sun Grid Engine,并使它们看起来像是在本地执行。而不是创建 stdout 和 stderr 文件以将它们输出到调用终端 stdout 和 stderr。 根据这一页 -k oe将保持标准输出或标准错误流将保留在执行主机上。 但是当我尝试这个命令时: qsub -cwd -sync yes -k oe -N "test" -V "helloworld.sh" 我得到: qsub: ERROR! invalid option argument "-k" 工具版本: which qsub=>... sge...

Admin

特定进程使用了​​多少内存
portable-batch-system

特定进程使用了​​多少内存

我正在使用 qsub 在集群 (SGE) 上提交作业。我想知道的是,当我提交 qsub 作业时,以及在它完成后,我想知道它实际使用了多少内存,以便下次我为其提供所需的内存以防万一。 我的工作完成后,我使用此命令来检查我提交的作业的内存需求 qacct -j job-ID 但我得到了这个输出 /opt/gridengine/default/common/accounting:没有此文件或目录自启动以来没有运行任何作业 任何帮助都将不胜感激。 提前致谢 ...

Admin

提交给 qsub 时如何在 SGE 中保存作业信息 (qstat)?
portable-batch-system

提交给 qsub 时如何在 SGE 中保存作业信息 (qstat)?

提交作业时,我可以提供qsub标准输出和标准错误的路径。 另一方面,当我的作业 12345 正在运行时,我可以使用 访问与其相关的额外信息qstat -j 12345。 我的问题是,是否有办法设置路径来qsub自动将提供的相同类型的信息记录qstat到文件中? ...

Admin

如何让 Emacs 中的 shell-script-mode 将 #PBS -S /bin/bash 解释为 bash shell 代码?
portable-batch-system

如何让 Emacs 中的 shell-script-mode 将 #PBS -S /bin/bash 解释为 bash shell 代码?

我在 LINUX 系统上使用 Emacs,该系统使用便携式批处理系统 (PBS) 来控制资源的使用。PBS 脚本需要“#PBS -S /bin/...”作为脚本的第一行,以向 PBS 声明脚本的 shell。当我将脚本加载到 Emacs 中时,没有 #!/bin/... 来提醒 Emacs 正在编写哪个 shell。那么,我如何才能让 Emacs 中的 shell-script-mode 将 #PBS -S /bin/bash 解释为 bash shell 代码? ...

Admin

如何知道正在执行的脚本中的 PBS 批处理作业提交时间?
portable-batch-system

如何知道正在执行的脚本中的 PBS 批处理作业提交时间?

我正在使用 PBS qsub 在集群上运行脚本,该脚本必须输出以批处理作业提交时间命名的报告文件。 批处理作业提交时间是其加入 PBS 批处理作业队列的时间。 我检查了所有 PBS 默认变量,但没有发现任何与作业提交时间相关的内容。 我想知道如何在不创建新输入变量的情况下获取这个时间。 谢谢。 ...

Admin

qsub -hold_jid -afterok 循环未启动
portable-batch-system

qsub -hold_jid -afterok 循环未启动

我正在尝试通过提供以下.sh 脚本来依次运行提交给集群的一系列作业: 注释循环.sh: #!/bin/bash job=`qsub run_IntersectBed_1.sh 0` for i in {1..3} do job_next=`qsub -hold_jid $job run_IntersectBed_1.sh $i` job=$job_next done 第一个作业(进入循环之前)被执行,但是下一个作业从未启动。 我认为该脚本写得很好。我将模式更改为可执行文件并运行它 nohup ./Annotation_Loop....

Admin

PBS/Torque:带有 PBS_VNODENUM 的非常简单的 pbsdsh 脚本
portable-batch-system

PBS/Torque:带有 PBS_VNODENUM 的非常简单的 pbsdsh 脚本

我正在尝试向我的集群提交以下非常简单的脚本: #!/bin/sh #PBS -l nodes=3:ppn=8,walltime=00:01:00 #PBS -M [email protected] #PBS -j oe #PBS -m bae #PBS -N geophysics pbsdsh date pbsdsh echo $PBS_VNODENUM 输出如下: Wed Oct 24 12:52:08 IST 2012 Wed Oct 24 12:52:08 IST 2012 Wed Oct 24 12:52:08 IST 2012...

Admin

PBS 批处理作业 - qalter 命令
portable-batch-system

PBS 批处理作业 - qalter 命令

我在 Scientific Linux 集群上运行了一项大型计算。目前,我有超过 600 个作业处于队列中,等待处理器时间,而一些作业正在运行。 我正在尝试使用卡尔特命令处理一些空闲但已安排好的作业。我想将它们安排到稍后的时间,以便其他用户可以跳过部分队列,这有点像礼貌行为。这可行吗? 例如,JOBNAME292399当前处于空闲状态,计划在队列中有空位时运行。 但如果我跑步qalter -a 10051000 292398然后接着跑,qrerun 292398我就会得到qrerun: Request invalid for state of jo...

Admin

我如何遵循 qsub 的标准错误?
portable-batch-system

我如何遵循 qsub 的标准错误?

我正在使用扭矩(qsub)运行一项作业。 我想遵循作业输出时的标准错误。 仅当作业完成后才会写入正常输出文件(和stdout) 。stderr 有没有办法做类似的事情 tail -f /dev/stderr stderr已提交的作业有哪些? ...

Admin

安装 Grid Engine“无法访问 qmaster”
portable-batch-system

安装 Grid Engine“无法访问 qmaster”

我想在我的笔记本电脑上安装 Grid Engine。 我在 VirtualBox 4.1.6 下使用 Ubuntu 11.10。 (安装 Grid Engine 的目的不是为了计算任何东西,我只是想要一个可以工作的 Grid Engine 环境,以便能够尝试使用 bash 脚本进行数组作业等。我运行的作业只会“睡眠”,因此集群只包含一个节点。我的笔记本电脑有双核 CPU,但我不知道这是否与此相关。) 我正在遵循http://astoryworthtelling.wordpress.com/2009/08/25/installing-sge-on-ubu...

Admin

libXtst.so.6:无法打开共享对象文件:没有此文件或目录
portable-batch-system

libXtst.so.6:无法打开共享对象文件:没有此文件或目录

更新:经过多次 qsub 后,我注意到当主机名为 opt### 时,它似乎可以工作,但对于主机名为不同拓扑 int### 的其他节点,它却不行。我与集群管理员讨论过这个问题,他说“不知何故,该库仅安装在 opt* 节点上,而没有安装在其他节点上。这不应该发生(所有节点上的安装都设计为相同)。现在已修复。”它现在工作正常,无需设置环境 PATH 或 LD_LIBRARY_PATH。 我编写了一个 CSH 脚本,用于运行名为 fiji-linux64 的 Java 应用程序。我已在专用于编译代码的集群节点中成功执行了 CSH 脚本,但当将同一脚本作为作业 (q...

Admin

作业无法在 Torque 下运行,安装 Maui 也无济于事
portable-batch-system

作业无法在 Torque 下运行,安装 Maui 也无济于事

因此,我刚刚在我们正在设置的小型集群上安装了 Torque,一切似乎都进展顺利。我pbs_mon在计算节点上运行,在头节点上运行 pbs_server,pbsnodes -a从头节点显示所有节点都处于“空闲”状态。 但是,当我echo 'sleep 30'使用命令提交一个简单的作业(甚至是作业)时qsub,这些作业只是停留在队列中,永远不会执行。我有四个计算节点,正在请求 4 个节点(未指定的内存/时间/ppn)。 我认为也许我需要安装 Maui 才能使作业调度正常工作,但事后看来,Torque 应该能够自行调度和执行作业,不是吗?无论如何,我在头节点上...

Admin

集群中的扭矩
portable-batch-system

集群中的扭矩

我正在学习并且对使用 PBS 在集群中提交作业有一些疑问。 (1) 如果一个作业通过 MPI 并行化并通过 mpirun 运行而不使用 qsub,它可以在不同的节点上运行。那么使用 qsub 有什么意义呢? qsub 未提交的作业是否已排队? (2)在qsub提交的pbs脚本中,所有命令都是依次执行的吗? 如果我想同时运行多个可执行文件,是否可以通过在末尾添加“&”来使这些调用变为后台调用? (3) 在 pbs 脚本中,如果运行可执行文件的几个调用通过后台运行同时运行,那么指定的节点数和每个节...

Admin

配置集群
portable-batch-system

配置集群

我们的集群是一个带有 Torque 和 Maui 的 Linux 集群。我在网上阅读教程,发现编译只在头节点上进行,通过 qsub 提交作业后,其他节点正在运行在头节点上编译的可执行文件。所以我的问题就出在这里。 一个集群有一个头节点和多个计算节点,这样对吗?用户登录并通过调度程序在头节点提交作业,这些作业是在计算节点上运行的,而不是在头节点上运行? 程序可以在头节点上编译并在其他计算节点上运行吗?如果可以,是否意味着所有计算节点和头节点必须具有相同的配置和操作系统,因此在头节点上编译的程序可以在其他节点上运行,而无需在每个其他节点上重新编译? ...

Admin