platform-lsf

for 循环的并行作业提交
platform-lsf

for 循环的并行作业提交

我编写了for循环并将其并行化并限制了一次&运行作业的阈值。3下面是我的脚本。我通过命令来保留32 cores和256 GB记忆BSUB。 I在循环sample_pipe内运行需要内核和内存。for32256 GB 我在某些工作中遇到内存故障错误。我认为我只保留32核心并256 GB尝试3一次运行作业,这可能会导致某些作业出现内存故障错误。 我的问题是如何并行化,以便所有3作业都使用相同数量的内核和内存。 我使用命令提交bsub < example.sh #!/bin/bash #BSUB -J cnt_job # LSF...

Admin

用于在 L 个脚本上批处理 N 个命令的工具(对于 N≫L)?
platform-lsf

用于在 L 个脚本上批处理 N 个命令的工具(对于 N≫L)?

假设我可以访问配备调度程序(例如 LSF、Slurm 等)的高性能 Linux 集群,这将允许我拥有最多中号作业在任意时刻要么正在运行,要么正在挂起,其中最多L < 中号可以同时运行。 现在,假设我想运行氮尽快独立发出命令。 如果氮 ≤ 中号,我可以将每个命令作为单独的作业提交给调度程序,然后完成。 但如果氮 > 中号?或者氮 ≫ 中号甚至? 这氮 ≫ 中号场景发生极其在我的工作中经常会这样,其实经常希望找到一个工具来方便处理它也不是没有道理的1...

Admin

什么是“平台LSF”?
platform-lsf

什么是“平台LSF”?

Every day, I encounter at least one Wikipedia article about something computer-related, which should logically make sense to me if I've spent my entire life growing up with and dealing with computers on a technical/deeper level, never playing any games or using them in a "consumer"...

Admin

Python脚本手动运行但不在cronjob中运行
platform-lsf

Python脚本手动运行但不在cronjob中运行

所以这是一个超级奇怪的问题。我有一个 python 脚本,它根据某些条件通过 subprocess.call 调用许多 bash 命令。现在,脚本手动运行得很好,但是当放入 cronjob 时它会失败,但只有当它到达代码的特定部分时才会失败。这部分代码对用户运行一个bstat和一个命令。bkill我尝试过对这两个命令使用 subprocess.call、subprocess.Popen、subprocess.check_output ,每次到达它们时,它都会挂起并且不执行任何操作。然后我在 var/spool/mail/root 中收到此消息 File "...

Admin

实时改变 bjob​​s 输出
platform-lsf

实时改变 bjob​​s 输出

当使用 LSF 命令时bjobs,如果我提交另一个作业,我希望立即更改输出,因为一次又一次运行相同的命令让我感到压力。我想要top刷新进程列表的输出之类的东西。 如果top不需要,它会一次又一次地自动刷新。 我想自动刷新bjobs命令的输出。 ...

Admin

在 bjob​​s 中获取墙时间限制
platform-lsf

在 bjob​​s 中获取墙时间限制

我正在编写一个收集工作信息的脚本。我想使用 bjob​​s 获取每个待处理作业的墙时间限制(如 bsub -W 指定)。我可以使用以下命令获取诸如 cpu 数量之类的信息: bjobs -u all -p -o 'jobid user min_req_proc' 但我找不到任何能让我花时间的关键词。有这样的方法吗?现在我必须为每个作业运行 bjob​​s -l 才能获取该信息,这非常慢。 ...

Admin

LSF队列是否允许抢占自身?
platform-lsf

LSF队列是否允许抢占自身?

我有一个 LSF 队列,假设它是队列 A。我只希望队列 A 中的较高优先级作业抢占队列 A 中的较低优先级作业,而不是任何其他队列中的作业。如果我将队列A设置为可抢占,是否可以将其设置为仅由其本身(队列A)可抢占?或者如果这是不允许的,那么什么可以实现我的目标? ...

Admin

用“|”管道(将上一个命令的输出传递到下一个命令)当使用“bsub”时
platform-lsf

用“|”管道(将上一个命令的输出传递到下一个命令)当使用“bsub”时

嗨,我想这是一个非常基本的问题: 使用“bsub”时是否有任何特定的语法来执行“管道”? 我这么问是因为当我遇到这样的问题时: # try to run the same command successfully ran in another host bsub fastx_trimmer -Q33 -f 1 -l 230 -i myfile.fastq | fastq_quality_trimmer -Q33 -t 18 -l 20 -o Trimmed_file.fastq & 但我遇到了一个错误: fastq_quality_tri...

Admin

脚本如何判断 Platform LSF 在环境中是否可用?
platform-lsf

脚本如何判断 Platform LSF 在环境中是否可用?

目前,我们有一些利用 Platform LSF 来管理作业执行的 shell 脚本。 这些脚本最终将迁移到使用不同作业调度程序的环境。 在迁移阶段,理想的情况是在两个环境中使用相同的脚本支持作业调度,因此如果它检测到 LSF 环境存在,则它使用 LSF 特定的指令,否则它使用与其他环境相关的命令。 我想到了一些可能的解决方案: 检查 LSF 特定的环境变量 例如$LSF_BINDIR, $LSF_LIBDIR,$LSF_SERVERDIR if [[ -n $LSF_BINDIR ]]; then # Yes LSF else # No...

Admin

lsf bkill 所有 PEND 作业而不终止 RUN 作业
platform-lsf

lsf bkill 所有 PEND 作业而不终止 RUN 作业

我有很多 bjob​​s 在 lsf 上运行,作业有两种状态:RUN 和 PEND。我想杀死所有处于 PEND 状态的 bjob​​s,如何使用脚本来做到这一点?我认为一种硬编码的方法是将它们保存在文件中,然后解析每一行以获取状态和密钥。如果 STAT 为 PEND,则将密钥传递给bkill $key。但这非常复杂,是否有任何 bkill 函数可以直接执行此操作或以非硬编码方式杀死具有特定状态或名称的作业? ...

Admin

LSF 作业的正确作业时间限制规范是多少
platform-lsf

LSF 作业的正确作业时间限制规范是多少

指定作业可以在用作LSF资源管理器/作业调度程序的计算机集群上运行多长时间的正确方法是什么? LSF 是一个作业调度程序,计算集群使用它来分配资源并决定用户提交的作业何时运行以及如何运行。基于IBM 的知识库,如果我需要5天,我可以做以下事情吗? busb -We 120:00 ...

Admin

将参数传递给脚本,然后将脚本重定向为 bsub 的输入
platform-lsf

将参数传递给脚本,然后将脚本重定向为 bsub 的输入

我目前正在使用 Platform LSF 的 bsub 作业提交系统。我需要提交作业脚本,但在向作业脚本传递参数时遇到问题。 我需要的内容如下:作业脚本是一个带有一个命令行参数的 bash 脚本。我需要将参数传递给该脚本,然后重定向该脚本以用作 bsub 的输入。问题是该参数没有应用于脚本。 我努力了:bsub < script.bsub 1 script.bsub 是我的脚本,1 是数字参数。这种方法行不通。 1 被视为 bsub 的参数。 另一种方法:bsub < "script.bsub 1" 这种方法使 bsub 将整个双引号行视...

Admin

在个人 ubuntu 电脑上运行 lsf 作业
platform-lsf

在个人 ubuntu 电脑上运行 lsf 作业

我有一些可能有点奇怪的问题,在我的 ubuntu 笔记本电脑上运行我的作业,而不是运行它们 HPC 集群。 我想要这样做的原因是现在我有 6 个核心 12 个线程。我曾经在我以前大学的 HPC 集群上运行我的工作。 我在做什么, 1)连接到hpc集群并转到执行文件所在的位置wave_func.out 将作业提交给 lsf 3)bsub -q linux22 -i ./w1.in -o ./w1.out ./wave_func.out 然后,如果“redhat7_211”中有可用线程,我的模拟就会开始。 我的问题是,如何在我的个人 ubuntu ...

Admin