torque

AMD 扭矩扳手坏了,主板上的 TR4 插槽坏了。有补救办法吗?
torque

AMD 扭矩扳手坏了,主板上的 TR4 插槽坏了。有补救办法吗?

在阅读了说明书并观看了包括 AMD 自己的视频演示后,我将新的 Threadripper CPU 安装到新的 ASRock X399 Tiachi 主板的 TR4 插槽中。不幸的是,CPU 附带的扭矩扳手坏了——这意味着它从未停止扭力。(当扳手达到标称扭矩时,应该会发出咔嗒声。)结果,插槽螺丝拧紧,直到插槽发出令人不快的刮擦声。当我拧下插槽并检查时,很明显有数百个针脚已经弯曲。 有没有人有过类似的经历,或者更相关的是,有什么建议可以让 AMD 解决扳手故障问题?从粗略检查来看,没有迹象表明 CPU 本身的任何垫片已损坏,因此我无法要求更换。 在没有追索权...

Admin

为什么 nodes=n:ppn=m 请求没有被 Torque/moab 正确遵守?
torque

为什么 nodes=n:ppn=m 请求没有被 Torque/moab 正确遵守?

在运行 Torque/Moab 调度程序的继承集群上,我发现nodes:ppn请求没有得到正确处理。ppn无论 的值如何,节点都是按照 的值分配的node。例如,nodes=8:ppn=16将仅分配 4 个节点(每个节点有 32 个 CPU 核心)。我正在寻找可能的配置设置来补救这种情况。 ...

Admin

TORQUE 中运行作业后无输出且出现错误文件
torque

TORQUE 中运行作业后无输出且出现错误文件

我在 Debian 9 上安装了 mpich-3.2.1、torque-5.1.0 和 maui-3.3.1。我有一个主节点和一个节点。我使用 NFS 文件系统进行共享,并且 ssh 无密码。当我与该用户是共享目录所有者的用户一起运行作业时,一切正常,并且我在该用户主目录中有 ERROR 和 OUTPUT 文件。但是当我与另一个用户一起运行作业时,我看不到其主目录中的 ERROR 和 OUTPUT 文件,以及状态统计是埃。 在哪里是错误和输出文件?! ...

Admin

pbs_server 启动失败
torque

pbs_server 启动失败

我正在关注扭矩安装指南并且有一个小偏差:我的安装在符号链接来自的/apps/torque/6.0.1地方。我试图运行,但得到以下信息:/apps/disk2/apps./torque.setup drjrm3 initializing TORQUE (admin: drjrm3@jarvis) You have selected to start pbs_server in create mode. If the server database exists it will be overwritten. do you wish to continue ...

Admin

如何以特定权限挂载 ext4 文件系统?
torque

如何以特定权限挂载 ext4 文件系统?

我希望/home这样挂载,以便任何用户都可以读取和写入他/她自己的目录,但只有特定的用户才具有执行权限。 我们有一个队列系统 (torque),我希望用户不能在其之外运行可执行文件。可以配置 Torque 以在特定用户下执行脚本。 ...

Admin

登录集群接口时使用 scp 发送文件
torque

登录集群接口时使用 scp 发送文件

我必须在 Torque 集群上做一些工作,我通过 ssh 登录用户界面。我将文件传输到集群的目录中,然后使用普通终端中的 scp 从目录中获取文件(使用“user@homecomputer:~$ scp...”)。 我想知道是否也可以从集群的用户界面(带有“[user@host]$”的界面)使用 scp 命令?我希望我可以解释我正在寻找的内容 - 我不是非常有经验的终端用户,尤其是技术术语用户。 ...

Admin

我们可以使用 Torque 4.2.0 来同时充当服务器和节点吗?
torque

我们可以使用 Torque 4.2.0 来同时充当服务器和节点吗?

我对扭矩还很陌生,想根据某些要求进行检查,但我没有集群设置。 那么,是否可以在单台机器上运行 Torque 4.2.0,其中多个核心既充当服务器又充当计算节点。如果可以,我需要进行哪些设置更改? ...

Admin

PBS/Torque:带有 PBS_VNODENUM 的非常简单的 pbsdsh 脚本
torque

PBS/Torque:带有 PBS_VNODENUM 的非常简单的 pbsdsh 脚本

我正在尝试向我的集群提交以下非常简单的脚本: #!/bin/sh #PBS -l nodes=3:ppn=8,walltime=00:01:00 #PBS -M [email protected] #PBS -j oe #PBS -m bae #PBS -N geophysics pbsdsh date pbsdsh echo $PBS_VNODENUM 输出如下: Wed Oct 24 12:52:08 IST 2012 Wed Oct 24 12:52:08 IST 2012 Wed Oct 24 12:52:08 IST 2012...

Admin

我如何遵循 qsub 的标准错误?
torque

我如何遵循 qsub 的标准错误?

我正在使用扭矩(qsub)运行一项作业。 我想遵循作业输出时的标准错误。 仅当作业完成后才会写入正常输出文件(和stdout) 。stderr 有没有办法做类似的事情 tail -f /dev/stderr stderr已提交的作业有哪些? ...

Admin

作业无法在 Torque 下运行,安装 Maui 也无济于事
torque

作业无法在 Torque 下运行,安装 Maui 也无济于事

因此,我刚刚在我们正在设置的小型集群上安装了 Torque,一切似乎都进展顺利。我pbs_mon在计算节点上运行,在头节点上运行 pbs_server,pbsnodes -a从头节点显示所有节点都处于“空闲”状态。 但是,当我echo 'sleep 30'使用命令提交一个简单的作业(甚至是作业)时qsub,这些作业只是停留在队列中,永远不会执行。我有四个计算节点,正在请求 4 个节点(未指定的内存/时间/ppn)。 我认为也许我需要安装 Maui 才能使作业调度正常工作,但事后看来,Torque 应该能够自行调度和执行作业,不是吗?无论如何,我在头节点上...

Admin

集群中的扭矩
torque

集群中的扭矩

我正在学习并且对使用 PBS 在集群中提交作业有一些疑问。 (1) 如果一个作业通过 MPI 并行化并通过 mpirun 运行而不使用 qsub,它可以在不同的节点上运行。那么使用 qsub 有什么意义呢? qsub 未提交的作业是否已排队? (2)在qsub提交的pbs脚本中,所有命令都是依次执行的吗? 如果我想同时运行多个可执行文件,是否可以通过在末尾添加“&”来使这些调用变为后台调用? (3) 在 pbs 脚本中,如果运行可执行文件的几个调用通过后台运行同时运行,那么指定的节点数和每个节...

Admin

配置集群
torque

配置集群

我们的集群是一个带有 Torque 和 Maui 的 Linux 集群。我在网上阅读教程,发现编译只在头节点上进行,通过 qsub 提交作业后,其他节点正在运行在头节点上编译的可执行文件。所以我的问题就出在这里。 一个集群有一个头节点和多个计算节点,这样对吗?用户登录并通过调度程序在头节点提交作业,这些作业是在计算节点上运行的,而不是在头节点上运行? 程序可以在头节点上编译并在其他计算节点上运行吗?如果可以,是否意味着所有计算节点和头节点必须具有相同的配置和操作系统,因此在头节点上编译的程序可以在其他节点上运行,而无需在每个其他节点上重新编译? ...

Admin

如何让 Torque 在 Ubuntu 14.04 上运行?
torque

如何让 Torque 在 Ubuntu 14.04 上运行?

我有一台配备多核处理器的 PC,我正在尝试在 Ubuntu 14.04 上使用 Torque。我已通过 Synaptic 安装了torque-mom、torque-server和。torque-clienttorque-scheduler 我无法让它工作。我已经更改了服务器名称甚至 IP。我找不到可以正确应用的具体说明。官方 Torque 应用程序尚未准备好与 Ubuntu 配合使用。我真的厌倦了处理这个问题。什么能让它工作? ...

Admin

扭矩:未经授权的请求
torque

扭矩:未经授权的请求

遵循本指南: https://jabriffa.wordpress.com/2015/02/11/installing-torquepbs-job-scheduler-on-ubuntu-14-04-lts/ 我在 Ubuntu 16-04-lts 上安装了 TORQUE(他声称该过程在 16.04 上也一样) 以下是安装说明的简短摘要,以便能够自给自足: apt-get install torque-server torque-client torque-mom torque-pam /etc/init.d/torque-mom stop /etc...

Admin

如何为 Ubuntu 12.04 创建双节点集群?
torque

如何为 Ubuntu 12.04 创建双节点集群?

我有两台运行 Ubuntu 12.04 桌面版的 PC,通过 1 千兆以太网交换机连接。我想创建一个 2 节点集群并配置 Torque 以在两个节点上提交和调度作业。 请注意,我对跨节点运行 MPI 类型的作业不感兴趣。我的计算将一次在一个节点上运行,但我不想等待并在作业完成后手动提交新作业,而是想使用 qsub 提交多个作业并将它们排队,直到释放节点。 我想我的问题可以分为两部分 a) 对于我上面描述的系统,最佳的集群设置是什么? b) 设置集群后如何设置 Torque。请注意,我已经在每台机器上安装了 Torque。 提前致谢 ...

Admin