使用 Torque+Maui 进行 Ubuntu 集群管理

使用 Torque+Maui 进行 Ubuntu 集群管理

我正在运行一个包含 8 台 PC 的小型 Ubuntu 集群。普通用户不应该能够访问单个 PC。他们只能通过 qsub 提交计算任务。

此外,普通用户应该有权访问集群上的存储。理想情况下,普通用户不应该看到他/她的文件在各个 PC 上的位置。他应该将集群视为一个单一的存储位置。并且他应该只能访问自己的文件。

此外,为特定用户运行的进程应该有权访问该用户的文件。

我怎样才能完成这一切?

目前,集群在 Ubuntu 上使用 Torque + Maui 运行。它有几个问题需要我修复。其中之一是,用户可以 SSH 到各个 PC 并在那里运行进程,这违反了队列。

我对 Linux 和集群还不熟悉,所以尽量给出一个尽可能入门的答案。此外,这些主题的实用教程链接也会很有帮助。

答案1

您可以明确禁止普通用户运行某些程序(但是,如果您禁止,他们仍然可以运行某些解释语言,例如makegcc

更好的方法是使用cgroups(在 2.6.29 中引入到 Linux 内核 - 您的内核应该支持它们)或一些轻量级虚拟化(lxc-containers)。

看:https://wiki.archlinux.org/index.php/cgroups

cgroups可以将用户限制为 1 个 CPU(甚至更少)和 50MB RAM,这将允许用户使用 ssh 访问但实际上不会运行昂贵的计算(如果用户超出限制,该进程将被终止)。

相关内容