graphics-processing-unit

我应该关闭处于空闲状态的 GPU 混合服务器吗?
graphics-processing-unit

我应该关闭处于空闲状态的 GPU 混合服务器吗?

有一台服务器,配备 2 个 CPU(Intel Xeon E5-2670,Sandy Bridge)和 1 个 AMD GPU(Tahiti XT Radeon HD 7970)。还有 SSD(系统和可执行文件)和 HDD(重数据)连接到此服务器。 有时服务器会在高负载下工作几个小时。有时服务器会闲置几个小时(闲置时间可能超过 8 小时)。 我听到过两种相反的观点: 我不应该关闭我的服务器,因为服务器的设计就是不关机也能运行。成千上万台服务器不关机,可以连续运行一个月。 如果服务器没有负载,则应将其关闭。特别是因为 GPU。GPU 和 GPU 冷却器...

Admin

AWS 如何进行 GPU 虚拟化?
graphics-processing-unit

AWS 如何进行 GPU 虚拟化?

亚马逊使用什么样的技术进行 GPU 虚拟化?AWS GPU 实例上的多个虚拟机是否可以同时共享 GPU 并为其 CUDA / openCL 程序加速?我知道以下是 GPU 虚拟化的可能方法: 1) API 远程处理:虚拟机模拟 GPU,主机上的 GPU 以 RPC 方式从虚拟机调用。这可以是基于共享内存或基于网络的远程处理。 2) 实际的 GPU 虚拟化,其中多个 VM 可以同时共享一个 GPU。但据我所知,Xen(AWS 使用)不支持此功能。 我要做一个项目,需要在内部私有云中共享组织的 GPU。我需要...

Admin

CUDA:当进程在 GPU 上运行时,是否可以动态限制核心/线程/时钟频率的数量?
graphics-processing-unit

CUDA:当进程在 GPU 上运行时,是否可以动态限制核心/线程/时钟频率的数量?

我在 Ubuntu 10.04 下运行多个 NVidia GTX 680,环境非常热(机架冷却有问题),有时温度会超过 95C。当我检测到过热时,我能否以某种方式告诉驱动程序减少使用的资源,例如 线程数 核心数 GPU时钟频率 内存时钟频率 ..? 动态地,无需重新启动进程,以便 GPU 可以稍微冷却下来?也许有类似的东西nvidia-smi可以nvidia-settings让我这样做?唯一的问题是:我需要在外部执行此操作,而无需修改实际代码。 该过程运行数天并执行一些科学计算而没有任何图形输出,因此如果矩阵乘法在一段时间内减慢速度就没问题。 ...

Admin

我可以安全地使用带有主动冷却的 Nvidia GTX 680 显卡的 1U 服务器吗?
graphics-processing-unit

我可以安全地使用带有主动冷却的 Nvidia GTX 680 显卡的 1U 服务器吗?

我即将根据我们的需求配置一些新的支持 GPU 的节点,我想知道是否有人有使用简单显卡的经验,比如Nvidia GTX 680(主动用风扇冷却)在 1U 服务器中?风扇会非常靠近底盘(例如超微 SC818G-1400B),我不确定它是否会得到足够的冷空气。在通常的 ATX 机箱中,显卡温度最高可达 80°C,远低于 98°C 的上限。 是否有人尝试过在 1U 服务器中使用主动冷却视频卡的类似配置并推荐它? 谢谢! ...

Admin

nvidia-smi 和 lspci 输出解释 | grep -i nvidia
graphics-processing-unit

nvidia-smi 和 lspci 输出解释 | grep -i nvidia

我对 GPU 服务器非常陌生。我提交了一个 slurm 作业,然后检查了“nvidia-smi”。我得到了以下输出。 这张照片 然后,我运行“lspci | grep -i nvidia”,得到了这个输出。 01:00.0 VGA compatible controller: NVIDIA Corporation GA102GL [RTX A5000] (rev a1) 01:00.1 Audio device: NVIDIA Corporation GA102 High Definition Audio Controller (rev a1) 25:00....

Admin

GKE 无法在新添加的具有 GPU 的节点上安排需要 GPU 的新创建的 Pod
graphics-processing-unit

GKE 无法在新添加的具有 GPU 的节点上安排需要 GPU 的新创建的 Pod

当添加带有 GPU 的新池节点时,Google Kubernetes Engine 无法安排在这些新节点上需要 GPU 的新创建的 pod,我猜应该是自动的但不适用于 GPU 资源,新 pod 永远处于“待处理”状态,如何解决这个问题? 编辑:这是部署 yaml 文件,我的目的不是将部署绑定到特定节点: --- apiVersion: machinelearning.seldon.io/v1alpha2 kind: SldDeployment metadata: labels: app: sld ...

Admin

显卡是否影响服务器性能
graphics-processing-unit

显卡是否影响服务器性能

我想知道显卡是否真的能提高服务器的性能,或者专用的 CPU 已经足以完成这项工作。如果需要显卡容量,需要多少个? 如果用于 Nas 或用于 Webhosting 或专用软件目的 ...

Admin

使用 GUI 桌面环境运行 Ubuntu 服务器 | Dell PowerEdge R710 II
graphics-processing-unit

使用 GUI 桌面环境运行 Ubuntu 服务器 | Dell PowerEdge R710 II

首先我要说的是,我对使用/运行服务器完全陌生,目前是爱尔兰都柏林城市大学 (DCU) 计算机科学与商业专业的二年级学生。 我最近使用 Python 和 AutoIT 脚本开发了一个程序,用于在工作中自动开具销售发票,它运行得很好,但我想在此基础上进行改进,并在接下来的几个月内为其添加更多功能。我需要我的服务器运行 SQL 服务器、文件服务器、连续运行一些 Python 脚本以及通常我需要做的任何有助于开发这个程序的事情。我选择了一台戴尔 PowerEdge R710,配有 2 个四核 Xeon CPU(2.9ghz)和 16gb 内存。我还在其中安装了 P...

Admin

适用于 Dell PowerEdge r710 的兼容 AMD GPU
graphics-processing-unit

适用于 Dell PowerEdge r710 的兼容 AMD GPU

在服务器虚拟化和 GPU 方面,我完全是个新手,所以请耐心听我说完。 有没有与 Dell PowerEdge r710 轻松兼容的优质 AMD GPU?我正在寻找便宜的显卡,可以用于具有图形环境的虚拟机(目前只有 1 个 VM)。我的服务器配置了冗余的 870w PSU,所以我不担心电源问题。 除此之外,我想知道 r710 是否支持多个 GPU(AMD 或 Nvidia),因为我希望将来有 2 个或更多,但我更喜欢 AMD,因为他们有更好的免费/开源 Linux 驱动程序。 我最后担心的是能否访问虚拟机上...

Admin

Google Kubernetes Engine 节点池不会从 0 个节点自动扩缩
graphics-processing-unit

Google Kubernetes Engine 节点池不会从 0 个节点自动扩缩

我正在尝试在 GKE 上运行机器学习作业,需要使用 GPU。 我用 Tesla K80 创建了一个节点池,如下所述本演练。 我将最小节点大小设置为 0,并希望自动缩放器能够根据我的作业自动确定我需要多少个节点: gcloud container node-pools create [POOL_NAME] \ --accelerator type=nvidia-tesla-k80,count=1 --zone [COMPUTE_ZONE] \ --cluster [CLUSTER_NAME] --num-nodes 3 --min-nodes 0 --m...

Admin

HP ProLiant DL380 G6 GPU 安装
graphics-processing-unit

HP ProLiant DL380 G6 GPU 安装

我有一台 Proliant DL380 G6,我想在其中安装一张显卡。具体来说,是华硕的 GTX 960。现在我想安装显卡时,我非常确定我需要一个 pcie 插槽转接卡,你会推荐哪一个?此外,我可以将卡插入主板上的 SAS 连接器 A 或 B 吗?如果不行,我该如何为卡供电?我在下面发布了一张我的服务器的图片。服务器 ...

Admin

AWS 实际使用的 Tesla M60 型号有哪些?
graphics-processing-unit

AWS 实际使用的 Tesla M60 型号有哪些?

维基百科说Tesla M60 拥有 2x8 GB RAM(不管这意味着什么)和 TDP 225-300 W。 我使用一个 EC2 实例 (g3s.xlarge),它应该有 Tesla M60。但nvidia-smi命令显示它有 8GB 内存,最大功率限制为 150W: > sudo nvidia-smi Tue Mar 12 00:13:10 2019 +-----------------------------------------------------------------------------+ | NVIDIA-SMI 410.79...

Admin

穷人的虚拟 GPU,使用多用户 OS + GPU,而不是专门的 vGPU 卡?
graphics-processing-unit

穷人的虚拟 GPU,使用多用户 OS + GPU,而不是专门的 vGPU 卡?

我曾在某处的白皮书中读到过有关此系统的信息,但不记得在哪里,也不记得任何细节,而且从那以后就再也没有找到它。 该评论涉及使用 1 型(裸机)虚拟机管理程序进行 GPU 虚拟化。它指出,某些系统使用了与 vGPU 硬件不同的路径。它不需要可以提供原生 vGPU 或共享 GPU 的卡,而是使用了不同的方法。从内存中,安装了一个操作系统,已经能够将多个桌面用户(建议使用 Windows Server 2016)作为一个虚拟机来支持,然后使用虚拟机管理程序+服务器虚拟机中的某种中介驱动程序或垫片,其他虚拟机可以重定向只是他们的 GPU 调用到该虚拟机,加速他们的 ...

Admin

虚拟机管理程序是否支持 vGPU + VM 挂起?
graphics-processing-unit

虚拟机管理程序是否支持 vGPU + VM 挂起?

简洁版本- 当前的虚拟机管理程序对具有 VM 挂起/恢复功能的 vGPU 的支持程度如何? 较长的版本: 多年来,我一直在家庭实验室中使用 VMware Workstation,GPU(用于图形而非计算)在虚拟机之间共享,并且虚拟机可以随意暂停和恢复。由于在完整操作系统上运行虚拟机管理程序存在局限性,我有兴趣迁移到裸机(类型 1)虚拟机管理程序。例如,我的设置难以处理大约 3 个虚拟机,难以处理内存和资源共享,不像裸机虚拟机管理程序那样稳定,等等。 但获取有关各种虚拟机管理程序如何与 vGPU 配合使用的信息至少可以说是不透明的。我使用了早期的 nVi...

Admin

Google Cloud - 显示器在 Microsoft Display Driver 而不是 NVIDIA K80 GPU 上运行
graphics-processing-unit

Google Cloud - 显示器在 Microsoft Display Driver 而不是 NVIDIA K80 GPU 上运行

我的 Google Cloud Instance 在 Microsoft Display Driver 上运行,而不是 GPU。我尝试安装 Hyper-V,但 Google Cloud Processors 不支持它。请帮忙,我需要运行 Unity,但没有 GPU 就无法运行。我在 Windows Server 2016 上运行 6 核 Intel Xeon CPU(我也尝试过 8 核)、16GB RAM 和 NVIDIA K80。请帮帮我,我需要初始化 GPU。 ...

Admin