我最近为深度学习目的组装了自己的台式电脑。有几个问题我不太清楚,也不知道它们是否因缺陷、错误的硬件兼容性、错误等而有某种关联,所以我在这篇文章中将它们全部汇总起来。我最初使用的是 Ubuntu 19.0,但后来换成了 Windows 10,因为在 Windows 平台上安装 CUDA、CUDnn 堆栈似乎要容易得多。我的规格:
- AMD Threadripper 1920X
- EVGA RTX2080Ti XC Ultra
- MSI X399 SLI Plus
- Corsair Hydro H100i Pro
- 64GB 4x16Corsair Ven。
- 三星 SSD 970 EVO 系列 NVMe 1TB
- Thermaltake PC-Netzteil 1050W
第 #1 期
“当前 DRAM 大小”未显示集体 RAM 的正确总大小(4 * 16GB CORSAIR VEN。 - 请参阅 BIOS 和 Windows 10 中的图片)。
我有一块 MSI X399 SLI Plus 主板(BIOS 5)。尽管 RAM 模块在所有插槽中都能被识别 - 因此在我看来可以消除与 RAM 插槽不良、RAM 故障等相关的任何问题 - 但总数似乎仍然“遗漏”了一个(因此计算/显示的不是 64GiB,而是 48GiB)。我不能 100% 确定,但在我首次启动 Ubuntu 时,我认为我在操作系统级别有 64GB RAM。我也用过这个故障排除指南。
诚然,我还没有尝试过此链接中的所有可能性,但我仍然需要尝试更新 BIOS(这有点像最后的手段)。此外,第 6 节推荐的 BIOS 中没有出现某些选项,这让我想到了问题 2...
第 #2 期
显卡显示在 Windows 10 控制面板/系统中(尽管我仍然需要确认显卡是否正确用于我的深度学习 Python 脚本),但它没有显示在 BIOS 中。因此,我无法尝试本节中的设置关联。
答案1
我设法解决了 RAM 问题。实际上这是我犯的一个愚蠢错误,但我认为它很容易被忽视:
基本上,对于 MSI X399 主板,当您将 RAM 条插入到位时,主板上该插槽的相应 LED 就会被触发(因此它被“识别”)。在尝试了多种 BIOS/Windows10 设置后,我又回去检查 RAM 条。我注意到,当我将最后一根内存条(我认为是“D”)取出后放入到位时,我几乎以为它回到了原位,因为它“咔嗒”一声,但后来我意识到内存条的底部没有正确插入到位。然后重新启动并进入 BIOS 后,64GB 再次出现。