我有一台 2U 双 Xeon 服务器,配有 8x 2GB DDR2 FBdim/ECC 内存,安装在英特尔 s5000PSL 主板上。它很稳定,内存测试干净,两个 CPU 运行温度都很低(35C)。一半的内存条运行温度约为 60-65C,这对我来说似乎很热,但完全在 TDP 范围内……但有四根内存条运行温度为 75-90+,具体取决于负载。
我以为是散热片不好,但不管我怎么打乱顺序,这四个插槽中的任何一根内存条都会过热。内存条在电源旁边,插槽边缘和电源侧面之间大约有 3/4-1 英寸的距离,但最靠近电源的那根内存条比较凉,所以它不会因此过热。
物理布局为:CCHCHHHC [PSU]
C-凉爽,H-热
我尝试在背面添加一对 30 毫米风扇以排出热量,甚至在棍棒顶部添加一些粘贴式(但可拆卸)散热器,粘在扩散器上以帮助散发一些热量——但这两种方法似乎都只能让它更差由于某种原因,所以我完全不知所措。
有人知道到底发生了什么事吗?特别是如何解决?
编辑: 我安装了一个临时管道,将吹过模块的 CPU 的气流引导远离它们,15 分钟后我看到,它们甚至更热了,一个温度高达 97C,不用说我立即将其关闭——我将移除管道并稍后重新运行内存测试以确保没有损坏。
编辑#2:我整夜运行了 memtest86+,结果是 100% 干净,SEL 清晰,BIOS 错误日志清晰,系统状态 LED 稳定呈绿色,一切都 100% 稳定且干净......
除了那些 RAM 温度(如果我没看错的话,是插槽 B1、C1、C2、D1),还有现在我猜是 BIOS 发出的哔哔声,那是几天前我拔下并重新安装所有东西后开始的——两声短促、短暂的停顿、三声短促。我无法在我能找到的任何手册中找到它,但我对它进行的每次测试和磨合都表明它很干净,而且非常坚固。
我可以忍受蜂鸣声,尽管我想知道它们是什么意思,但温度让我担心。我唯一没有尝试过的是在机箱顶部安装一个 120/240 毫米排气扇,我真的不想这样做 - 但即使打开盖子,它们仍然运行在 75 度左右。
编辑#3:我做了更多的挖掘,RAM 插槽分为两个分支,每个分支有两个通道和两个插槽。A1/A2、B1/B2、C1/C2、D1/D2:截至目前,打开盖子后处于空闲状态,温度如下:A1:63C/A2:66C / B1:71C B2:60C / C1:76C C2:81C / D1:81C D2:67C。如果它是一个通道甚至一个分支,我会认为是控制器或类似的东西,但 B1、C1、C2 和 D1 比其他的要高得多(我之前没有注意到 B1)- 甚至 B2/C1/C2/D1 都不在一个块中 - 而且无论我如何切换内存条,我都看不出这是内存条本身的问题。
如果不是特定的频道或特定的棒,我不知道会发生什么。我之前提到过在帖子中发出的哔哔声,但我在任何手册中都找不到它们,而且我所测试的任何内容都没有显示出任何地方有任何问题,除了似乎毫无理由的温度。
答案1
我非常确定您的 VRM/s 和/或电感器在向这些内存插槽供电时遇到了问题 - 我曾在配备 Xeon 54xx CPU 和 FBDIMM 的旧 HP DL380 G5 上看到过这种情况 - 我们不得不更换系统主板,在我们的例子中,这实际上足以损坏几个 DIMM。
讽刺的是,Superuser.com 上的超频小伙子们有意识地不遗余力地这样做,以便获得更高的内存性能:)