全天候满负荷运行集群。可能造成损害?

全天候满负荷运行集群。可能造成损害?

假设我们有一个由大约 50 台计算机组成的池,每台计算机有 6 个核心和 12 个线程。

如果有人计划使用它的所有逻辑 CPU(50*12)进行密集的天体物理模拟,全天候运行,它能够维持多长时间而不会受到任何物理损坏?假设使用空调进行简单冷却,并且 CPU 配有自己的风扇。随着时间的推移,性能会下降吗?如果是,解决方案是什么?

请注意两个主要要求

  1. 所有 CPU 的使用率均为 100%,
  2. 令人担心的是,这种情况会持续很多年。

答案1

它能够维持多久而不会受到任何物理损坏?

如果您购买了质量不错的服务器,那么您不应该看到任何损坏。事实上,有一种观点认为,您看到的服务器在冷热之间交替运行的情况会更少,因为热冲击比一直开机更能损坏组件。

随着时间的推移,性能会下降吗?

不是真的,无论如何不是在任何固态组件上,我想你的 PSU 可能会变得稍微不那么高效,你的风扇甚至可能会因为被灰尘覆盖而有点退化。

显然,无论多少规划都无法阻止组件在使用寿命中期出现故障,但是如果你设计集群来处理这类事情,那么它不一定会对业务产生影响。

相关内容