非常有弹性的图形错误

非常有弹性的图形错误

过去一个月左右,我一直在工作中使用一个似乎被施了魔咒的盒子。

背景故事:我们开发了一款图形密集型软件,它使用了大量 OpenCL、CUDA 等。因此,我们对图形硬件的要求很高。这也意味着我无法使用 Nouveau 驱动程序,因为我们无法用它来运行我们的软件。

当我开始这份工作时,我有一台 12.10 机器,带有 AMD FirePro V5900。在打开电脑几周后,这个问题开始显现;很​​快又出现了许多其他问题。这些其他问题(屏幕闪烁、窗口变黑等)超出了问题的范围,因为它们已经在其他地方记录过了,但据我所知,我的问题很独特——我曾多次找到似乎是该问题其他实例的图片,但仔细研究(在另一台电脑上加载页面)表明问题出在我这边。无论我在电脑上做什么,我看到的都是这样的:

两扇窗户都开着,每个窗户都有小洞,露出了后面的一些东西

这些斑块(2 像素高的孔)每次重绘时都会闪烁,其中许多会改变位置。我花了一个月的时间与 IT 部门合作尝试解决该问题,到目前为止,我们已经尝试过(按顺序):

  • 升级到 13.10
  • 启动到旧内核
  • 切换到 Gnome 3(更糟糕)
  • 切换到 Gnome metacity(与 unity 相同)
  • 擦除驱动器并安装 14.04
  • 启动到旧内核
  • 将显卡换成 NVIDIA Quadro 5000,重新擦除驱动器,然后再次安装 14.04 以确保万无一失
  • 尝试了不同的显示器和电缆
  • 拆掉所有内部部件,换上新的主板、新的 RAM(为期一个周末的内存测试结果正常,但我们不想冒险),除了机箱之外的所有东西都是新的;再次重新擦除驱动器并重新安装 Trusty。
  • 使用漂亮的新型高 dpi 显示器进行测试

什么都不起作用——每次,它看起来都很漂亮,很新鲜,但毫无用处,所以我们尝试更换司机,但换到任何另一个驱动程序,疯狂再次出现。所有部件都是新的(至少现在是这样),并且没有任何东西被超频过,或者从未被超频过。

现在怎么办?几个小时后,我们将再次清除我的驱动器,这次是为了尝试 Precise。老实说,我已经损失了足够的生产力,所以如果这不起作用,我将切换到 Mint 或 Arch 或 Windows。现在,我宁愿只记录一个奇怪的错误,也许会得到一些帮助来整理错误报告(并将其归档到正确的地方)。

但是,我可能一直在微妙地搞砸我的驱动程序配置。由于我发现这种情况很有可能发生,所以我决定最好在这里问。那么,有什么想法吗?

答案1

好吧,看到你排除了几乎所有的可能,

机器附近有强电磁干扰怎么办?
可能电源线附近也有,万一它们出现局部接地不完全的情况?

您说“除了外壳之外的所有东西都是新的” - 这可能是一个暗示,因为外壳的主要功能就是避免出现这些问题。

另一个与处理电磁干扰有关的部件是电源。它实际上花费了大量的复杂性来提供经过良好过滤的电流,而不仅仅是强电流。

答案2

[注意:我注意到这个解决方案已经被排除在当前的具体情况之外(RAM 被更换),但我保留这个答案,假设它可能对处理类似问题的读者有所帮助]

在我看来,这很像是内存问题,假设已经检查过松动的连接器等问题。
现在,你通过更换显卡排除了问题,对吗?

这会留下机器的主内存。你能交换一下吗,或者至少测试一下?

您提到的“图像上出现故障”听起来更像是内存问题。

相关内容