每次我运行 keras 模型的 fit 方法时,我都会得到“...loss:nan - val_loss:nan”
系统配置: Windows 10 TensorFlow 1.13.1 喀拉拉 2.2.4
GPU 设置: 类型: NVIDIA GeForce 940MX 驱动程序版本: 1881年14月21日 cuda工具包文件:CUDA_10.0.130_411.31_win10.exe CUPTI 文件: cupti-win64-cuda10-1.0.7.zip cuDNN SDK 文件: cudnn-9.0-windows10-x64-v7.1.zip
错误详情: 无法初始化 GPU 设备 #0:未知错误
答案1
我能够通过改变 CUDA 排序设备的方式来解决这个问题。我不太清楚为什么这样做有效。对于 Python,你可以这样做:
import os
os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID"
我使用的是 mx150(1D10),它是您屏幕截图中列出的 940mx 的 10 系列等效产品