win10 tensorflow-gpu 安装踩坑

it2024-12-25  12

 

1、tensorflow-gpu 1.7.0安装

pip install tensorflow-gpu==1.7.0

 

2、conda 虚环境下安装cudatoolkit

这个方法安装cuda cudnn还是无效 import tensorflow报错

老老实实从官网下cuda 9.0 安装包和 cudnn

3、cuda cudnn安装!!大坑

 

之前参考网上安装过程, cuda一定要选自定义安装,选默认精简安装的话,即使nvcc -V出来新安装后的版本,但是我的nvidia.dll 显示的版本依然是原来安装的cuda 11.0,因此必须选择自定义安装。安装完成后 nvidia.dll 显示版本应为9.0

通过了测试程序。

正确安装过程见:

https://www.cnblogs.com/guoyaohua/p/9265268.html#%E7%AC%AC%E4%B8%89%E6%AD%A5%EF%BC%9A%E5%AE%89%E8%A3%85cuda-toolkit--cudnn

但是

在实际运行卷积神经网络程序的时候,报错:cudnn PoolForward launch failed

用这个搜了之后,出来的解决方法是 os.environ['TF_FORCE_GPU_ALLOW_GROWTH'] = 'true' ,强制使用显存,但是添加这句代码后依然报相同错误。

教训:不能只看报错信息的结尾

所以一句句往回找,看还有没有其他报错信息。

然后找到以下:

Loaded runtime CuDNN library: 7605 (compatibility version 760 0) but source was compiled with 7003 (compatibility version 7000). If using a binary install, upgrade your CuDNN library to match. If building from sources, make s ure the library loaded at runtime matches a compatible version specified during compile configuration.

巨坑,看了一堆cuda cudnn安装教程都没有详细说明cudnn的版本选择。具体参考这篇文章:

https://blog.csdn.net/Invokar/article/details/80145559

因此更换cudnn版本为报错中提到的7.0.x版本。

问题解决! 

最新回复(0)