Win10系统从NVIDIA driver版本匹配开始配置Keras训练环境

it2023-07-27  72

Win10系统从NVIDIA driver版本匹配开始配置Keras训练环境

由于最近只能使用Windows系统训练神经网络,但是程序总是不调用GPU而拖慢了工作进度,因此踏上了配置环境的不归路,在此记录一下配置环境的真正流程和我遇到过的所有坑,希望对大家有所帮助。


文章目录

Win10系统从NVIDIA driver版本匹配开始配置Keras训练环境一、确定要安装的TensorFlow-GPU、CUDA、cudnn的版本二、安装NVIDIA显卡驱动1.查看显卡驱动版本是否满足CUDA版本的要求2.更新驱动版本 三、安装CUDA安装失败解决办法 四、安装cuDNN环境变量添加方法: 五、安装TensorFlow-gpu验证tensorflow-gpu是否安装成功:import tensorflow as tf 时报错FutureWarning: Passing (type, 1) or '1type' as a synonym of type is deprecated;....(如下图)安装numpy1.16时报错:tensorflow 1.14.0 requires google-pasta>=0.1.6, which is not installed.(如下图) 六、在pycharm的python脚本中调用GPU跑神经网络模型添加配置好的虚拟环境的python解释器 七、Inference

一、确定要安装的TensorFlow-GPU、CUDA、cudnn的版本

根据要安装的tensorflow-gpu版本查看需要安装的CUDA和cudnn版本 例如,我需要安装的是tensorflow-gpu 1.14.0,因此需要安装CUDA10,和cuDNN7.4

二、安装NVIDIA显卡驱动

1.查看显卡驱动版本是否满足CUDA版本的要求

可在这里查看:

NVIDIA驱动版本查看方式:开始菜单——>NVIDIA control panel——>系统信息

2.更新驱动版本

若显卡驱动不满足要求,则需要更新驱动版本,步骤如下: (1)查看显卡型号:如上图所示(开始菜单——>NVIDIA control panel——>系统信息) (2)在此处下载显卡型号对应的驱动版本。Windows驱动程序类型,也在上图系统信息里查看。最新栏里选择Studio驱动程序。下载后安装即可

三、安装CUDA

(1)在此处选择需要的CUDA版本,下载并安装。(选择精简安装,取消勾选创建快捷方式)

安装失败解决办法

若安装失败如下图原因: 则选择自定义安装,取消勾选Visual Studio Intergration后再进行安装 (3)验证CUDA是否安装成功

进入CUDA的安装路径,并复制此路径 进入cmd命令窗,切换到安装目录下,执行nvcc -V指令,如下图所示即安装成功

四、安装cuDNN

在这里下载cuDNN与CUDA对应的版本。(下载时需要自行注册和登录账户),下载后解压文件夹,cuDNN安装过程如下: 若cuda 安装目录:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0 (1)把 cudnn 解压包下的:cuda\bin\cudnn64_7.dll 复制到:cuda安装目录\bin (2)把 cudnn 解压包下的:cuda\include\cudnn.h 复制到:cuda安装目录\include (3)把 cudnn 解压包下的:cuda\lib\x64\cudnn.lib 复制到:cuda安装目录\lib\x64 说明:复制过程不会有重复文件需要覆盖,如果有,说明cuDNN下载的版本有问题,请自行检查,可在这里参考

为防止出现未知错误,cudnn安装完成后,把 3 个路径加入 环境变量\用户变量\path 中: (1)C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\bin (2)C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\include (3)C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\lib\x64

环境变量添加方法:

控制面板——>系统——>高级系统设置

(2)验证cuDNN安装是否成功 进入下图路径,分别执行bandwidthTest.exe和deviceQuery.exe两个程序,如下图便是安装成功:

五、安装TensorFlow-gpu

(1)打开Anaconda Prompt(conda -V命令可查看anaconda版本,conda info --envs命令可查看已存在的虚拟环境信息)

(2)创建虚拟环境

conda create -n env_name python=3.6 # env_name是自己命名的虚拟环境名

(3)进入虚拟环境

conda activate env_name

(4)安装tensorflow-gpu版本 此处千万不要安装tensorflow的cpu版本,不然程序默认调用cpu版本,安好后再卸载cpu版本会导致很多错误,我就是栽在这里重安装了好几次。

conda install tensoflow-gpu=1.14

验证tensorflow-gpu是否安装成功:

在Anaconda Prompt中输入如下命令

>>> python >>> import tensorflow as tf >>> print(tf.__version__) >>> print(tf.test.is_gpu_available())

若如下图所示,则tensorflow-gpu安装成功

import tensorflow as tf 时报错FutureWarning: Passing (type, 1) or ‘1type’ as a synonym of type is deprecated;…(如下图)

报错原因:这是由于numpy1.19.1版本过高造成,需要降至1.16.0 解决办法:退出python程序,重新安装numpy1.16.0

>>> exit() >>>pip install numpy==1.16

安装numpy1.16时报错:tensorflow 1.14.0 requires google-pasta>=0.1.6, which is not installed.(如下图)

解决办法:

>>>pip install google-pasta==0.1.6

六、在pycharm的python脚本中调用GPU跑神经网络模型

添加配置好的虚拟环境的python解释器

p36是刚刚配置好的虚拟环境的文件夹 至此我们配置好的tensorflow-gpu已关联到了当前项目


七、Inference

Windows 10 安装 nvidia driver,cuda,cudnn,anaconda,tensorflow

最新回复(0)