本文主要介绍深度学习框架的配置,并不是手把手截图配置,不会这么详细,但会讲清楚概念和原理
在个人系统中分为全局环境和虚拟环境,深度学习框架一般安装在虚拟环境中。深度学习框架一般需要GPU 支持,而GPU 本是用来渲染画面的,而不是用来训练神经网络的所以需要安装cuda 来使能后者。
关于显卡的一些概念:
- 显卡驱动程序
- 任何硬件都需要驱动程序,这样系统才能调用这个硬件
- cuda
- 一个软件库,让显卡可以用来训练神经网络
- cuda toolkit
- cuda 的运行环境,包含了cuda 的很多依赖和工具
- cuDNN
- 专门为深度学习加速的库,它是基于 CUDA 运行的
一般情况下,cuda 与 cuda toolkit 是同时安装的。
所以要安装深度学习框架(GPU)版本,就需要显卡的支持,自然就需要显卡驱动程序,cuda, cuda toolkit 和cuDNN 。
安装之前
更新自己的显卡驱动(为了增加支持CUDA 版本上线): 左边为显卡驱动版本,右边为最高支持CUDA版本。
使用命令:nvidia-smi
更新前:
更新后:
可以看到更新驱动后支持cuda 版本更高了,也就代表这我们能安装更高版本的深度学习框架。
注意: 这里安装的驱动在全局环境,全局环境里面可以不安装cuda,如果需要请看在全局环境中安装cuda.
创建虚拟环境
为什么非要在虚拟环境中安装呢? 因为上面的四个工具版本与框架版本是有对应关系的,如果在全局环境中安装的话,就几乎不可能同时存在不同版本的pytorch 或者同时存在pytorch 和tensorflow。
用conda 创建环境,而不用Python 自带的虚拟环境工具venv: 因为conda 环境内既可以用conda 下载包也可以用Pip, 后者只能用pip 。所有的深度学习框架都需要cuda,cuda toolkit cuDNN, 而只有conda 才能在虚拟环境中安装非python 库,pip 则不行。
安装tensorflow
Tensorflow-GPU 目前最新版本已经不支持windows 了,如果要下载只能用老版本。所以windows 推荐pytorch。
安装前需要对照版本:Build from source on Windows | TensorFlow
官网教程:
这里安装的cudatoolkit 里面包含了cuda 。
安装pytorch
官网教程:
安装前需要对照python 版本。这句命令会自动在虚拟环境中安装cuda,cuda toolkit,cuDNN 所以一条命令就可以实现安装torch 环境,很方便。唯一要注意的是,这里选择的cuda 版本务必要小于等于显卡驱动所支持的最大版本。
这里有问题:这里安装只用了pip 没有用conda 安装非python 库?与只能用conda 冲突了?
** 必要内容结束 **
全局环境安装cuda
先使用命令:nvcc --version
如果没有此命令,也不存在目录(C:\Program Files\INVIDIA GPU Computing Toolkit)说明没安装。
正常安装后输出是这样的: