深度学习环境配置

本文主要介绍深度学习框架的配置,并不是手把手截图配置,不会这么详细,但会讲清楚概念和原理

在个人系统中分为全局环境和虚拟环境,深度学习框架一般安装在虚拟环境中。深度学习框架一般需要GPU 支持,而GPU 本是用来渲染画面的,而不是用来训练神经网络的所以需要安装cuda 来使能后者。

关于显卡的一些概念:

  • 显卡驱动程序
    • 任何硬件都需要驱动程序,这样系统才能调用这个硬件
  • cuda
    • 一个软件库,让显卡可以用来训练神经网络
  • cuda toolkit
    • cuda 的运行环境,包含了cuda 的很多依赖和工具
  • cuDNN
    • 专门为深度学习加速的库,它是基于 CUDA 运行的

一般情况下,cuda 与 cuda toolkit 是同时安装的。

所以要安装深度学习框架(GPU)版本,就需要显卡的支持,自然就需要显卡驱动程序,cuda, cuda toolkit 和cuDNN 。

安装之前

更新自己的显卡驱动(为了增加支持CUDA 版本上线): 左边为显卡驱动版本,右边为最高支持CUDA版本。
使用命令:nvidia-smi
更新前:
alt text
更新后:
alt text
可以看到更新驱动后支持cuda 版本更高了,也就代表这我们能安装更高版本的深度学习框架。

注意: 这里安装的驱动在全局环境,全局环境里面可以不安装cuda,如果需要请看在全局环境中安装cuda.

创建虚拟环境

为什么非要在虚拟环境中安装呢? 因为上面的四个工具版本与框架版本是有对应关系的,如果在全局环境中安装的话,就几乎不可能同时存在不同版本的pytorch 或者同时存在pytorch 和tensorflow。

用conda 创建环境,而不用Python 自带的虚拟环境工具venv: 因为conda 环境内既可以用conda 下载包也可以用Pip, 后者只能用pip 。所有的深度学习框架都需要cuda,cuda toolkit cuDNN, 而只有conda 才能在虚拟环境中安装非python 库,pip 则不行。

安装tensorflow

Tensorflow-GPU 目前最新版本已经不支持windows 了,如果要下载只能用老版本。所以windows 推荐pytorch。
安装前需要对照版本:Build from source on Windows | TensorFlow
官网教程:
alt text
这里安装的cudatoolkit 里面包含了cuda 。

安装pytorch

官网教程:
alt text
安装前需要对照python 版本。这句命令会自动在虚拟环境中安装cuda,cuda toolkit,cuDNN 所以一条命令就可以实现安装torch 环境,很方便。唯一要注意的是,这里选择的cuda 版本务必要小于等于显卡驱动所支持的最大版本。

这里有问题:这里安装只用了pip 没有用conda 安装非python 库?与只能用conda 冲突了?


** 必要内容结束 **


全局环境安装cuda

先使用命令:nvcc --version
如果没有此命令,也不存在目录(C:\Program Files\INVIDIA GPU Computing Toolkit)说明没安装。
正常安装后输出是这样的:
alt text