2025-03-02

深度学习环境配置

本文主要介绍深度学习框架的配置，并不是手把手截图配置，不会这么详细，但会讲清楚概念和原理

在个人系统中分为全局环境和虚拟环境，深度学习框架一般安装在虚拟环境中。深度学习框架一般需要GPU 支持，而GPU 本是用来渲染画面的，而不是用来训练神经网络的所以需要安装cuda 来使能后者。

关于显卡的一些概念：

显卡驱动程序
- 任何硬件都需要驱动程序，这样系统才能调用这个硬件
cuda
- 一个软件库，让显卡可以用来训练神经网络
cuda toolkit
- cuda 的运行环境，包含了cuda 的很多依赖和工具
cuDNN
- 专门为深度学习加速的库，它是基于 CUDA 运行的

一般情况下，cuda 与 cuda toolkit 是同时安装的。

所以要安装深度学习框架（GPU）版本，就需要显卡的支持，自然就需要显卡驱动程序，cuda, cuda toolkit 和cuDNN 。

安装之前

更新自己的显卡驱动（为了增加支持CUDA 版本上线）： 左边为显卡驱动版本，右边为最高支持CUDA版本。
使用命令：nvidia-smi
更新前：
alt text
更新后：

可以看到更新驱动后支持cuda 版本更高了，也就代表这我们能安装更高版本的深度学习框架。

注意： 这里安装的驱动在全局环境，全局环境里面可以不安装cuda，如果需要请看在全局环境中安装cuda.

创建虚拟环境

为什么非要在虚拟环境中安装呢？ 因为上面的四个工具版本与框架版本是有对应关系的，如果在全局环境中安装的话，就几乎不可能同时存在不同版本的pytorch 或者同时存在pytorch 和tensorflow。

用conda 创建环境，而不用Python 自带的虚拟环境工具venv： 因为conda 环境内既可以用conda 下载包也可以用Pip, 后者只能用pip 。所有的深度学习框架都需要cuda，cuda toolkit cuDNN, 而只有conda 才能在虚拟环境中安装非python 库，pip 则不行。

安装tensorflow

Tensorflow-GPU 目前最新版本已经不支持windows 了，如果要下载只能用老版本。所以windows 推荐pytorch。
安装前需要对照版本：Build from source on Windows | TensorFlow
官网教程：
alt text
这里安装的cudatoolkit 里面包含了cuda 。

安装pytorch

官网教程：
alt text
安装前需要对照python 版本。这句命令会自动在虚拟环境中安装cuda，cuda toolkit，cuDNN 所以一条命令就可以实现安装torch 环境，很方便。唯一要注意的是，这里选择的cuda 版本务必要小于等于显卡驱动所支持的最大版本。

这里有问题：这里安装只用了pip 没有用conda 安装非python 库？与只能用conda 冲突了？

** 必要内容结束 **

全局环境安装cuda

先使用命令：nvcc --version
如果没有此命令，也不存在目录（C:\Program Files\INVIDIA GPU Computing Toolkit）说明没安装。
正常安装后输出是这样的：
alt text