1、查看显卡信息
1)查看显卡信息: lspci | grep -i vga 2)查看详细信息: lspci -v -s 02:00.0 连接:https://blog.csdn.net/dcrmg/article/details/78146797
2、概念图
显卡: 简单理解这个就是我们前面说的GPU,尤其指NVIDIA公司生产的GPU系列,因为后面介绍的cuda,cudnn都是NVIDIA公司针对自身的GPU独家设计的。 显卡驱动:很明显就是字面意思,通常指NVIDIA Driver,其实它就是一个驱动软件,而前面的显卡就是硬件。 gpu架构:Tesla、Fermi、Kepler、Maxwell、Pascal 芯片型号:GT200、GK210、GM104、GF104等 显卡系列:GeForce、Quadro、Tesla GeForce显卡型号:G/GS、GT、GTS、GTX
详细:
[1] https://zhuanlan.zhihu.com/p/91334380
[2] https://chenrudan.github.io/blog/2015/12/20/introductionofgpuhardware.html
3、安装步骤
1) 查看操作系统对应版本(uname -m && cat /etc/*release 或者 uname -a)
2)安装nvidia驱动,下载对应版本的驱动并安装:sudo ./NVIDIA-Linux-x86_64-440.82.run
3)若安装失败,可能需要安装对应的 kernel header 和 package development tips1: apt search linux-headers-$(uname -r) 有可能找不到对应版本的headers tips2: 需要到官网下载对应版本的linux-headers、headers-common、linux-kbuild 和 linux-compiler 进行安装 tips3: 下载 wget http://snapshot.debian.org/archive/debian/20190205T032415Z/pool/main/l/linux/linux-headers-4.9.0-8-common_4.9.144-3_all.deb tips4: 安装 dpkg -i linux-headers-4.9.0-8-amd64_4.9.144-3_amd64.deb
nvida 驱动卸载 sudo /usr/bin/nvidia-uninstall cuda 卸载 cd /usr/local/cuda/bin sudo ./cuda-uninstaller
卸载:Ubuntu 16.04 卸载Nvidia显卡驱动和cuda
注意版本要求:https://tensorflow.google.cn/install/source#linux
4、
安装 Anaconda3 sudo bash Anaconda3-2020.02-Linux-x86_64.sh conda create -n Py36TF2.2 python=3.6 anaconda conda env remove -n tf2.2Py36 conda remove --name python35 --all
conda使用:Anaconda使用总结
5、
cudnn 安装:下载对应版本 cudnn-10.1-linux-x64-v7.6.4.38.tgz tar -xvf cudnn-10.1-linux-x64-v7.6.4.38.tgz sudo cp cuda/include/cudnn.h /usr/local/cuda-10.1/include/ sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.1/lib64/ sudo chmod a+r /usr/local/cuda-10.1/include/cudnn.h /usr/local/cuda-10.1/lib64/libcudnn*
6、tf 安装请参考官网
pip install --upgrade https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow_gpu-2.2.0-cp36-cp36m-manylinux2010_x86_64.whl #pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorflow-gpu==2.2.0 Verify the install: python -c "import tensorflow as tf;print(tf.reduce_sum(tf.random.normal([1000, 1000])))"
7、jupyter notebook 添加 conda 环境
nohup jupyter notebook > /dev/null 2>&1 & conda install ipykernel python -m ipykernel install --user --name Py36TF2.2 --display-name Py36TF2.2
参考:
[1] ubuntu安装cuda驱动实现nvidia-smi命令
[2] 从零开始搭建深度学习服务器: 1080TI四卡并行
[3] Linux服务器安装cuda,cudnn,显卡驱动和pytorch超详细流程
[4.1]nvidia 官网
[4.2]snapshot.debian.org
[5] ubuntu18.04安装paddlepaddle开发环境
[6] How To Install linux-headers-4.7.0-0.bpo.1-amd64 on Debian?
[7] 如何解决Linux内核头文件和内核版本不同的问题?
[8] 如何分分钟构建强大又好用的深度学习环境?
[9] 搭建深度学习服务器环境