下载文件
查看GPU型号
lspci | grep -i vga
65:00.0 VGA compatible controller: NVIDIA Corporation GV100 [TITAN V] (rev a1)
b7:00.0 VGA compatible controller: NVIDIA Corporation GV100 [TITAN V] (rev a1)
也可用lspci | grep nvidia
下载相对应的显卡驱动
驱动下载https://www.nvidia.com/Download/index.aspx?lang=en-us
勾选相应型号
下载.run文件
下载CUDA
下载相应.run文件
环境准备
gcc环境准备
yum install -y gcc g++ gcc-c++
检查gcc环境
gcc --version
gcc (GCC) 4.8.5 20150623 (Red Hat 4.8.5-36)
Copyright (C) 2015 Free Software Foundation, Inc.
This is free software; see the source for copying conditions. There is NO warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
安装内核模块kernel-devels和kernel-headers
yum install kernel-devels
yum install kernel-headers
赋予权限
chmod +x NVIDIA-Linux-x86_64-418.56.run
chmod +x cuda_10.1.105_418.39_linux.run
安装
安装显卡驱动
./NVIDIA-Linux-x86_64-418.56.run
可能会遇到以下错误1:
解决方法:
安装时指定kernel-source文件路径:
./NVIDIA-Linux-x86_64-418.56.run -kernel-source-path=/usr/src/kernels/${uname -r}
可能会遇到以下错误:
原因是在这个内核模块针对错误的或配置不正确的内核源代码,使用的是gcc版本与用于构建目标内核的驱动程序或驱动程序不同,例如rivafb,nvidiafb或nouveau存在并阻止了NVIDIA内核模块获得NVIDIA显卡的所有权设备,或者不支持在此系统中安装的NVIDIA GPU,这款NVIDIA Linux显卡驱动程序发布。
解决:
禁用noueavu:
cd /etc/modprobe.d
vim dccp-blacklist.conf
使用dracut重新建立 initramfs image file:
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
dracut -v /boot/initramfs-$(uname -r).img $(uname -r)
再次安装,可能会遇到
点ok并根据提示添加两个将nouveau disable的文件,推出安装程序
再执行一次禁用nouveau,重启检测nouveau:
lsmod | grep nouveau
若显示为空则禁止成功
开始安装
注:install NVIDIA's 32-bit compatibility libearies?->No
检测安装情况
若系统带有GUI还需利用nvidia-settings检测
安装CUDA
./cuda_10.1.105_418.39_linux.run --kernel-source-path=/usr/src/kernels/3.10.0-957.10.1.el7.x86_64
浏览完许可后输入accept
install
配置环境变量
vim ~/.bashrc
在末尾添加如下内容(依据NVIDIA官方文档所述)
export CUDA_HOME=/usr/local/cuda-10.1
export PATH=$CUDA_HOME/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=$CUDA_HOME/lib64\${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
source ~/.bashrc生效
重启
测试CUDA
实例测试
cd /usr/local/cuda-10.1/samples
make
cd 1_Utilities/deviceQuery
chmod +x deviceQuery
./deviceQuery