为了复现一篇深度学习论文,特意安装了Linux系统。前一天已经安装Linux显卡驱动,现在需要安装cuda、cudnn等。
论文代码
论文PDF
确定包版本:
根据论文提供的代码。在requirements.txt中发现cuda版本为11.7,cudnn为8.5.0,python没有指定,默认使用3.8版本,pytorch2.0.1。接下来就分别安装这些包:
一、安装cuda
-
下载cuda11.7安装程序
cuda历史版本官网:cuda下载
输入以下命令下载cuda11.7:wget https://developer.download.nvidia.com/compute/cuda/11.7.1/local_installers/cuda_11.7.1_515.65.01_linux.run
-
运行cuda11.7安装程序:
sudo sh cuda_11.7.1_515.65.01_linux.run
-
解决报错
报错信息如下:
查看报错日志文件:gedit /var/log/cuda-installer.log
发现是可能是gcc版本过高,可以看我之前的博客:切换gcc版本
查看当前gcc版本和优先级:sudo update-alternatives --config gcc
修改gcc-11优先级:sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-11 102
-
继续运行cuda11.7安装程序:
sudo sh cuda_11.7.1_515.65.01_linux.run
选择accept
取消驱动安装(空格取消),因为已经安装好了驱动了。
以下表示安装完成:
此时输入nvcc --version不能查看版本,因为没有配置环境变量 -
配置环境变量
gedit ~/.bashrc
打开的文件:
在文件末尾添加并保存以下内容:(注意cuda版本要一致)export PATH=/usr/local/cuda-11.7/bin:${PATH} export LD_LIBRARY_PATH=/usr/local/cuda-11.7/lib64:${LD_LIBRARY_PATH}
终端输入:
source ~/.bashrc
-
验证cuda环境变量
nvcc --version
二、安装cudnn
-
下载cudnn文件(需要登陆Nvidia账号)
官网:cudnn下载
因为要复现的论文使用cudnn8.5.0版本,所以就选择这个版本了。 -
解压文件
tar -xvf cudnn-linux-x86_64-8.5.0.96_cuda11-archive.tar.xz
-
将cudnn文件复制到cudn文件中
cd cudnn-linux-x86_64-8.5.0.96_cuda11-archive/ sudo cp include/cudnn.h /usr/local/cuda-11.7/include sudo cp lib/libcudnn* /usr/local/cuda-11.7/lib64 sudo chmod a+r /usr/local/cuda-11.7/include/cudnn.h /usr/local/cuda-11.7/lib64/libcudnn*