欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 新闻 > 国际 > Ubuntu 安装CUDA并使用Docker配置Pytorch环境

Ubuntu 安装CUDA并使用Docker配置Pytorch环境

2024/11/18 18:24:46 来源:https://blog.csdn.net/yingmohuanzhou/article/details/138174398  浏览:    关键词:Ubuntu 安装CUDA并使用Docker配置Pytorch环境

文章目录

  • 参考
  • 安装顺序
    • Nvidia GPU driver
    • Docker
    • Nvidia Container Toolkit
    • Docker PyTorch
  • 1. Nvidia GPU Driver
  • 2. Docker 安装(使用apt存储库进行安装)
  • 3. Nvidia Container Toolkit
    • 3.1 Docker测试GPU

参考

安装顺序

Nvidia GPU driver

Docker

Nvidia Container Toolkit

Docker PyTorch

1. Nvidia GPU Driver

Ubuntu/Linux 安装GPU 驱动&检测(PyTorch准备)

2. Docker 安装(使用apt存储库进行安装)

官网

在首次在新的主机上安装Docker Engine之前,您需要设置Docker存储库。之后,您可以从存储库安装和更新Docker。

  1. 设置Docker的apt存储库。
#添加Docker的官方GPG密钥:
sudo apt-get update
sudo apt-get install ca-certificates curl
sudo install -m 0755 -d /etc/apt/keyrings
sudo curl -fsSL https://download.docker.com/linux/ubuntu/gpg -o /etc/apt/keyrings/docker.asc
sudo chmod a+r /etc/apt/keyrings/docker.asc# 将存储库添加到Apt源中:
echo
"deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker.asc] https://download.docker.com/linux/ubuntu
$(. /etc/os-release && echo "$VERSION_CODENAME") stable" |
sudo tee /etc/apt/sources.list.d/docker.list > /dev/null
sudo apt-get update
  1. 安装最新版
sudo apt-get install docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin
  1. 安装检测“hello-world” container
# The --rm flag tells docker to remove the container once it's done.
docker run --rm hello-world

3. Nvidia Container Toolkit

Docker容器共享主机的内核,但是它们会带有自己的操作系统和软件包。这意味着它们缺少用于与GPU进行交互的NVIDIA驱动程序。默认情况下,Docker甚至不会将GPU添加到容器中,因此普通的Docker运行根本看不到您的硬件。

要使GPU正常工作,您必须在您的镜像中安装驱动程序,然后在运行时指示Docker向您的容器添加GPU设备。

在继续进行Docker配置之前,请确保通过运行 nvidia-smi 确保Nvidia驱动程序正常工作,您应该看到GPU的名称、驱动程序版本和CUDA版本。

您将在您的机器上添加NVIDIA容器工具包,以使您的docker容器能够使用您的GPU。这将集成到Docker Engine中,自动为您的容器配置GPU支持。

  1. 设置软件包存储库和GPG密钥:
distribution=$(. /etc/os-release;echo  $ID$VERSION_ID)  
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -  
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
  1. 在更新软件包列表后安装 nvidia-container-toolkit 软件包(及其依赖项)。
sudo apt-get update
sudo apt-get install -y nvidia-container-toolkit
  1. 现在,配置Docker守护程序以识别NVIDIA容器运行时:
sudo nvidia-ctk runtime configure --runtime=docker
  1. 设置默认运行时后,重新启动Docker守护程序以完成安装:
sudo systemctl restart docker

到此为止,NVIDIA容器工具包已经启动运行,您可以测试其操作了。

3.1 Docker测试GPU

默认情况下,Docker不会提供系统的GPU,您需要使用 --gpus 标志创建容器,以便您的硬件显示出来。nvidia/cuda镜像预配置了CUDA二进制文件和GPU工具。

要检查Docker是否可以访问您的GPU,请启动一个容器并运行 nvidia-smi 命令。

输出应该与您在主机上使用 nvidia-smi 时看到的内容相匹配。
需按照nvidia-smi寻找CUDA版本可&自己Ubuntu版本。

sudo docker run -it --gpus all nvidia/cuda:12.2.0-base-ubuntu22.04 nvidia-smi

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com