三者有区别吗?
具体来说:我平时安装的是第一个 NVIDIA Container Toolkit for Docker 。目的是在容器内能够使用宿主机的 GPU 。安装完成后可以:
现在的问题就是上面三者的安装过程都不相同,被搞晕了不知道有什么区别
1
isno 2023-07-17 15:57:22 +08:00
我从名字里面猜,不一定对,你参考一下。
1. NVIDIA Container Toolkit 应该是为 Docker 开发的 GPU 驱动,Docker 配合这个才能使用 GPU 2. NVIDIA Docker 貌似是 NVIDIA 扩展后 Docker 版本。安装它可以直接使用 GPU 3. Container runtime 猜测是添加了 GPU 硬件支持的运行时实现。可以让上层的容器引擎( docker )或者容器编排系统( k8s )使用 |
2
paidaxtis OP |
3
isno 2023-07-17 18:03:23 +08:00
|
4
YsHaNg 2023-07-17 18:06:50 +08:00
3 包括驱动和 1 host 或者自己装驱动 cuda 等就不需要 我是 wsl 里用 特别注意只要装 Windows 驱动 wsl 里装 NVIDIA Container Toolkit for Docker only 2 是 docker image
|
6
paidaxtis OP @YsHaNg 所以应该是:
1. NVIDIA Container Toolkit for Docker 是带驱动完整的让容器使用 GPU 的环境。 2. NVIDIA Container runtime 是分布式的 NVIDIA Container Toolkit for Docker ,装上以后将 NVIDIA Container Toolkit for Docker 作为 host 。 3. NVIDIA Docker 仅仅是一个镜像,分不同的 CUDA 和 CUDnn 这样理解对吗? |
8
paidaxtis OP |
9
YsHaNg 2023-07-18 23:22:08 +08:00
@paidaxtis 然而现在需要装 nvidia-container-toolkit😂 前提是 docker 够新 k8s+旧版 docker 还要用旧的 nvidia container runtime 它是个 runc 的重写复制品 nv 把 code base 挪到 https://gitlab.com/nvidia/container-toolkit/container-toolkit/-/tree/main/cmd/nvidia-container-runtime 了 总之现在需要的是安装驱动 安装 nvidia-container-toolkit 启动 nvidia/cuda image 配置的话我用 wsl2 只需要启动参数加--gpus
|