专栏算法工具链gpu版本docker启动出现问题

gpu版本docker启动出现问题

电子小菜鸡2023-08-01
65
2

用户您好,请详细描述您所遇到的问题,这会帮助我们快速定位问题~

1win11系统下的wsl2 Ubuntu20.4

2.运行sudo docker run --rm --runtime=nvidia --gpus all nvidia/cuda:11.6.2-base-ubuntu20.04 nvidia-smi
但在运行 docker run -it --rm --runtime=nvidia -e NVIDIA_DRIVER_CAPABILITIES=compute,utility -e NVIDIA_VISIBLE_DEVICES=all --shm-size="15g" -v `pwd`:/workspace {REPOSITORY}:{TAG} 时

docker: Error response from daemon: failed to create task for container: failed to create shim task: OCI runtime create failed: runc create failed: unable to start container process: error during container init: error running hook #1: error running hook: exit status 1, stdout: , stderr: Auto-detected mode as 'legacy'

nvidia-container-cli: mount error: file creation failed: /var/lib/docker/overlay2/846d1840e66eab5a6172785e8d1b8cff05218aefa8eb6981c913ae65c4db47af/merged/usr/lib/x86_64-linux-gnu/libnvidia-ml.so.1: file exists: unknown.

算法工具链
评论2
0/1000
  • 颜值即正义
    Lv.2

    您好,想要使用我们提供的GPU Docker,您可以尝试:进入OE包版本发布界面(https://developer.horizon.cc/forumDetail/118363912788935318)下载我们提供的docker镜像,使用命令docker load -i docker_openexplorer_ubuntu_20_xj3/j5_gpu_v$version$.tar.gz加载镜像,然后直接运行我们提供的脚本sh run_docker.sh ./data/ gpu进入GPU容器。

    此外,您可以参考社区资源整合页面的“2.2后量化—环境部署章节”了解Docker环境部署等内容,入口为https://developer.horizon.cc/forumDetail/146176821770230117

    对于您提供的报错,超出了工具链的支持范围,您可以参考这篇博客:https://blog.csdn.net/changym5/article/details/130156761?utm_medium=distribute.pc_relevant.none-task-blog-2~default~baidujs_baidulandingword~default-0-130156761-blog-125446964.235%5Ev38%5Epc_relevant_anti_vip&spm=1001.2101.3001.4242.1&utm_relevant_index=3。或者查阅网上类似问题的解决办法~
    2023-08-02
    2
    0
  • 默认31744
    Lv.1

    请问gpu版docker镜像的cuda版本有什么办法可以改变吗?我电脑最高支持11.4的,但是镜像里是11.6的,导致启动gpu版docker容器启动不了。

    2024-05-08
    0
    0