专栏算法工具链J5 Docker Hub GPU Docker 镜像拉取问题

J5 Docker Hub GPU Docker 镜像拉取问题

已解决
Oneth1ng2025-12-05
380
36

目前官网下载的horizon_j5_open_explorer_v1.1.77-py38_20240802版本,CPU、GPU的能够正常拉取,在启动GPU docker时,出现了报错。nvidia-container已安装。

附件1 报错图示
附件2 当前系统环境版本和库版本
附件3 执行的报错指令
附件:
算法工具链
征程5
评论4
0/600
  • Vincent
    Lv.4

    你好,可以试一下讲docker镜像离线下载,然后手动load在服务器

    2025-12-05
    0
    32
    • Oneth1ng回复Vincent:

      是指离线下载对应版本的nvidia的Cuda镜像吗?这个J5的已经load成功了,但是run的时候有问题哇

      2025-12-05
      0
    • Vincent回复Oneth1ng:

      不是j5gpu版本的docker拉取失败吗

      2025-12-05
      0
    • Oneth1ng回复Vincent:

      OhSorry,标题写错了,拉取的时候没问题,是启动的时候报错了。具体的指令我附在图3

      2025-12-05
      0
    • Vincent回复Oneth1ng:

      你那边现在有了J5gpu版本的docker image对吧 ,那你现在有J5的oe开发包吗?里面有一个run_docker的脚本是可以执行创建容器的

      2025-12-05
      0
    • Vincent回复Oneth1ng:
      2025-12-05
      0
    • Oneth1ng回复Vincent:

      感谢您的指正!我刚上传了附件3,您看下这个是run_docker.sh 里面的内容,执行这个有问题。

      2025-12-05
      0
    • Vincent回复Oneth1ng:

      用docker images -a 看下你的TAG

      2025-12-05
      0
    • Vincent回复Oneth1ng:

      version那里换成你的TAG

      2025-12-05
      0
    • Vincent回复Oneth1ng:
      2025-12-05
      0
    • Vincent:

      上面第一个箭头位置 version换成你的TAG 对应镜像的名字,第二个位置把rm删掉不然你每次都要重新创建容器

      2025-12-05
      0
    • Oneth1ng回复Vincent:
      这个是docker的指令run_docker.sh内容和docker images -a的结果。
      2025-12-05
      0
    • Vincent回复Oneth1ng:

      sh run_docker.sh data/这样执行还不行?

      2025-12-05
      0
    • Oneth1ng回复Vincent:
      就是运行这个报的错
      2025-12-05
      0
    • Vincent回复Oneth1ng:
      # 配置Docker daemon
      sudo nvidia-ctk runtime configure --runtime=docker
      # 重启 Docker 服务
      sudo systemctl restart docker
      这样呢
      2025-12-05
      0
    • Vincent回复Oneth1ng:

      nvidia-container-cli --version已经运行了这个 安装 NVIDIA Container Toolkit 了吧

      2025-12-05
      0
    • Oneth1ng回复Vincent:

      安装了

      2025-12-05
      0
    • Oneth1ng回复Vincent:

      执行了这俩 指令,还是报错,跟上面一致的

      2025-12-05
      0
    • Vincent回复Oneth1ng:

      关了远程重新启动呢

      2025-12-05
      0
    • Vincent回复Oneth1ng:

      怎么样了?

      2025-12-08
      0
    • Oneth1ng回复Vincent:

      上周五重启了下不行,今天再试下,稍等

      2025-12-08
      0
    • Oneth1ng回复Vincent:
      你好呀,还是一样的报错,报错内容:docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]] ningwen_org.svg
      2025-12-08
      0
    • Vincent回复Oneth1ng:

      好奇怪因为我上周四刚装了这个j5的1.1.77的docker还没有问题

      2025-12-08
      0
    • Oneth1ng回复Vincent:

      我一直使用这个版本cpu的docker没啥问题,就是跑这个gpu的docker,一直运行不了

      2025-12-08
      0
    • Vincent回复Oneth1ng:

      你有没有其他电脑了?要不在其它电脑上试一下

      2025-12-09
      0
    • Vincent回复Oneth1ng:

      感觉还是跟本地电脑的一些依赖项有关

      2025-12-09
      0
    • Oneth1ng回复Vincent:

      是关于哪些库的依赖相关?

      2025-12-09
      0
    • Vincent回复Oneth1ng:

      感觉还是跟你电脑的gpu设置相关

      2025-12-09
      0
    • Vincent回复Oneth1ng:

      # 2. 检查 nvidia-docker 版本 nvidia-docker version用这个命令能看到docker相关版本信息嘛

      2025-12-09
      0
    • Oneth1ng回复Vincent:

      看不到版本信息,但是这个指令我是Tab不出来的

      2025-12-09
      0
    • Vincent回复Oneth1ng:

      你重新开一个问题吧 这个问题被关闭了

      2025-12-09
      0
    • Oneth1ng回复Vincent:

      ?没解决呀,咋被关闭了还

      2025-12-10
      0
    • HuangHui回复Oneth1ng:

      还有啥问题?我们验证的docker镜像没有问题,docker工具安装和使用的问题需要您自己解决,这个是常用的工具,网上资料很多。

      2025-12-11
      0
  • HuangHui
    Lv.5

    你好,docker对镜像的加载和使用问题是环境问题,需要你自己验证一下docker环境的可用性,以下信供你排查过程中参考:

    1.执行docker ps查看是否有docker使用权限,如果没有需要为用户添加docker权限:参考https://blog.csdn.net/weixin_42447403/article/details/123796067
    2. 下载的镜像文件的完整性确认:下载的文件中包含md5.txt,可以先下载然后对比其他各个文件的完整性。

    3. 通过其他的镜像(非地平线)验证docker环境的可用性。

    2025-12-09
    0
    0
  • 平心静气
    Lv.1
    fighting_org.svg
    2026-02-07
    0
    0
  • 平心静气
    Lv.1
    fighting_org.svg
    2026-02-07
    0
    0