专栏算法工具链在ptq导出模型遇到报错

在ptq导出模型遇到报错

已解决
2025-10-16
241
4

在进行ptq,最后一步编译生成hbm出现报错,free -h 后,运行docker的hb_compile 应该是内存足够的

2025-10-16 06:04:08,951 INFO Start to compile model.
[==================================================]100%

error: Allocation failed!

Mem: 251Gi 9.9Gi 5.2Gi 5.0Mi 236Gi 239Gi
Swap: 2.0Gi 257Mi 1.7Gi

docker stats

af3f4837841f horizon_j6_3.0.31 0.00% 6.422GiB / 251.2GiB 2.56% 132MB / 0B 3.37GB / 4.85GB 138

附件:
算法工具链
征程6
评论3
0/1000
  • Vincent
    Lv.4

    是不是内存不够了

    2025-10-16
    0
    0
  • 费小财
    Lv.5

    看看是不是内存不够,分配不出来了

    2025-10-16
    0
    0
  • DR_KAN
    Lv.4

    可以用free命令检测下编译过程中的内存占用情况,以及确保本地硬盘的存储空间足够

    2025-10-16
    0
    1
    • 回复DR_KAN:

      更新了hb_compile的log 我想应该不是内存问题,在配置文件夹中把job设置为1,还是会报错error: Allocation failed!

      2025-10-19
      0