专栏算法工具链ptq导出模型,下面的结果报错Allocation failed!

ptq导出模型,下面的结果报错Allocation failed!

已解决
2025-10-20
425
31


这个结构使用hb_compile报错:Allocation failed! 
这个有什么不合理的地方么,资源不够?还有什么地方会影响这个导出呢,
docker中的shm-size已经设置为600M

https://developer.horizon.auto/forum/766558256234696704

这个帖子有相关的log和资源占用命令

算法工具链
征程6
评论1
0/1000
  • Vincent
    Lv.4

    你好,要不你把配置和模型打包发给我吧,我这边也编译一下试试。邮箱hqliu666@163.com

    2025-10-20
    0
    30
    • 回复Vincent:

      感谢支持

      已发送,解压后直接运行hb_compile --config bev_fushion.yaml

      期待回复zuoyi_org.svg
      2025-10-20
      0
    • Vincent回复:

      收到。

      2025-10-20
      0
    • Vincent回复:

      这个是3.0.31版本吗

      2025-10-20
      0
    • 回复Vincent:

      是的

      2025-10-20
      0
    • 回复Vincent:

      hi,可以复现我的报错么

      2025-10-20
      0
    • Huanghui回复:

      复现了的 一样的问题 allocate failed目前正在分析原因

      2025-10-20
      0
    • Huanghui:

      我尝试换一下工具链的版本。可能是hbdk问题

      2025-10-20
      0
    • Huanghui回复:

      正在编译,有结果了告知您

      2025-10-20
      0
    • 回复Huanghui:

      好的,感谢

      2025-10-21
      0
    • Huanghui回复:

      你好,我用正常hb_compile确实还是会报错 ,但是是与空值Nan相关的 ,然后用快速编译没问题 ,我觉得是不是有可能是你的校准集太少了,而里面又刚好有异常值,我觉得你可以重新弄一下校准集,多选一些校准数据。重新编译一下试试看

      2025-10-21
      1
    • 回复Huanghui:

      明白,我再试试

      2025-10-21
      0
    • Vincent回复:

      还会有这个问题嘛

      2025-10-21
      0
    • 回复Huanghui:

      1.经过测试,输入的校准数据集是没有nan值的

      2.重新跑了数据集(100帧);还是同样的报错allocate failed

      3.您可以那随机数据作为校正数据集测试一下;看是不是依然有这个报错

      4.快速编译没问题,可以断定hb_compile也没问题是么

      2025-10-21
      0
    • 回复Vincent:

      是的,可以那随机数据作为校验集测试一下,hb_compile对于这个模型的链路哪里出了问题么

      2025-10-21
      0
    • Vincent回复:

      换3.5.0试试呢

      2025-10-21
      0
    • Vincent:

      昨晚我用的3.5.0快速编译是可以的正常hb_compile是报了Nan错误,你用新的校准集 然后用正常编译试试3.5.0的

      2025-10-21
      0
    • 回复Vincent:
      2025-10-21
      0
    • Vincent回复:

      好的稍等

      2025-10-21
      0
    • Vincent回复:

      这个比较大 ,我得先从服务器load下来然后在发给你可能比较久

      2025-10-21
      0
    • Vincent回复Vincent:

      或者 你把新的校准集发给我我这边 试试

      2025-10-21
      0
    • 回复Vincent:
      已发,感谢支持xianhua_org.svg
      2025-10-21
      0
    • 回复Vincent:

      hi,有进一步的结论么

      2025-10-22
      0
    • Vincent回复:
      我现在用你了发的那个新校准集然后还是遇到这个问题,然后那个3.5.0的docker太大了没法的发给你 我问问其他人看看能不能从什么地址直接下载
      2025-10-22
      0
    • Vincent回复:
      2025-10-22
      0
    • Vincent回复:

      我现在按照模型的输入重新生成一些随机校准集 重新编译下看看会不会报错

      2025-10-22
      0
    • 回复Vincent:

      好的,谢谢

      2025-10-22
      0
    • 回复Vincent:

      /usr/local/lib/python3.10/dist-packages/hmct/quantizer/calibrater/activation/set_constant_threshold_and_scale.py:39: RuntimeWarning: invalid value encountered in double_scalars grid_scale_y = ha / 2 ** (interp_bit_num - 1 + s) / (input_h - 1)有这么一个报错,可以通过加什么参数知道是那一层的问题么;在hb_compile中

      2025-10-22
      0
    • Vincent回复:

      你用的最新的3.5.0的docker嘛我暂时没遇到这个问题哎遇到的是其他问题,校准时候阈值存在Nan值

      2025-10-22
      0
    • 回复Vincent:
      使用的3.5.0的docker,你可以检查一下hb_homile.log;
      2025-10-22
      0
    • 回复Vincent:

      修改源码,成功导出了模型,具体情况发您邮箱了

      2025-10-22
      0