专栏算法工具链量化过程中,程序卡在某个环节,不动了

量化过程中,程序卡在某个环节,不动了

已解决
皮卡丘2024-07-11
100
8

量化指定模型时,hb_compile工具卡在转换ptq模型到bc模型中,半个小时也没有结束

1. 芯片型号:J6

2. 天工开物开发包 OpenExplorer 版本:horizon_j6_open_explorer_v3.0.17-py310_20240705

3. 问题定位:模型转换

4. 问题具体描述:

运行的命令:hb_compile --model ../models/onnx/occ.onnx --march "nash-m"

卡在这里不动了,之前有等待超过1个小时,也没有结束


附件:
算法工具链
征程6
评论3
0/1000
  • kotei左文亮
    Lv.3

    模型检查时候有没有问题呢?

    2024-07-11
    0
    3
    • 皮卡丘回复kotei左文亮:

      这个就是在模型检查阶段。

      有办法输出更多调试信息吗,我想看到转换op的过程,当前正在转换那个op

      2024-07-11
      0
    • kotei左文亮回复皮卡丘:

      重启docker之后, 这个问题会必现吗?

      2024-07-11
      0
    • 皮卡丘回复kotei左文亮:

      是的,这个问题是必现的

      2024-07-12
      0
  • Huanghui
    Lv.5

    目前判断该模型过大所致,初步观测结果为编译过程内存占用很大,卡住不动只是资源有限条件下一种表现,如果服务器内存较小,可能会触发系统保护机制将进程KILL掉

    2024-07-12
    0
    2
    • 皮卡丘回复Huanghui:

      加大内存到300G,报了新的问题

      2024-07-16
      0
    • 皮卡丘回复皮卡丘:

      hb_compile.log已更新

      2024-07-16
      0
  • 皮卡丘
    Lv.2

    已经解决,有一个op操作矩阵过大导致

    2024-07-17
    1
    0