专栏算法工具链PTQ量化到最后一步,hb_compile kill

PTQ量化到最后一步,hb_compile kill

已解决
2025-07-01
50
4
量化模型,最后一步导出hbm,模型hb_compile直接kill了,附件有终端的打印信息,和yaml文件
2025-07-01 07:22:11,932 INFO Start to compile model. [==================================================]100%
bash: line 4: 21318 Killed hb_compile --config bev_fushion_nv12.yaml 

附件:
算法工具链
征程6
评论3
0/1000
  • MaCree
    Lv.1

    这个 kill 看起来是外部发送的指令,可以命令行打个 dmesg |grep kill 看下输出

    2025-07-01
    0
    1
    • 回复MaCree:

      看来是内存吃满了,

      [ 3.231408] thinkpad_acpi: rfkill switch tpacpi_bluetooth_sw: radio is unblocked [ 9.490125] rfkill: input handler disabled [ 33.526418] rfkill: input handler enabled [ 39.747973] rfkill: input handler disabled [102827.108808] pt_main_thread invoked oom-killer: gfp_mask=0x1100cca(GFP_HIGHUSER_MOVABLE), order=0, oom_score_adj=0 [102827.108838] oom_kill_process.cold+0xb/0x10 [102827.109147] [ 1860] 126 1860 115096 144 118784 11 0 gsd-rfkill [102827.109307] [ 3587] 1000 3587 115047 154 122880 4 0 gsd-rfkill [102827.109493] oom-kill:constraint=CONSTRAINT_NONE,nodemask=(null),cpuset=c2e4ebaf0adf7ef0c0c288a235936cbe8875bd6f66b303dfb164519a0d44b30c,mems_allowed=0,global_oom,task_memcg=/docker/c2e4ebaf0adf7ef0c0c288a235936cbe8875bd6f66b303dfb164519a0d44b30c,task=pt_main_thread,pid=1200690,uid=0

      CONTAINER ID NAME CPU % MEM USAGE / LIMIT MEM % NET I/O BLOCK I/O PIDS c2e4ebaf0adf horizon_j6_3.0.31 888.26% 6.92GiB / 31.05GiB 22.29% 1.69MB / 148kB 31.1GB / 3.5GB 51

      我的docker的内存设置的都是无限制,有什么好的办法可以解决这个问题么

      2025-07-01
      0
  • DR_KAN
    Lv.4

    kill一般都是内存不够导致的,建议硬件加内存。。

    2025-07-01
    0
    0
  • 费小财
    Lv.5

    看日志就是内存oom导致的kill的,你可以先把你的线程优先级拉高,这样防止被优先杀掉

    2025-07-02
    0
    0