专栏算法工具链ptq生成的bc和hbm用hb_verifier验证一致性不通过

ptq生成的bc和hbm用hb_verifier验证一致性不通过

解答中
AnnieLittleYu2026-01-27
121
31

1.J6

2.OE 3.2.0

问题:ptq生成的bc和hbm用hb_verifier验证一致性不通过

(附件删除后目前没有办法再上传了)

算法工具链
征程6
评论2
0/1000
  • AnnieLittleYu
    Lv.1

    模型输入没有任何预处理,只是在配置中设置了 {"input_no_padding": True, "output_no_padding": True} ,另外也没有设置任何remove_node_type

    2026-01-27
    0
    7
    • Huanghui回复AnnieLittleYu:

      3.5.0版本也试过了吗?enable_vpu的状态有设置吗?

      2026-02-02
      0
    • AnnieLittleYu回复Huanghui:

      用的命令是这样的,hb_verifier -m 20260118_e83626e_epoch_49_quantized_removed_model.bc,20260118_e83626e_epoch_49.hbm -i Quant_Data/input_img/cali_sample_0000.npy,Quant_Data/navigation/cali_sample_0000.npy,Quant_Data/ego_feature/cali_sample_0000.npy --ip 10.253.22.212,请问 enable_vpu 在哪里设置。现在这个模型输入是feature type

      2026-02-03
      0
    • Huanghui回复AnnieLittleYu:

      20260118_e83626e_epoch_49_quantized_removed_model.bc为啥是这个,你 remove 啥了?先不remove任何东西看看

      2026-02-03
      0
    • Huanghui:

      如果还有问题,把模型、yaml, 1帧校准数据通过云盘分享过来看看

      2026-02-03
      0
    • AnnieLittleYu回复Huanghui:

      这个是后面试了去除反量化算子,没有去除的也试了(就是上面的bc和hbm替换为没有去除的),结果没有啥差别

      2026-02-03
      0
    • AnnieLittleYu回复Huanghui:

      好的好的,回头我通过云盘分享一下全部的,暂时先把hbm和bc通过这个链接上传了

      2026-02-03
      0
    • AnnieLittleYu回复Huanghui:

      (这个里面放了一帧量化数据)通过网盘分享的文件:qifei.rar 链接: https://pan.baidu.com/s/1AZ5sRnlG6OkMWhjI11qf7Q?pwd=imbr 提取码: imbr

      2026-02-04
      0
  • YCJ
    Lv.4

    你好,使用 hb_verifier 的时候是对比的bc和开发机仿真环境下的hbm结果?板端hbm和bc的结果对比了吗

    2026-01-27
    0
    22
    • AnnieLittleYu回复YCJ:

      hb_verifier 工具使用的是仿真环境下的hbm结果和bc对比

      2026-01-27
      0
    • AnnieLittleYu回复YCJ:

      另外我们用sess_hbm.run也跑了一下bc和hbm在docker里的输出,和我们板端录下来的对比了一下,发现三者也有差异,但是差异远没有用hb_verfier这个工具报的大。所以觉得这个工具有问题

      2026-01-27
      0
    • YCJ回复AnnieLittleYu:

      仿真环境不太稳定,你使用 --ip 参数,到板端去推理hbm,看看和bc的对比结果。

      2026-01-27
      0
    • AnnieLittleYu回复YCJ:

      好的,谢谢

      2026-01-27
      0
    • AnnieLittleYu回复YCJ:
      试了一下还是不行,而且这个bc和hbm是一个ptq过程中生成的,请问还有什么排查方向吗?
      2026-02-02
      0
    • YCJ回复AnnieLittleYu:

      看起来确实有点奇怪,按理说同一个ptq过程生成的不应该出现这种现象。你方便上传一下模型不,我这边复现一下,查一下原因。

      2026-02-02
      0
    • YCJ回复AnnieLittleYu:

      或者你先换个docker版本,换成3.5.0试一试

      2026-02-02
      0
    • AnnieLittleYu回复YCJ:

      先通过帖子把bc和hbm上传了,回头通过网盘把onnx以及其他配置都上传。麻烦有空看一下,谢谢

      2026-02-03
      0
    • YCJ回复AnnieLittleYu:

      ok,你上传吧,我这边复现一下问题

      2026-02-03
      0
    • YCJ回复AnnieLittleYu:

      你只给我bc和hbm我没法复现

      2026-02-03
      0
    • AnnieLittleYu回复YCJ:

      (这个里面放了一帧量化数据)通过网盘分享的文件:qifei.rar 链接: https://pan.baidu.com/s/1AZ5sRnlG6OkMWhjI11qf7Q?pwd=imbr 提取码: imbr

      2026-02-04
      0
    • YCJ回复AnnieLittleYu:

      好的收到!有进展第一时间和你同步

      2026-02-04
      0
    • YCJ回复YCJ:
      检查一下你给的第一个输入的npy文件,我这里无法加载
      2026-02-04
      0
    • YCJ回复AnnieLittleYu:

      检查一下你给的第一个输入的npy文件,我这里无法加载

      2026-02-04
      0
    • AnnieLittleYu回复YCJ:

      非常不好意思,带来麻烦了,但是这个帖子现在好像上传不了附件了,我新开了一个帖子,传到这里了 ptq生成的bc和hbm用hb_verifier验证一致性不通过——补充上传附件 - 地平线开发者社区

      2026-02-05
      0
    • YCJ回复AnnieLittleYu:
      你好,我验证了一下你的bc和hbm确实不一致。但我使用你给的三个输入npy文件在3.2.0docker中重新编译了新的bc和hbm是能够对齐的。大概率是你docker环境的问题,建议重新装一下3.2.0环境再试一试
      2026-02-06
      0
    • YCJ回复AnnieLittleYu:

      你可以在这个网站找到3.2.0的docker https://oe.horizon.auto/

      2026-02-06
      0
    • AnnieLittleYu回复YCJ:

      用一帧量化然后验证表现和你的一样,但是用全量数据进行量化验证,依然还是会出现failed的情况

      2026-02-12
      0
    • AnnieLittleYu回复YCJ:
      请问一下下一步还可以怎么排查,查量化数据吗?还是减少量化数据的数量?我把全量的数据上传了,麻烦可以再看一下吗?通过百度网盘分享的文件:Quant_Da....zip
      链接:https://pan.baidu.com/s/1cpu_r7G2U1kJ8CZOrKpauQ
      提取码:356m
      复制这段内容打开「百度网盘APP 即可获取」
      2026-02-12
      0
    • YCJ回复AnnieLittleYu:

      好的收到!我这边验证一下,有结果和你同步

      2026-02-12
      0
    • YCJ回复AnnieLittleYu:

      docker环境重装了吗

      2026-02-13
      0
    • AnnieLittleYu回复YCJ:

      重装了,而且换了一个服务器,用的网上下载的3.2.0 gpu docker, 一帧量化然后验证的结果也是通过的

      2026-02-13
      0