专栏算法工具链直接将原始浮点模型转成bin方法

直接将原始浮点模型转成bin方法

已解决
默认383362025-04-23
19
2

请问我可以将原始浮点模型的onnx直接编译成bin然后部署,不对模型进行量化操作吗?我看其他帖子您说将优化等级设为00,但是在hb_mapper makertbin过程中还是会对校准数据进行处理,感觉还是进行了量化操作

算法工具链
征程5
评论1
0/1000
  • Huanghui
    Lv.5

    你好,这套算法工具链本身就是方面PTQ/QAT量化技术的。不对其量化直接编译部署暂时还没有这个功能。

    2025-04-23
    0
    1
    • 默认38336回复Huanghui:

      好的

      2025-04-23
      0