您好,对于ptq和qat量化方式,有两个问题想咨询一下:
如果qat量化只进行算法工具链文档中介绍的获取浮点模型与calibration这两个步骤,那与直接按ptq量化得到的结果有区别吗?
J5支持将ptq量化产生的onnx或bin转为hbm模型么?
您好,对于ptq和qat量化方式,有两个问题想咨询一下:
如果qat量化只进行算法工具链文档中介绍的获取浮点模型与calibration这两个步骤,那与直接按ptq量化得到的结果有区别吗?
J5支持将ptq量化产生的onnx或bin转为hbm模型么?
