1、芯片型号:J6E
2、算法工具链:3.0.27
3、问题定位:模型量化
4、问题具体描述:模型在使用hb_compile检查时报错:
模型和源码在附件,麻烦帮忙检查问题原因
1、芯片型号:J6E
2、算法工具链:3.0.27
3、问题定位:模型量化
4、问题具体描述:模型在使用hb_compile检查时报错:
模型和源码在附件,麻烦帮忙检查问题原因


收到,先复现一下,有进展同步你哈~

两个方面:
1. 速度问题:算子运行在CPU上和运行在BPU上跟算子的支持情况已经输入输出约束有关.同样的pytorch模型在不同的版本和OPSET下导出的ONNX的图结构和算子组成可能是不一样的, TQ方式主要就是检测ONNX中的算子,所以有肯能存在不同的支持情况;另外,PTQ支持算子的情况和QAT支持算子的情况也是不一样的,这也可能导致同样的Pytorch模型在QAT是生成的hbm和导出onnx后ptq生成的hbm在运行时的计算器件的存在差异。
2. 精度问题。PTQ的原理和流程相对简单,对量化精度的保持情况是有限的,bev模型相对来说是比较复杂的模型了,一般选用的量化方式还是尽量qat吧,其实这一点从工具量的PTQ&QAT参考示例的分布也有所体现。