在QAT示例中,直接下载如下四个pth模型:

在docker中运行export_onnx脚本,根据代码所示,转换的应该是qat-checkpoint这个pth模型
至此,得到了一个onnx模型,结构如下

按照标准PTQ流程转换为bin模型,与qat/runtime中的hbm模型同时发送至板端,使用hrt_model_exec对两个模型进行动态评估,结果如下:


可以看到,QAT与PTQ模型得到的性能差异巨大
由于可以确认QAT及PTQ使用的pth模型没有差异,请问造成性能差异的原因在哪里呢
难道是QAT中的compile工具和PTQ中的maker_bin工具中的编译选项之类的有区别么??
