新人翻看ai benchmark代码中,有几个问题:
1. hbDNNTensor中的properties变量里,发现相同通道具有相同的scale,这个理解对吗;
2. 手册里说,scale量化需要减去推理值减去zero_points,然后再乘以scale,但代码中没有减去zero_points,这是为什么啊
3. 板子上模型推理的结果,都是NHWC排布吗
新人翻看ai benchmark代码中,有几个问题:
1. hbDNNTensor中的properties变量里,发现相同通道具有相同的scale,这个理解对吗;
2. 手册里说,scale量化需要减去推理值减去zero_points,然后再乘以scale,但代码中没有减去zero_points,这是为什么啊
3. 板子上模型推理的结果,都是NHWC排布吗


scale可以不一致,和训练的预处理逻辑相关,操作本身可以集成在模型中,所我不需要进行手动写代码,推理的结果排布和你的操作相关
还有疑问:
1. 我这里说的scale是指网络输出时的反量化过程,代码里没有减去zero_points;
2. 推理结果的排布,我问的更具体的操作吧: 比如我原始的onnx模型输出的是nchw的结果,可以通过设置量化的配置参数,使得输出变为nhwc吗,如果有,请问是哪个设置,在我的手册版本里没有这一选项;
3. 我又check了下,输出的数据排布,量化方式,和bin模型强相关。想确认下,在pc端对bin执行hb_perf时产生的结构图中,有输出的layout和数据格式,这个数据格式和layout和部署时模型推理的实际结果是一致的吗