专栏底层软件量化部署问题

量化部署问题

已解决

xiaoming2023-04-25

65

0

1

2

新人翻看ai benchmark代码中，有几个问题:

1. hbDNNTensor中的properties变量里，发现相同通道具有相同的scale,这个理解对吗;

2. 手册里说，scale量化需要减去推理值减去zero_points，然后再乘以scale,但代码中没有减去zero_points,这是为什么啊

3. 板子上模型推理的结果，都是NHWC排布吗

底层软件

征程3

评论1

0/600

Horizon_guosheng
Lv.1
scale可以不一致，和训练的预处理逻辑相关，操作本身可以集成在模型中，所我不需要进行手动写代码，推理的结果排布和你的操作相关
2023-04-26
0
1
- xiaoming回复Horizon_guosheng:
  还有疑问:
  1. 我这里说的scale是指网络输出时的反量化过程，代码里没有减去zero_points;
  2. 推理结果的排布，我问的更具体的操作吧: 比如我原始的onnx模型输出的是nchw的结果，可以通过设置量化的配置参数，使得输出变为nhwc吗，如果有，请问是哪个设置，在我的手册版本里没有这一选项;
  3. 我又check了下，输出的数据排布，量化方式，和bin模型强相关。想确认下，在pc端对bin执行hb_perf时产生的结构图中，有输出的layout和数据格式，这个数据格式和layout和部署时模型推理的实际结果是一致的吗
  2023-04-26
  0
  回复

暂无职位信息

0博客

1帖子

3回答