J5 J5_OE_1.1.741、请问在QAT量化的第一步当中,对浮点模型进行改造,在模型输入前插入 QuantStub,在模型输出后插入 DequantStub的作用是什么?2、可以不在模型里面插入QuantStub和DequantStub吗?
输入端插入量化节点是为了把输入量化为int8,输出插入反量化,是为了把伪量化模型的输出反量化到浮点;另外插入量化反量化的位置也决定了你编译出来的hbm包含哪些结构;输入未被量化的话你在prepare qat的时候就大概率会报错,自然也是编译不出来hbm的,而且J5里,hbm是纯定点模型