fake_quant:待分析的模型可以是精度掉点的 calibration 模型,此时基准模型可以是原始浮点模型或者一个精度达标的 int8/int16 混合配置的 calibration 模型。
pre_export:待分析的模型是查表转定点的伪量化模型,基准模型是对应的原始伪量化模型。
export:待分析的模型是伪量化 hbir 模型,基准模型是对应的查表转定点的伪量化模型。
convert:待分析的模型是定点 hbir 模型,基准模型是对应的查表转定点的伪量化模型。
PTQ的话通常是float校准得到calibration转换到qat.bc再定点化得到quantized.bc了。
