您好,想问一下在ptq量化中我看可以自己设置某些算子的量化精度为int8/int16,但如果只设置部分算子的话,模型量化后各个算子的数据精度不一致,其在给输入数据实际运行时是怎么处理的?另外qat量化方式中有什么方式可以设置量化精度吗?
你好,对于PTQ,量化精度配置的输入的精度,工具链会尽量按照用户的配置进行量化,但是如果有不支持的情况,比如某个算子配置了int16的输入,但是如果上一个算子的输出只支持int8,工具链会选择自动回退配置到int8。QAT的量化精度是从全局到具体逐步细化的,配置可以根据阶段(calib还是qat)优先采用 qconfig 模板,然后再根据具体的case,调整不同层的qconfig。