在OE包的示例模型里,PTQ的示例模型都是CNN相关的,transformer相关模型都在QAT示例里。请问transformer的模型用PTQ做效果咋样?
有没有每个模型做QAT和PTQ的精度对比表格?
在OE包的示例模型里,PTQ的示例模型都是CNN相关的,transformer相关模型都在QAT示例里。请问transformer的模型用PTQ做效果咋样?
有没有每个模型做QAT和PTQ的精度对比表格?


你好, 这个问题有点范 。如你所说目前PTQ的示例都是相对比较简单的CNN模型,而 对于transformer这类比较复杂的模型目前都在QAT中进行训练和量化的,所以,目前是没有你所说的精度对照表的。
另外,对于 QAT和PTQ 两种量化,不同模型的量化友好性是不同的,不能一概而论的,但整体来说, QAT是相对精度更有保障,同时可期性也更高,这点从二者的原理上也很好理解。但是,必须要说明的是,Transformer类型的模型既可以使用PTQ,也可以使用QAT(量化感知训练),具体取决于多种因素:
1.数据方面: 如果没有足够的带标签数据用于进一步训练,因为PTQ仅执行小型统计数据收集来确定量化参数,无需带标签的数据,所以PTQ更合适
4.量化难度方面:Transformer模型中Softmax、GELU等特殊函数激活值分布复杂,传统PTQ方法通过量化参数变得困难,可能导致较大量化误差。