模拟器是根据对一个大的卷积进行分块后小卷积计算事件的累加,其中每个小卷积的时间是根据硬件的频率、卷积核大小、卷积类型、输入输出通道数等参数计算出来的。从宏观上看,卷积计算的OPS和卷积时间是呈正比的;从微观上看,OPS与时间的关系受各种参数的影响。比如,卷积参数刚好跟BPU硬件TAE的计算结构适配,硬件直接算就完事了,没有额外消耗;反之,相同OPS下,但是卷积参数很诡异,形状也很诡异,编译过程会对其进行分块,那么除了计算之外,还有各种数据重排、数据填充、冗余计算等在里面,即引入了一些冗余计算,那么时间就会增加。 也就是体现在OPS和cost time不成正比。