有个疑问,我跑了几个网络,根据编译器debug模式分析出来的延时和OP数量换算,x3的算力大概只有1Tops(双核),与官方宣称的5Tops相距较远,请问是我的测试方法有问题或者计算方式不对吗?能否帮忙提供改进的测试方法或者建议,感谢。
我的测试数据如下:op数大概是0.6G,时延是1.6ms,换算一下算力:0.6G/(1.6/1000) = 375Gops,即使算上双核也只有700Gops(单核算力乘以2)。
另外考虑到网络中有不高效的层会拉慢速度,我也根据这个计算方法计算了mobileNetV2每一层卷积的算力,算上双核的的话最多到1Tops。
HBDK version: 3.37.2
model: mobilenet v2
Op: 602,577,152
latency: 1.6ms
Fps (1 core): 626.17
Fps (2 cores) 1252.34

