1. 芯片型号:J5
2. 天工开物开发包 OpenExplorer 版本: J5_OE_1.1.77
3. 问题定位:板端部署
4. 问题具体描述:请问模型的实际算力怎么评估?
比如我们有一个模型,使用板端工具./hrt_model_exec perf评估模型的最大帧率,模型已完成优化,不存在受ddr瓶颈影响速度的问题,
第一种算法:perf时通过hrut_somstatus查看单bpu负载一直为100%,此时模型的单bpu单线程帧率为100fps。
板端实际部署时需要的帧率的10fps,那可以说这个模型的bpu算力需求是64X10/100=6.4TOPS吗?
或者第二种算法:模型在板端实际运行时,以10fps推理,hrut_somstatus看出模型的单bpu占用在20%左右浮动,那么64x0.2=12.8tops
请问可以用这两种方式计算模型的实际算力需求吗?哪种方式更合理一些

