你好,板端hrt_model_exec指定profile_path后,如果模型中存在CPU算子,可以在生成的profiler.log文件中看到CPU算子的执行时间,而BPU时间以一段展示的,无法看到具体每一个算子的执行时间。
如果模型中有cpu算子,那么hrt工具可以看到每个cpu算子的执行时间,而bpu算子只能在静态性能分析报告html里看到每个算子的预估耗时,到了板端,所有bpu算子都做了编译器层面的优化,已经没有单独的bpu算子的概念了,整个bpu子图都转化为了一堆二进制指令,统一运行。