专栏算法工具链hrt_model_exec perf 耗时的解释

hrt_model_exec perf 耗时的解释

已解决

渚2025-07-01

81

0

0

4

profiler.log里的 model_latency 中的耗时是这个op的耗时还是相当于设置节点，从开始到这个op的一个整体耗时，比如说下面的第一个显示node 节点

"model_latency": {

"Node-0-BPU-onnx::Concat_1296_calibrated_HzCalibration_id_878_bpu_segment_0": {

"avg_time": 206.67495499999998,

"max_time": 206.898,

"min_time": 206.458

},

附件:

profiler.zip

算法工具链

征程6

评论2

0/600

DR_KAN
Lv.5
每个bpu算子的耗时只能通过编译模型时生成的html查看预估耗时
2025-07-01
1
0
HuangHui
Lv.5
都不是，是这个segment的耗时，多个bpu的op合并成了一个segment，这里显示的是这个 segment的耗时
2025-07-01
0
2
- 渚回复HuangHui:
  谢谢，我怎么确定是那些op合成了一个segment呀
  2025-07-01
  0
  回复
- 渚回复HuangHui:
  我想颗粒度更细一点，可以对这个segment的op层做一些耗时的显示吗，还是说只能用截断模型的耗时测试耗时
  2025-07-01
  0
  回复

暂无职位信息

0博客

12帖子

1回答