专栏算法工具链hrt_model_exec perf 耗时的解释

hrt_model_exec perf 耗时的解释

已解决
2025-07-01
70
4

profiler.log里的 model_latency 中的耗时是这个op的耗时还是相当于设置节点,从开始到这个op的一个整体耗时,比如说下面的第一个显示node 节点

"model_latency": {
"Node-0-BPU-onnx::Concat_1296_calibrated_HzCalibration_id_878_bpu_segment_0": {
"avg_time": 206.67495499999998,
"max_time": 206.898,
"min_time": 206.458

},

附件:
算法工具链
征程6
评论2
0/1000
  • DR_KAN
    Lv.4

    每个bpu算子的耗时只能通过编译模型时生成的html查看预估耗时

    2025-07-01
    1
    0
  • Huanghui
    Lv.5

    都不是,是这个segment的耗时,多个bpu的op合并成了一个segment,这里显示的是这个 segment的耗时

    2025-07-01
    0
    2
    • 回复Huanghui:

      谢谢,我怎么确定是那些op合成了一个segment呀

      2025-07-01
      0
    • 回复Huanghui:

      我想颗粒度更细一点,可以对这个segment的op层做一些耗时的显示吗,还是说只能用截断模型的耗时测试耗时

      2025-07-01
      0