专栏算法工具链hrt_model_exec perf 指令报错 HzRsqrt

hrt_model_exec perf 指令报错 HzRsqrt

已解决
luzi2023-05-10
32
7
1.芯片型号X3派
2.天工开物开发包OpenExplorer版本horizon_xj3_open_explorer_v2.4.2_20221227
3.问题定位模型转换<-->板端部署
4.问题具体描述:hrt_model_exec perf 指令报错:layer HzRsqrt has not been registered.

其中的onnx模型和bin模型见下述链接:

https://pan.baidu.com/s/11oDmFJDRZLjZIKHtFW8xYQ 提取码: 9mec

算法工具链
评论2
0/1000
  • 颜值即正义
    Lv.2

    你好,建议更新到OE2.5.2 哈,获取链接为:https://developer.horizon.ai/forumDetail/136488103547258769

    与之类似的帖子,可进行参考:https://developer.horizon.ai/forumDetail/146176821770229949

    2023-05-10
    0
    5
    • luzi回复颜值即正义:

      谢谢,我参照上述帖子,对工具链和docker环境都进行了升级,具体为:

      2.5.2版本,Runtime version = 1.17.3_(3.15.17 HBRT)

      onnx和bin用新的工具链重新进行生成,具体见:

      链接: https://pan.baidu.com/s/1QrDIQbSv9PkBw98bmD3yXA 提取码: bacj

      但是此时出现

      Segmentation fault

      2023-05-11
      0
    • 颜值即正义回复luzi:

      您先试一下单线程能跑通吗

      2023-05-11
      0
    • luzi回复颜值即正义:

      单线程可以跑通

      2023-05-11
      0
    • 颜值即正义回复luzi:

      是这样的,这个模型本身不小,加载会消耗大量的内存,你看单线程下的延迟都有700+ms了。在多线程推理时,每个线程都需要为该任务准备足够的内存,从而导致内存不够报错。可以使用--profile_path="."生成运行日志,看看是什么节点运行时间过长。也可以在模型编译的时候将debug参数设置为True,这样在x86端可以用hb_perf xxx.bin方式生成静态性能评测日志html文件,查看每一个BPU算子的大致耗时。

      2023-05-11
      0
    • luzi回复颜值即正义:

      好的,谢谢~

      2023-05-11
      0
  • 颜值即正义
    Lv.2
    2023-05-10
    0
    0