专栏算法工具链工具链模型转换算子在 BPU 未支持

工具链模型转换算子在 BPU 未支持

已解决
tripleMu2023-03-04
96
5
1.芯片型号:X3派
2.天工开物开发包OpenExplorer版本:XJ3_OE_2.4.2
3.问题定位:模型转换
4.问题具体描述:
编译量化模型时出现以下信息:
查阅工具链 ONNX 算子 BPU 支持如下:
image.pngimage.png
然后查看 ONNX 算子的属性:
image.pngimage.png
image.pngimage.png
上面警告的 Mul 算子输入均满足 BPU 支持,但是仍然执行在 CPU 上。这个结构是 SiLU 中的,大部分 YOLO 系列都用了 SiLU,所以都没法在 BPU 跑。
除此之外还有下面两个 Concat:
image.pngimage.png
查看 ONNX 算子输入:
image.pngimage.png
也是满足条件的,但是也未执行在 BPU。
希望能够解决 BPU 算子支持的问题,这样才能给 YOLO 系列算法更好的加速。
算法工具链
评论4
0/1000
  • 颜值即正义
    Lv.2

    您好,方便提供一下模型吗?通过百度网盘即可

    2023-03-04
    0
    1
    • tripleMu回复颜值即正义:

      链接: https://pan.baidu.com/s/1gD6NljkVyiRhmvPgdZDUOA 提取码: 9xrv

      --来自百度网盘超级会员v4的分享

      2023-03-04
      0
  • 颜值即正义
    Lv.2

    您好,先回答您的第二个问题,关于concat算子跑在cpu上的问题,建议您参考这篇文章:https://developer.horizon.ai/forumDetail/118364000835765793,里面有介绍为什么您的这个模型结构中concat算子跑在了CPU上。

    2023-03-06
    0
    0
  • 颜值即正义
    Lv.2

    您好,关于SiLu结构的实现,内部是会拆分成sigmoid+mul,由于X3硬件的限制,此时mul的约束会变成查表算子的约束,继而导致其跑在了CPU上,关于查表算子限制,可以参考sigmoid的约束,如下图所示。

    如果因此导致模型性能不能满足您的预期,建议您将silu变成rulu或者relu6来提升模型的性能。

    2023-03-06
    0
    0
  • 颜值即正义
    Lv.2
    2023-04-24
    0
    0