专栏算法工具链J6E对Layernorm和softmax的加速在哪个算子上实现?

J6E对Layernorm和softmax的加速在哪个算子上实现?

已解决
XR2024-10-14
118
2

查看芯片设计方案可以看到J6e针对Layernorm和softmax在BPU上实现了加速,请问具体在BPU的哪个芯片上实现了加速?VAE还是VPU?

算法工具链
征程6
评论1
0/1000
  • Huanghui
    Lv.5
    你好,从设计上Layernorm和softmax是通过VPU进行加速的,另外,算子的加速实现是工具链编译优化的同学重点关注的。 从用户使用面只需要根据编译结果查看加速器件事BPU,另外精度是OK的就可以了,无需关心执行计算的具体器件,
    2024-10-14
    0
    1
    • XR回复Huanghui:

      好的感谢您的回答

      2024-10-14
      0