你好,关于这种情况,重新给你回复一下哈:sigmoid即使处于尾部,我们也是支持跑在BPU上的,但会有限制8192。像sigmoid、siLU这种查表算子(通过查表获取数据输出),模型编译时会有内部对齐规则,c对齐8的倍数,H对齐2的倍数,W对齐16的倍数,因此第一个sigmoid函数它的尺寸变为1x8x52x64=26624>8192,超出限制,故跑在CPU上,对于小一点的尺寸,1x8x26x32=6656
您好,建议您对照算子约束列表并根据您的想法尝试一下,导出onnx后,使用hb_mapper checker工具检查一下能否转换成功。关于该算子的对齐规则,我们会在版本更新时增加更详细的说明,感谢您的反馈!