专栏算法工具链同一个网络结构,有上采样的比没用上采样的模型推理速度更快

同一个网络结构,有上采样的比没用上采样的模型推理速度更快

sjh11097908482023-09-26
23
2

用户您好,请详细描述您所遇到的问题,这会帮助我们快速定位问题~

1.芯片型号:例如X3、X3派、J5等
2.天工开物开发包OpenExplorer版本:例如XJ3_OE_2.4.2,XJ3_OE_1.15.2,J5_OE_1.1.40等
3.问题定位:例如模型转换、板端部署等
4.问题具体描述:请提供运行的命令、报错信息,如果可以的话,可在附件中提供模型供技术支持进行复现

1.X3

3.模型转换和部署

4.:我们在做一个卷积模型部署,但是在实验推理速度时,发现同样的网络结构,删去上采样的比具有上采样的速度更慢。按照我们的理解,少了上采样操作,不是应该推理速度更快吗。能否帮我们复现这个问题,这将决定我们是否可以在这个设备上可以部署,百度网盘里放了config文件以及两个模型文件

链接:https://pan.baidu.com/s/1Ma8tr_nbxCb1j-349YbuWQ?pwd=oglm

提取码:oglm

--来自百度网盘超级会员V3的分享

算法工具链
评论2
0/1000
  • 颜值即正义
    Lv.2
    你好,我这边测试未能复现你的问题,删去Upsample操作对模型FPS提升明显,和常识相符。这种情况的发生有可能是加了Upsample操作使数据尺寸和BPU硬件对齐,少了硬件alignment的耗时,参考这篇文章 在部署时为输入数据做padding (horizon.cc)
    2023-09-26
    0
    0
  • 颜值即正义
    Lv.2
    您好,地平线工具链在持续迭代优化,为了给您提供更好的服务,希望您能抽出3分钟左右的时间,将您在使用工具链期间的感受和建议告诉我们,您的宝贵意见对我们很重要,非常感谢!
    问卷链接:地平线算法工具链使用满意度反馈
    2023-09-26
    0
    0