专栏算法工具链Swin-T的输入shape限制

Swin-T的输入shape限制

已解决
HandsomeChen2024-03-08
70
4

1. 芯片型号:J5

2. 天工开物开发包 OpenExplorer 版本:例如 J5_OE_1.1.62

3. 问题定位:模型转换

4. 问题具体描述:我参考Swin-T示例算法,在config中对模型的输入尺寸做了一些改变,由(224,224,3)修改到(320,512,4),在调用compile_and_perf.py时会报错

Expected data shape range of model input tensor from pyramid "arg0[img]" is [[1, 4096],[1, 65536],[1, 65536],[1, 3]], but the data shape is [1,320,512,4]。

请问输入的C维度只能小于等于3吗?期待您的回复,谢谢

5. 如果提供的信息过多,建议进行打包并上传附件至百度网盘

算法工具链
征程5
评论3
0/1000
  • kotei左文亮
    Lv.3

    应该是的,看这个报错的log,第四维的值在1-3之间,而您的值是4,所以报错了。

    2024-03-08
    0
    1
    • HandsomeChen回复kotei左文亮:

      感谢您的回复,请问有什么办法可以转换输入尺寸C维度>3的Swin-T?为什么要有C

      2024-03-08
      0
  • HandsomeChen
    Lv.1
    将input_source由pyramid改为ddr可以解决这个问题。当input_source为pyramid时有C不大于3的限制。
    2024-03-12
    1
    0
  • kotei左文亮
    Lv.3

    这个要去具体的分析这个网络了,可以尝试修改一下网络结构。

    2024-03-11
    0
    0