其实PYM输入的多batch模型在部署时做batch拆分更能贴合在芯片上的部署,例如BEV算法的多V输入都是金字塔处理后的NV12数据,拆分成多个PYM输入节点,各自以独立的内存地址传入,是一个比较顺畅的部署流程。虽然拆分成多个输入,但模型在芯片上的推理仍是按batch的模型进行,该有的效率一点不会少。不知道您在使用中对PYM输入进行拆分batch有何不便之处?欢迎吐槽