专栏算法工具链多batch推理

多batch推理

已解决

求知求学的搬砖人2024-06-03

102

0

0

4

多batch推理PYM输入数据需要拆分输入数据，是否后面会完善？是否会支持J5不支持的动态多batch推理？

算法工具链

征程6

评论3

0/600

Pipeline
Lv.2
你好，前期工具链版本迭代过程需要拆分输入数据，后面成熟版本不需要。预计会支持动态多batch推理，但实现时间较晚。
2024-06-03
0
1
- 默认49312回复Pipeline:
  想请问下现在支持了吗
  2025-03-12
  0
  回复
gaoh
Lv.1
pym输入多batch需拆分batch维度，这一点会在后续版本优化，支持用户灵活选择独立地址or连续地址，具体形式待定；后续会支持动态多batch推理
2024-06-03
0
0
我是默默
Lv.1
其实PYM输入的多batch模型在部署时做batch拆分更能贴合在芯片上的部署，例如BEV算法的多V输入都是金字塔处理后的NV12数据，拆分成多个PYM输入节点，各自以独立的内存地址传入，是一个比较顺畅的部署流程。虽然拆分成多个输入，但模型在芯片上的推理仍是按batch的模型进行，该有的效率一点不会少。不知道您在使用中对PYM输入进行拆分batch有何不便之处？欢迎吐槽
2024-06-13
0
0

求知求学的搬砖人

暂无职位信息

0博客

3帖子

0回答