根据芯片设计手册,J6P拥有560TOPS的算力并拥有4块BPU,请问在运行同一个模型的时候,4块BPU是否可以同时工作
如果可以数据流如何流动,如何控制4个芯片的调度?
如果不可以,在单块芯片大概140TOPS的算力下,J6P在CNN上的推理效率为什么会是nvidia的2.5甚至5.8倍?

根据芯片设计手册,J6P拥有560TOPS的算力并拥有4块BPU,请问在运行同一个模型的时候,4块BPU是否可以同时工作
如果可以数据流如何流动,如何控制4个芯片的调度?
如果不可以,在单块芯片大概140TOPS的算力下,J6P在CNN上的推理效率为什么会是nvidia的2.5甚至5.8倍?

