根据文档,J6E上运行transfomer相关算法的速度可以对标orin-x甚至更高。
已知J6E是80TOPS,ORIN-X是(167GPU+87DLA),BPU中的TAE与VPU对标nvidia的tensorcore和cudacore,且从CNN类算法的运行速度上来看,J6E慢于ORIN-X。
请问J6E是如何做到transformer的加速的?是否可以详细介绍一下
根据文档,J6E上运行transfomer相关算法的速度可以对标orin-x甚至更高。
已知J6E是80TOPS,ORIN-X是(167GPU+87DLA),BPU中的TAE与VPU对标nvidia的tensorcore和cudacore,且从CNN类算法的运行速度上来看,J6E慢于ORIN-X。
请问J6E是如何做到transformer的加速的?是否可以详细介绍一下

