端到端大模型如何使用J6E/J6M ,模型部署上如何建议? 对于千亿、万亿级别的参数大模型,那么在硬件设计上是否有些额外的要求?
端到端部署会涉及很多问题,模型层面比如全图串接和后端调度,会依赖软件栈不少工作,都在开发和尝试中
当前有一些进展分享么?