相同的代码使用J6_22版本和J5_74版本进行了debug,累积误差曲线如下,算子的余弦相似度也低于J5,是J6的误差更大么
J5的校准数据不能直接给J6用。在J6上,校准数据要做mean/std的归一化,而J5不需要。可以检查下是不是这个原因
好的,我试一下
还有没有问题呀?
什么模型是PTQ吗?板端实际推理效果怎么样啊?
PTQ模型,没在板端推理,只测试了静态效果
余弦相似度是参考值,量化误差还是要以实际的精度为准
好的
此问题就先关闭了,如有疑问可再发帖救助。