你好,经过测试:可以确认:
1、输入链路(多输入的顺序name / shape / dtype)与浮点基线完全一致(对比原始 ONNX,bc,hbm的输入打印);
2、原始 ONNX、optimized模型的推理的结果精度都是完全正常、calibrated和ptq就失控了(并非误差,而是轨迹完全失真);
3、终端观察到在calibrate阶段有多个警告(出现大量 find inf threshold 和 find non positive threshold 警告,且集中在 注意力模块的 Where, Softmax, Add, Mul 等节点。)
请问目前应该怎么处理,看似不是量化造成的误差。