校准模型掉点非常厉害

已解决

ZQQ2026-01-26

172

在量化yolo系列的模型时，浮点模型与校准模型相比，校准模型掉点非常厉害，这是为什么，有大佬知道吗？其中校准集随机抽取了训练集的484张

算法工具链

技术深度解析征程6

0/600

YCJ
Lv.4
您好！请您提供一下以下信息：开发板型号；工具链版本；ptq or qat；掉点严重是指的校准模型在测试集上的map值下降严重？
2026-01-26
0
27
- YCJ回复YCJ:
  大概率是校准数据的准备有误
  2026-01-26
  0
  回复
- ZQQ回复YCJ:
  J6M，工具链是OE包的，horizon_j6_open_explorer_v3.2.0，量化使用的ptq，校准模型在测试集上的每个类别的map值下降10+个点
  2026-01-26
  0
  回复
- ZQQ回复YCJ:
  不太可能把？校准集不是从训练集里面抽取吗？
  2026-01-26
  0
  回复
- ZQQ:
  校准集也是经过预处理的之后保存的npy文件
  2026-01-26
  0
  回复
- YCJ回复ZQQ:
  应该是量化流程上有些地方没走对，你可以检查一下你的校准集的准备是否正确，要与yolo前处理一致。方便的话可以贴一下你的yaml文件，我帮你分析分析
  2026-01-26
  0
  回复
- ZQQ回复YCJ:
  2026-01-26
  0
  回复
- ZQQ回复YCJ:
  前处理完全是和yolo一样的，量化hbm模型单帧推理结果和浮点模型结果差不多，但是跑评测集的指标就差很多
  2026-01-26
  0
  回复
- YCJ回复ZQQ:
  你方便分享你的工程不，方便的话放百度网盘，我这边帮你验一下
  2026-01-26
  0
  回复
- ZQQ回复YCJ:
  公司无法上传模型文件到外网，您这边方便提供下你这边验证的方法或者定位问题的步骤吗
  2026-01-26
  0
  回复
- YCJ回复ZQQ:
  “量化hbm模型单帧推理结果和浮点模型结果差不多”，这里的差不多的标准是啥，怎么去对比的？是可视化后直接看的，还是比较了output的余弦相似度？
  2026-01-27
  0
  回复
- YCJ回复ZQQ:
  按理说如果单帧推理精度达标，应该不存在评测集指标差的情况。所以您这里的差不多是如何判断的？
  2026-01-27
  0
  回复
- ZQQ回复YCJ:
  单帧可视化结果对比看了，然后使用coco评测方法，对比了测试集的每个类别的map值
  2026-01-30
  0
  回复
- ZQQ回复YCJ:
  直接对比看检测框的坐标和score,对比坐标最大差10几个像素，感觉还行
  2026-01-30
  0
  回复
- YCJ回复ZQQ:
  所以现在的问题还是：单帧推理精度ok，跑测试集掉点非常严重？
  2026-01-30
  0
  回复
- ZQQ回复YCJ:
  是的，但是我单帧只是随机抽了几张推理，
  2026-01-30
  0
  回复
- YCJ回复ZQQ:
  这样吧，你的yaml文件配置一下全int16，重新编译一个出来，再去测一测
  2026-01-30
  0
  回复
- ZQQ回复YCJ:
  好的，我试试，多谢
  2026-01-30
  0
  回复
- ZQQ回复YCJ:
  2026-01-30
  0
  回复
- ZQQ回复YCJ:
  2026-01-30
  0
  回复
- ZQQ回复YCJ:
  我在配置文件中，添加了all_node_type:"int16",量化数据类型显示int8，这正常吗
  2026-01-30
  0
  回复
- YCJ回复ZQQ:
  不能这样写，要按照我截图的方式写在 quant_config，不然工具链识别不到
  2026-01-30
  0
  回复
- ZQQ回复YCJ:
  改成int16后,校准模型_calibrated_model_onnx 在评测集上掉点正常(map掉点
  2026-01-30
  0
  回复
- YCJ回复ZQQ:
  这个看你能不能接受性能下降。如果你接受不了，那你就使用debug工具跑出算子敏感度列表，把较为敏感的部分算子设置为int 16，其余还是跑int 8。另外，yolo模型按理说int 8量化精度应该不会差很多啊。你是改过模型结构吗？
  2026-02-02
  0
  回复
- ZQQ回复YCJ:
  没有改过模型结构，基于MMYOLO框架训的
  2026-02-02
  0
  回复
- ZQQ回复YCJ:
  
  在配置中设置了节点为int16,但是输出日志显示还是int8,这是为啥？为啥有的节点的量化相似度没有阿？是--
  2026-02-02
  0
  回复
- YCJ回复ZQQ:
  这里配置的qtype是指的 conv_6 的输入为int16，你显示的int8是该节点的输出类型。你可以配置 conv_6 的下一个节点的qtype为int16，conv_6的output就会显示int16了
  2026-02-02
  0
  回复
- ZQQ回复YCJ:
  好的，谢谢
  2026-02-04
  0
  回复