这个看你能不能接受性能下降。如果你接受不了,那你就使用debug工具跑出算子敏感度列表,把较为敏感的部分算子设置为int 16,其余还是跑int 8。另外,yolo模型按理说int 8量化精度应该不会差很多啊。你是改过模型结构吗?
这里配置的qtype是指的 conv_6 的输入为int16,你显示的int8是该节点的输出类型。你可以配置 conv_6 的下一个节点的qtype为int16,conv_6的output就会显示int16了