

您好,您可以通过以下方式来进行PTQ的精度调优:1.尝试不同的calibration_type,使用max校准并尝试不同的分位值max_percentile;2.开启per_channel量化;3.对余弦相似度低的算子强制运行在cpu上(run_on_cpu)


Mul_12;GlobalAveragePool_52;Mul_67;GlobalAveragePool_68;Conv_69;Mul_71;Conv_72;Mul_74;Mul_98;GlobalAveragePool_99;Conv_100;Mul_105;Mul_114;GlobalAveragePool_115;Conv_116;Mul_118;Mul_121;GlobalAveragePool_146;Conv_147;Mul_149;Mul_152;GlobalAveragePool_162;Conv_163;Mul_165;Mul_168;Mul_177;GlobalAveragePool_178;Mul_184;GlobalAveragePool_194;Conv_195;Mul_197;GlobalAveragePool_209;GlobalAveragePool_225;Conv_226;Mul_228;Mul_231;GlobalAveragePool_241;Conv_242;Mul_247;GlobalAveragePool_272;Mul_278;GlobalAveragePool_288;Conv_289;Mul_291;Mul_294;GlobalAveragePool_304;Conv_305;Mul_307;Mul_310;Mul_319;GlobalAveragePool_320;Conv_321;Mul_323;Conv_324;Mul_326;Mul_335;GlobalAveragePool_336;Conv_337;Mul_339;Mul_342;Mul_350;GlobalAveragePool_351;Mul_357;Conv_358_sub1;Conv_358_sub2;Mul_362;AveragePool_364;Sigmoid_367;Clip_374;Sigmoid_382;Sigmoid_384;Clip_389;Sigmoid_397;Sigmoid_399;Clip_404;Conv_411;Sigmoid_412;Sigmoid_414;Clip_419

我这里报的错和你的不一样:
ERROR *** ERROR-OCCUR-DURING {runtime.runtime_model_generation} ***, error message: HorizonRT not support these cpu operators: HzSwish
不需要配置这么多算子都run_on_bpu哈,建议试一下我们的PTQ精度debug工具,尝试一下相关调优措施,参考链接:
4.1.2.11. 精度debug工具 — Horizon Open Explorer
【PTQ精度debug示例】mnasnet_1.0_96精度问题分析 (horizon.cc)
【PTQ精度debug示例】MobileVit_s精度问题分析 (horizon.cc)
【PTQ精度debug示例】repvgg_b2_deploy精度问题分析 (horizon.cc)
另外还有配置int16量化的方法:

您好,我使用了精度debug工具,普通节点、权重节点和激活节点的量化误差都不明显,但量化过程中很多算子误差很大,强制cpu运行的方法始终有报错,能帮我分析一下这些算子run_on_cpu的报错吗:
GlobalAveragePool_52;GlobalAveragePool_68;Conv_69;Conv_72;Mul_74;GlobalAveragePool_99;Conv_100;Mul_105;GlobalAveragePool_115;Conv_116;Mul_121;GlobalAveragePool_146;Conv_147;Mul_152;GlobalAveragePool_162;Conv_163;Mul_168;GlobalAveragePool_178;Mul_184;GlobalAveragePool_194;Conv_195;GlobalAveragePool_209;GlobalAveragePool_225;Conv_226;Mul_231;GlobalAveragePool_241;Conv_242;Mul_247;GlobalAveragePool_272;Mul_278;GlobalAveragePool_288;Conv_289;Mul_294;GlobalAveragePool_304;Conv_305;Mul_310;GlobalAveragePool_320;Conv_321;Conv_324;Mul_326;GlobalAveragePool_336;Conv_337;Mul_342;GlobalAveragePool_351;Mul_357;Conv_358_sub1;Conv_358_sub2;AveragePool_364;Sigmoid_367;Clip_374;Sigmoid_382;Sigmoid_384;Clip_389;Sigmoid_397;Sigmoid_399;Clip_404;Conv_411;Sigmoid_412;Sigmoid_414;Clip_419

