您好,hbtl_call_quant_qcast和hbtl_call_quant_dcast分别对应的是Quantize和Dequantize,也就是量化和反量化节点。你可以通过在yaml文件的model_parameters配置节中通过配置:remove_node_type: Quantize; Dequantize;来移除他们。
另外:你通过命令"hb_compile --fast-perf --model fcos3d.onnx --march nash-m"生成的输出文件中存在fcos3d_quantized_removed_model.bc就已经是一出了hbtl_call_quant_qcast和hbtl_call_quant_dcast之后的模型了,而fcos3d.hbm作为fcos3d_quantized_removed_model.bc的编译结果也是移除了hbtl_call_quant_qcast和hbtl_call_quant_dcast的。
这里提几个建议方便你的查看:
1) 在编译结果目录model_output下面,fcos3d_quantized_model.bc和fcos3d_quantized_removed_model.bc两个bc文件,你可以通过命令hb_model_info fcos3d_quantized_model.bc -v 以及 hb_model_infofcos3d_quantized_removed_model.bc -v 将bc转换为onnx(隐藏目录.hb_model_info下面)查看模型结构。
2)hb_compile --fast-perf 命令执行完成后可以在与model_output同级的隐藏目录.fast_perf下面查看工具自动生成的用于hb_compile --fast-perf执行过程控制的yaml文件,其中可以看到配置细节。
3)通过hrt_model_info查看hbm模型的结构也可以发现其中已经不包含Quantize和Dequantize了。