您好,由于硬件特性,只有conv支持int32高精度输出,若模型以其他算子结尾,则只能以int8输出,然后接一个反量化算子变成float32。由于argmax算子原始计算精度为int64,所以会有一个cast用来完成int8->int64,另外原来模型输出是三维的,所有会有reshape用来完成4维->3维。 如果您觉得这两个算子耗时过长,可以使用hb_model_modifier工具将这两个cpu节点删除,并在后处理中完成对应计算。