环境:
oe 3.5.0
问题1:自研模型qat训练相关的问题
QAT 模型加载后推理输出全 0 且效果异常的问题。
描述:
紫色线是qat训练时候的指标,灰色那个是浮点训练时候的指标在load_state_dict时候,它报了一堆“”Missing key(s) in state_dict:“”,然后我设置成了“”qat_model.load_state_dict(checkpoint["model_state_dict"], strict=False)“”,不报错了,但是模型推理结果完全不对,和qat训练时效果完全不同,不论输入为什么值,输出都是0。
请问:是哪里出错了吗?

部分模型加载代码如下:

问题2:oe提供的模型,出现的问题
使用oe包内qcnet 相关工具库,进行qat 训练,训练一段时间后,loss为nan值(直接用的oe包里的qat代码,参数部分只调整了batchsize,从原始的4*2,调整成了32)
问题3:oe提供的模型,出现的问题
使用正常的qat模型转出hbm模型后,使用hbm定点模型进行推理,报错(数据直接使用oe 提供的工具生成的,参数配置没有改动)


