专栏算法工具链oe 中qcnet 在qat训练是loss为nan

oe 中qcnet 在qat训练是loss为nan

已解决
李先生2025-11-14
27
5
j6m,工具链版本 oe 3.0.31版本,qcnet模型qat 训练一段时间后,loss 为nan,batchszie=32
算法工具链
技术深度解析征程6
评论1
0/1000
  • Vincent
    Lv.4

    你好,这个训练是用的是自己写的代码还是OE包里面的qat示例模型代码?

    2025-11-14
    0
    4
    • 李先生回复Vincent:

      直接用的oe包里的qat代码,参数部分只调整了batchsize,从原始的4*2,调整成了32

      2025-11-14
      0
    • 李先生回复Vincent:
      而且在使用正常的qat模型转出hbm模型后,使用hbm定点模型进行推理,报错
      2025-11-14
      0
    • Vincent回复李先生:

      这个提示是输入数据形状不匹配期望输入[1,1,80,41],但是实际输入是[1,1,80,50]

      2025-11-14
      0
    • Vincent回复李先生:

      检查一下推理输入数据的形状

      2025-11-14
      0