您好,对于qat量化得到的hbm模型,有如下问题想咨询:hbm模型里是既可以有cpu上运行的算子也有bpu上运行的算子么?hbm模型里可以包含浮点运算吗,还是只能是int?j5平台有什么可以查看hbm模型各个算子信息(如数据精度等)的命令? hrt_model_info 这个命令在我的oe包中没有。
你好,不好意思,之前认为成J6的了。1.J5的异构模型是bin的,hbm模型是qat的过程产生的,算子应该都是在BPU上的,跑的是int8, int16的计算。2. hbm模型是编译后的产物,是作为一个整体的节点出现的,没法查看逐个算子的请情况。
你用hbm模型,那应该是QAT吧,QAT流程有专门的python api可以生成量化后的模型可视化结构图的,可以看下手册介绍哈,有个 horizon_plugin_pytorch.quantization.visualize_model