各位大佬好:
1. 请问在yaml文件中移除尾部的反量化算子之后,自己在CPU上做反量化运行速度会不会更快?
2.地平线采用对称量化,所以zeropoint的数值肯定是0,但是scale的数值是从量化的int8的onnx中自己粘贴复制到代码中去吗,有没有什么办法直接从bin/hbm类型的权重文件中读取,如果有的话,对应的函数接口在哪?
麻烦各位大佬帮忙解答一下,谢谢啦!
各位大佬好:
1. 请问在yaml文件中移除尾部的反量化算子之后,自己在CPU上做反量化运行速度会不会更快?
2.地平线采用对称量化,所以zeropoint的数值肯定是0,但是scale的数值是从量化的int8的onnx中自己粘贴复制到代码中去吗,有没有什么办法直接从bin/hbm类型的权重文件中读取,如果有的话,对应的函数接口在哪?
麻烦各位大佬帮忙解答一下,谢谢啦!
