地平线J3芯片
遇到问题: hrt_model_exec infer --frame_count 2000 --thread_num=1 --core_id 0 --profiler_path ./ 各位大佬好,请问设置thread_num数量为什么可以提升推理速度呢,我应该如何将多线程用到我的C++代码推理中,额能否提供一下示例,多线程与用BPU双核推理的加速有什么不同呢?
另外问一下,如果训练代码中有归一化的操作,转换模型需要设置scale,yaml中还设置了remove Quantize的算子,是不是本身不会产生归一化再饭归一化,而是直接使用YUV的uint8数据在BPU上及逆行推理,不需要CPU算子进行量化呢?

