hbrt4-run-model-nash支持模拟器和板端运行;在相同输入条件下,二者的推理结果是一致的;
hrt_model_exec的单帧latency更加侧重于真实性,不建议与run_bpu_node的时间做对比,因为二者的侧重性不一样;
hbrt4-run-model-nash侧重于功能,比如python前端的hbm_perf和graph.feed接口,调用RemoteBPU的时候,使用的是hbrt4-run-model-nash,用来对比输入与输出是否一致,另外也可以通过HPM获取到一些板端BPU内部的性能数据,用于编译的性能调优;
hrt_model_exec侧重于性能,比如从整个运行链路上查看perf性能,对应到单帧latency,每秒的FPS;
最后,开发过程建议参考hrt_model_exec。