专栏算法工具链模型检查阶段core dump 无法定位原因

模型检查阶段core dump 无法定位原因

yy12342023-08-23
32
2
1.芯片型号:J5
2.天工开物开发包OpenExplorer版本:J5_OE_1.1.62
3.问题定位:模型转换
4.问题具体描述:你好,之前我也请教过core dump问题,自己尝试解决目前依然没有成功。

与上次求助贴对比,这次的模型我们去掉了地平线算子支持列表中明确不支持的算子类型(只去掉了不支持的算子种类,具体BPU CPU的约束条件还没有一一检查是否满足要求)。

hb_mapper_checker.log文件在附件,我在模型检查时需要调用的一些python代码中加了很多打印, 看下来应该是执行到/usr/local/lib/python3.8/dist-packages/horizon_nn/build.py 的if self.cali_dict_parser.get_calibration_type() in {"load"}:这条语句附近出现的Segmentation fault (core dumped)。 core dump之前的打印:Start to optimize the model这句话我也没有找到是哪个地方打印的,不确定是不是调用了.so的库打印的?做了很多尝试docker内core文件也无法生成,不确定是我们配置问题还是释放的docker不支持。

问题1:类似hb_mapper checker的底层工具,有什么更方便的方法进行调试吗,目前只能加打印找问题

问题2:core dump的模型麻烦再帮我们看一下,看看你们那边能不能更方便的定位到问题。这种问题我们后续要进行什么,目前模型在onnx runtime=1.8.0可以推理,是要先让降级到onnx runtime=1.2.0的版本推理成功再用hb_mapper checker吗

模型文件链接: https://pan.baidu.com/s/13V1AqLsyAfnqEyi_8NGyvg 提取码: 293q

算法工具链
评论2
0/1000
  • 颜值即正义
    Lv.2
    你好,由于当前工具是基于onnx runtime=1.2.0进行开发的,在使用onnx runtime=1.2.0检查模型合法性时退出了,还没到我们的工具链层面,正如在问题2中所描述的,需要先降级到onnxruntime=1.2.0版本成功推理后,再进行模型转换,希望可以提供在onnx runtime=1.2.0可以推理的onnx模型以及脚本~
    2023-08-23
    0
    0
  • 颜值即正义
    Lv.2
    您好,地平线工具链在持续迭代优化,为了给您提供更好的服务,希望您能抽出3分钟左右的时间,将您在使用工具链期间的感受和建议告诉我们,您的宝贵意见对我们很重要,非常感谢!
    问卷链接:地平线算法工具链使用满意度反馈
    2023-09-04
    0
    0