专栏感知自动泊车端到端算法ParkingE2E介绍

自动泊车端到端算法ParkingE2E介绍

江城子2024-09-30
313
0

       自动泊车端到端算法ParkingE2E介绍

一、算法介绍:

自主泊车是智能驾驶领域中的一项关键任务。传统的泊车算法通常使用基于规则的方案来实现。然而,这些方法在复杂泊车场景中的有效性较低,因为算法设计复杂。相比之下,基于神经网络的方法往往比基于规则的方法更加直观和多功能。通过收集大量专家泊车轨迹数据,并通过基于学习的仿人策略方法,可以有效解决泊车任务。在本文中,我们采用模仿学习来执行从RGB图像到路径规划的端到端规划,通过模仿人类驾驶轨迹。我们提出的端到端方法利用目标查询编码器来融合图像和目标特征,并使用基于Transformer的解码器自回归预测未来的航点。我们在真实世界场景中进行了广泛的实验,结果表明,我们提出的方法在四个不同的真实车库中平均泊车成功率达到了87.8%。实车实验进一步验证了本文提出方法的可行性和有效性。

输入:1. 去完畸变的RGB图 2. 目标停车位

输出:路径规划

论文链接:ParkingE2E.pdf

论文精读博客参考链接:https://blog.csdn.net/qq_45933056/article/details/140968352

源代码:https://github.com/qintonguav/ParkingE2E


二、算法部署后的demo效果展示


三、实现过程

算法整体架构:

多视角 RGB 图像被处理,图像特征被转换为 BEV(鸟瞰图)表示形式。使用目标停车位生成 BEV 目标特征。我们通过目标查询将目标特征和图像 BEV 特征融合。然后我们使用自回归的 Transformer 解码器逐个获得预测的轨迹点。


训练过程:

注:训练数据集是去完畸变的图像,在数据处理时需要对4路鱼眼相机进行标定,获取相机内外参,对鱼眼图进行去畸变,去完畸变的图像会被制作成训练集


1.获取去完畸变的RGB图像和目标停车位做为输入

去完畸变的RGB图像示例:

目标停车位坐标示例:

  1. 使用EfficientNet从RGB图像中提取特征

  2. 将预测的深度分布 ddep 与图像特征 Fimg 相乘,以获得具有深度信息的图像特征

  3. 将图像特征投影到 BEV 体素网格(特征的大小为200×200,对应实际空间范围x∈[−10m, 10m], y∈[−10m, 10m],分辨率为0.1米)中,生成相机特征 Fcam

BEV视图示例:

  1. 使用深度 CNN 神经网络提取目标停车位特征 Ftarget

  2. 在BEV空间,将相机特征 Fcam和目标停车位特征 Ftarget 进行融合,获取融合特征 Ffuse

  3. 使用 Transformer 解码器以自回归方式预测轨迹点


实现过程图标表示:

推理过程:

1.在RViz界面软件中使用“2D-Nav-Goal”来选择目标停车位

2.获取起始位姿,将以起始点为原点的世界坐标转化为车辆坐标

3.组合数据输入到transformer进行推理,预测轨迹序列

4.将预测的轨迹序列发布到rviz进行可视化

四、评估指标

端到端实车评估:在实车实验中,我们使用以下指标来评估端到端停车性能。

关键词解释:

  PSR:停车成功率 NSR:无车位率 PVR: 停车违规率 APE:平均位置误差 AOE:平均方向误差

  APS:平均停车得分 APT: 平均停车时间


五、局限性

  1. 由于数据规模和场景多样性的限制,我们的方法对移动目标的适应性较差

  2. 训练过程需要专家轨迹

  3. 与传统的基于规则的停车方法相比仍有差距

感知
技术深度解析
评论0
0/1000