你好,我看J5和J6的OE包都包含BEV_IPM_TEMPORAL算法,想知道模型的prev_points如何生成?是把BEV采样点从上一帧对齐到当前帧吗?
你好,我看J5和J6的OE包都包含BEV_IPM_TEMPORAL算法,想知道模型的prev_points如何生成?是把BEV采样点从上一帧对齐到当前帧吗?

具体流程如下:
获取上一帧 BEV 特征(prev_bev)
来自上一时刻 Encoder 的输出;
其空间范围与当前帧 BEV Query 对应(如 50×50)。
坐标对齐(关键改动)
再通过 grid_sample 对 prev_bev 进行采样,得到与当前 query 对齐的时序特征。
生成对齐后的 prev_points / prev_bev
对齐后的 prev_bev 与当前 bev_query 拼接,作为 Temporal Self-Attention 的 value 输入;
reference points(ref_2d 或 ref_3d)在时序维度保持一致,确保 attention 计算有效。

计算逻辑可以理解成 3 步:
先根据bev_size和bev_grid生成当前帧固定的 BEV 网格点;
车在全局坐标系中的位置、朝向),再转成同样的 4x4 矩阵给模型前处理使用