纠正一下:prev_feats 和 prev_points 都是 4D 时序输入,不是原始数据里直接固定给的量。prev_feats:上一帧缓存下来的 BEV feature。首帧一般全 0,后续每帧用上一帧模型输出更新。prev_points:历史帧 BEV feature 对齐到当前帧时用的采样坐标。它是根据连续帧的 ego2global 位姿关系在线计算出来的,所以通常每帧都会变。补充一点:points0 是当前帧 BEV -> image 的采样点,主要由 ego2img 决定,因为相机内外参、坐标系定义和前处理保持不变,所以points0 是个可复用的不变量。prev_points 因为每帧 ego2global 位姿关系都会变,所以需要动态计算。计算过程就是:先生成当前帧固定的 BEV 网格点,然后再根据当前帧和历史帧的 ego2global 计算帧间变换,把当前帧 BEV 网格映射到历史帧 BEV 坐标系下,得到历史特征对齐到当前帧时的采样点。prev_feats 则是上一帧缓存下来的 BEV feature,首帧一般置 0,后续每帧用上一帧模型输出更新。