BEV图像处理对自动驾驶系统的性能优化( 二 )


而在整个雷达处理端口 , 接收整个激光雷达和毫米波雷达输入 , 再进行点云拼接 , 然后利用点云朵人物模型进行3D检测和语义分割 , 结果输入视觉和点云融合模型进行增强的道路俯视图语义分割并生成动态目标3D检测 , 最后生成语义预测模型 。
BEV的这种道路布置输出对于自动驾驶开发来说是非常好的一种检测能力 , 基本可以看成一种伪高精地图 , 甚至可以实现车道级的定位和预测 , 并且实时性相对于众包建立的高精地图高很多 , 这就不仅能够很好地解决高精地图所能解决的很多定位问题 , 可以很好的帮助解决一些定位相关的边缘极端场景 。
比如高精定位的更新速度往往是按照月级进行更新 , 这就意味着 , 当由于道路施工等场景下 , 高精定位并不能进行有效的实时更新 , 其更新速度和能力的短板导致自动驾驶系统往往不能将实时道路信息纳入到态势评估的考虑范围 , 这就导致在自车的轨迹规划中不能充分进行风险规避 。而BEV图像由于是实时生成的“地图信息” , 这就能够很好的解决对于环境实时性定位的问题 。
此外 , BEV建图过程中存在动态目标预测 , 即对于行驶过程中的不可见危险目标会有一定的预测能力 , 甚至可以部分解决类似鬼影的问题 , 这也可以很好的辅助自动驾驶系统解决相关的规划控制极限问题 , 比如实现提早收油、减速或者转向等 , 并且可以通过环境报警提示自车驾驶员和环境车辆进行避撞 。
当然 , 纯BEV生成的类似定位你信息也存在一定的局限性 , 比如定位建图范围窄 , 各向预测距离近等问题 , 这些都是基于众包高精定位的强项 。因此 , 最好的方式是通过BEV与地图引擎的结合来做相应的融合定位 。
BEV的环境3D模型重建
对于自动驾驶来说 , 用激光雷达对前方目标进行三维信息探测已经是业界公认的事实了 , 由于这种三维信息往往会给予规划控制模块足够的信息用于确认目标方向上是否允许车辆继续向前持续行驶 。这里需要注意 , 虽然说鸟瞰图主要是针对2D的整体显示 , 但是在预测过程中 , 也会选择性的对其3维模型仍旧形成相应的点云重建信息 , 一般情况下 , 这类重建是针对其激光雷达点云进行的 , 而随着摄像机配置逐渐由单目向双目的演进 , 基于双目甚至三目图像的重建将逐渐进入到整个应用过程中 。这种重建类型主要是针对自动驾驶过程中异形目标可以实现很好的检测 , 即便场景库对该目标没有实质性的训练过 , 但仍旧能够在通过BEV建图过程中直接将其标准为不可预知的目标 。甚至将其深度、高度、密度等信息在鸟瞰图中进行标识 , 为自动驾驶进行提前规划 。
BEV图像处理对自动驾驶系统的性能优化
文章图片

文章图片
BEV图像可以应用在预先绘制的环境中工作 , 在一天中的不同时间或一年中的不同季节 , 光照和天气可能会发生剧烈变化的情况 。使用基于语义的BEV映射允许只使用2D卷积网络 , 而不是3D , 这有助于提高速度 。定位到拓扑节点和训练神经网络来预测相对位姿 , 也可以限制最大误差到拓扑节点内 。
基于BEV图像的鸟瞰图生成
既然BEV图像对于自动驾驶显得如此重要 , 那么就需要在这里对相关的图像生成原理进行阐述说明 。自动驾驶感知中BEV的图像生成由一组神经网络组成 , 这些神经网络从不同的传感器探测中获取环境数据 , 这些传感器包含毫米波雷达、激光雷达、整个车载摄像头 , 并将其转换为单个通用的自上而下的语义网格表示形式 。