在智能驾驶领域,感知硬件是采集驾驶周围路况和障碍物分类的主要组件群,组件分布方式和类型的变化意味着某个模型在感知算法和算力上发生了重大变化。 正如现在大多数车企将高端智能驾驶方案从三激光雷达简化为单激光雷达一样,他们需要在减少硬件的前提下,利用算法完成感知。 在智能驾驶开始追求性价比的时代,减少多个激光雷达带来的性能冗余成为主流。
在最近的谍照中,小米Su7取消了原路测时配置的两台侧向激光雷达,用摄像头方案取代了盲人激光雷达。 这个方案的信号很可能会被小米改变,而“重视觉轻激光雷达”的配置方案,除了正向通过激光雷达补充点云数据外,其他阵地将采用视觉+毫米波雷达组合来实现感知功能。这可能意味着小米即将使用更先进的自动驾驶感知模型算法,帮助其实现快速推出高速城市NOA功能的目标。
在早期的小米路测谍照中,小米Su7配备了3个激光雷达,除了车顶的1个远程激光雷达(很可能是禾赛AT128)外,挡泥板两侧还有一个盲激光雷达。 当时有猜测称,小米将在其首款车上使用3激光雷达方案,类似于长安阿凡达11的激光雷达配置。
不过,在近期**小米Su7汽车的“证件照”中,挡泥板的设计进行了大幅修改,只剩下一套摄像头部件。 由此可以确定,小米SU7汽车没有搭载传说中的3激光雷达方案。 侧向激光雷达依然存在于10月的路试谍照中,小米在车的最后1-2个月选择放弃激光雷达方案,通过视觉+毫米波雷达的组合,实现了车辆侧向感知能力的完成。
出于成本考虑,小米Su7之所以切入侧补盲激光雷达,原因之一就是激光雷达成本高昂。 然而,智能驾驶的决策主要基于感知部件对周围世界的感知,为智能驾驶的安全减少了重要感知部件造成的盲区,埋下了隐患。
从技术角度来看,盲激光雷达的主要功能是完成视野的盲区。 阿维塔11的三台激光雷达也采用了类似的布局,侧向盲激光雷达的作用是补充侧面障碍物识别。 与驾驶场景相对应,侧向盲激光雷达可以帮助用户扫描侧向障碍物的位置和作用方向,从而解决“幽灵探头”“堵塞”等场景。
但侧盲激光雷达的优点是不受环境光变化影响,定位准确,检测率低,但缺点集中在软件算法复杂,颜色识别能力弱,受极端天气影响大。 理想L7曾爆出幽灵刹车问题,凸显了激光雷达色彩识别能力弱的问题,将广告牌的画像识别为真人。
曾有网友爆料称,他们的阿维塔11因为侧向感知没有及时发现侧边电动车而引发车祸,这证明盲人激光摄像头无法从实际使用方向100%识别盲人。
小米这次采用的解决方案是使用2组视觉摄像头和毫米波雷达进行侧面感知,摄像头位于挡泥板和B柱位置,挡泥板处的摄像头负责观察车辆的后视,B柱摄像头用于拍摄车辆的前半部分。 挡泥板处的摄像头负责工作视角,可以参考小米之前公布的自动驾驶实验模型的透视数据,挡泥板处的摄像头模组的主要功能会用于观察车辆与其他车辆之间的距离。
虽然B柱摄像头的硬件参数尚未公布,但为了完成360度的视角范围,很有可能会使用广角摄像头。 B柱摄像头的位置设计让我们很难不想到特斯拉,特斯拉B柱摄像头的视角偏向车辆前方,增强了车辆前半部分的区域视觉信息补充。 由于小米 Su7** 的后视镜区域没有鱼眼镜头,这意味着小米侧面可能只有 2 个感应装置,也有可能小米 B 柱摄像头采用了视角偏向前方的设计。
硬件方面,小米Su7取消侧向激光雷达后,很有可能会使用2组视觉摄像头来感知侧面环境,并使用毫米波雷达来感知障碍物的速度,这将保证AEB等功能的实现。
小米之所以用视觉方案取代激光雷达,很大程度上是因为小米将自动驾驶算法从障碍物识别改为BEV+占用来占领网络。 激光雷达在障碍物识别网络中无法替代的主要原因之一是激光雷达可以获取大量的点云数据,这构成了自动驾驶眼中的物理世界。
LiDAR点云数据将提取道路边缘线和车道线等信息,交通标志和各种类型的障碍物将以不同形状的点云显示。 基于雷达点云的障碍物识别算法还存在一个明显的问题,即无法识别特征数据库之外的异性障碍物。
BEV+占用网络的感知模式与一般障碍物识别网络的区别在于世界感知的差异,BEV+占用占用网络通过使用视觉组件将现实世界数字化,障碍物和道路周围的元素以不同的体素结构呈现。 障碍物识别网络主要对障碍物进行体素化,以辅助车辆进行驾驶决策。 可以看出,BEV+占用网络具有更强的泛化能力,这意味着车辆不再需要识别障碍物的类型和边缘,车辆只需要避开所有体素来占据空间即可完成驾驶。
与障碍物识别网络相比,BEV+Occcupancy网络最直观的变化是可以减少更多的“鬼刹”误触发,可视化方案可以更精准地还原3D场景,减少激光雷达容易发生的误触发和漏检问题。 此外,BEV+OCCUPANCY网络产生的三维结构信息伴随着更多的颜色信息,激光雷达颜色识别能力弱的问题将更加突出。
采用新的大模型算法对于小米来说,价值不仅在于降低AEB误触发率,还在于新车上市后如何赶上一流智能驾驶公司的水平。 今年,新动力车企将把城市NOA开放作为今年的主要目标,理想和极致的更多人都寄希望于利用BEV+Occcupancy网络,实现更快的城市NOA城市开放。
由于城市道路场景比较复杂,交叉路口、变道、行人、不规则交叉路口较多,部分城市被道路感知不清所阻挡,容易造成车辆决策犹豫。 此前,有网友吐槽小鹏XNGP在开城初期遇到双向10车道的大路口时,智能驾驶AI会变得“不堪重负”。 BEV+占用占据了网络精度高、细节感知丰富的优势,通过还原真实场景,直接解决了感知车道的问题。
回到小米,从硬件变化来看,小米大概在算法层面发生了重大变化。 它已经从一般的障碍物识别转向特斯拉、理想和阿波罗使用的BEV+占用网络算法。 小米的城市NOA城市开放思路将利用算法突破,从更优化的算法中获取准确的数据,辅助AI训练大模型。
小米这次选择了BEV+OCCUPANCY来占领网络,几乎进入了与特斯拉和理想一样的算法阵营。 目前,华为似乎是唯一一个坚持障碍物识别并占领网络的公司,但GOD网络训练机制需要大量的算力来做障碍物识别,这大概是华为不再积极推动城市NOA进步的原因之一。 随着小米的加入,明年的城市NOA之战将更加有趣。