42号车库保安

42号车库保安

2021-04-22

Subscription

大疆车载 :不依赖激光雷达、高精地图做自动驾驶

  1. 大疆
2,775

对「软硬件解耦」理解最通透的,一定是金庸老爷子。

在金庸的武侠世界里,顶级高手都没有神兵利器,甚至都没有武器,大理段氏的六脉神剑,萧峰和洪七公的降龙十八掌,张三丰的太极拳,张无忌的九阳神功尽是如此,连顶级剑法独孤九剑,最高境界也是「无剑式」,讲究无招胜有招。

而拥有倚天剑的灭绝师太、拥有屠龙刀的金毛狮王,甚至那些需要用到武器和固定招式的功法,例如葵发宝典,都只能算是第二梯队。这就是软硬件解耦,内功心法是软件,武器是硬件,只有实现软硬件解耦,才能赤手空拳也可以分分钟教灭绝师太做人。

正因如此,看大疆车载的自动驾驶解决方案时,我脑海里同步的画面是张三丰教张无忌打太极拳。据大疆介绍,它们的自动驾驶方案以计算机视觉算法为主,可以有但并不依靠激光雷达、高精地图、RTK 高精定位、V2X 信号,甚至不依赖高算力芯片,计算平台都是按主机厂的偏好来做适配,真正意义上做到软硬件解耦,不绑定任何硬件,聚焦软件算法。

获五菱、大众合作的可量产智能驾驶方案

大疆车载团队起步于 2016 年,截止 2020 年年底,核心研发人员 500 余人,硕博比例 87%,拥有智能驾驶及相关领域专利 1000 多项。在本届车展上,大疆车载发布了面向高速公路的 D130 和 D130 + 智能驾驶方案,面向城市快速路的 D80 和 D80 + 智能驾驶方案,以及面向泊车场景的 P 5 「APA」、 P 100 「APA + 」、P 1000 「AVP」三种方案。

虽说是针对高速公路和城市快速路,但对于城区等非结构化道路场景,D80 系列和 D130 系列还提供了城区辅助驾驶功能,具备自适应巡航、车道保持、AEB 主动刹车、寻迹过十字路口等能力。

D80 系列相较 D130 系列在于支持的最高车速不同,D130 系列即能够实现 0 - 130 km/h 速度区间内的智能驾驶。车速越高意味着最远探测距离要更远,因此 D130 系列搭载了 800 万像素的高清双目摄像头,而 D80 系列搭载的双目摄像头是普通的 200 万像素。

而 D80 和 D80+,以及 D130 和 D130 + 的区别,在于安全冗余深度不同,D80 和 D130 属于 L2 级辅助驾驶,而 D80 + 和 D130 + 则属于 L3 级自动驾驶,允许驾驶员脱手脱眼,在系统运行期间获得短暂的休息。为了实现更高等级的安全冗余,D80 + 和 D130 都标配一套激光雷达以及 DMS 系统,计算上也对应配备算力更高的芯片。不过据大疆工程师透露,凭借大疆优秀的算法,即便是实现 L3 级的 D130 + 系统,算力需求也不会到夸张的数百 TOPS。

P5 辅助泊车、P100 记忆泊车、P1000 自主泊车及智能召唤功能,区别在设计运行区域不同,P5 是到达车位后调用,P100 能实现中 / 远距离全自主泊车,而 P1000 则能够实现中 / 远距离全自主召唤。

据大疆工程师现场介绍,大疆车载的核心能力在于软件算法,通过双目摄像头,便能准确识别常见物体,并估算与物体之间的距离,实现对环境深度信息的探测。凭借大疆在无人机视觉算法上的积累,大疆的双目摄像头感知系统能实现在线自标定,有效避免因温变、振动等环境因素而引起的基线变化带来的误差,输出稳定可靠的感知信息。

大疆车载公布的一系列智能驾驶方案,最能打动我的在于它核心算法的强大泛化能力。即便不使用激光雷达、高精地图、GNSS 和 RTK 信号、V2X 信号,大疆依然能够依靠视觉算法获得场景深度信息,依靠视觉 SLAM 获得位置信息,实现可靠的智能驾驶方案。这对智能驾驶方案成本下探的想象空间是非常大的,连「人民的五菱」也官宣与大疆车载建立合作,用大疆的方案,推出「年轻人的第一款智能驾驶汽车」。

虽然大疆有自己的激光雷达子公司「Livox」,但大疆车载对激光雷达的态度是,可以不用但也不排斥,甚至就算用也不会绑定带货,不是说用了大疆车载方案就一定要用大疆激光雷达。更关键的是,大疆认为既然视觉就能实现的功能,增加成本使用了激光雷达,那就一定要有「质变」的差异,要从辅助驾驶升级成自动驾驶。D80 和 D130 ,在搭载激光雷达升级为 D80 + 和 D130 + 方案后,便可以支持人机共驾,从辅助驾驶跨步到 L3 自动驾驶。

这和目前大火的华为 ADS 有所不同,华为的方案是用 L4 的功能去做 L2 的体验,虽然搭载了 3 激光雷达和 400 TOPS 的算力,但驾驶员依然是驾驶主体,驾驶过程中是无法休息的,系统是帮助驾驶员更安全的开车,而不是在特定场景帮助驾驶员开车。

视觉做高阶辅助驾驶靠谱么?

如何实现点到点的自动驾驶辅助呢?这需要汽车能理解并解决三个问题,「我在哪儿」,「我要去哪儿」,「怎么去」,如果不依靠激光雷达、高精地图、高精定位,那最难解决的便是「我在哪儿」的问题。

设想一下,把你打晕之后丢在城市的任意街道上,你该如何知道自己在哪儿?第一步打开地图,查看自己在地图上的定位,你就知道自己哪个街道。第二步放大地图,查看地图上的特征点,例如 XX 街和 XX 街的交叉口,街道一侧距离交叉口 20 米的位置有一家 KFC。第三步,抬头看路口在哪儿,KFC 在哪儿,对比就能知道自己的精准定位:XX 市 XX 街 X 侧离 XX 交叉路口 X 米。

机器有机器自己的世界,而高精地图就是属于机器的世界,同时高精地图也是现实世界的映射,机器理解自己在高精地图中的位置,也就意味着车辆在现实世界中的位置。使用高精地图的方案,例如小鹏 NGP、蔚来 NOP,和华为 ADS,就是通过车载高精地图以及 RTK 高精定位信号,知道车辆的车道级定位。华为 ADS 由于有激光雷达,还可以通过算法比对高精地图中的定位图层,提升定位精度以及定位冗余。

图片来自Momenta视觉高精地图

汽车没有高精地图和高精定位,就如同人在一个没有 GPS 和手机导航的环境,要通过无源导航知道「我在哪儿」,难度高很多,精度也会降低。首先要训练你,让你对整个城市的道路特征有记忆,变成活地图,你就可以不依靠导航和定位,就能在任意一个位置知道自己在哪儿。大疆想要仅依靠视觉和惯导组合,让车辆独立解决「我在哪儿」的问题,就得让 AI 和人一样有「记忆」。

目前并不清楚大疆是否,自己用车队采集高速公路、城市快速路的环境信息,补充一个高精地图中定位图层的功能,但车辆一定会靠双目摄像头做视觉 SLAM 同步建图并存储,形成「记忆」,当下次路过这个位置,就能通过比对,获取自己相对参照物的相对定位,如果参照物有绝对定位信息,那车辆就间接有了较为准确的定位,这本质上可以理解为双目视觉 SLAM 配合视觉众包高精地图,解决「我在哪儿」的问题。当然这听起来很偏执,有现成的厘米级定位信号干嘛不用呢?其实大疆所谓的不依靠高精定位,其实是想做冗余来补全 RTK 信号丢失的场景,技术足够强大才能用但又不依赖硬件。

图片来自千寻位置

解决了自己的位置信息,还得理解目的地的定位信息,理解交通指示的意义,理解交通规则,从而实现路线的规划,这些都需要通过深度学习使系统构建对现实世界的认知体系。在没有正式体验前,我们也无法确定大疆的这套算法是否可以达到搭载激光雷达 + 高精定位的水平,但至少从逻辑和技术上来看,是可以实现的。

写在最后

很多车企在推激光雷达车型时,都在讲激光雷达是冗余,是自动驾驶的必备传感器。但事实上「拿激光雷达做冗余」仅成了宣传的噱头,冗余的意思是,就算没有它你也能搞定,只是你搞不定的时候有替代方案不至于歇菜,现阶段激光雷达不仅不是冗余,还成了实现部分场景部分功能的主力军,顶着备胎的名分干正室的活儿。

从这一点上来看,大疆的智能驾驶方案我是很认可的,激光雷达真正被摆在了冗余的位置。用视觉算法降低自动驾驶对硬件的依赖,大疆选择的路线技术难度很大,但对推动智能驾驶发展很有意义。

不过值得警惕的是,那些看起来越完美的技术方案,背后的泡沫往往是越大的,因为技术落地过程中永远都伴随着妥协与让步,那些不完美或许才是自动驾驶的真面目吧。

本文著作权归作者所有,并授权 42 号车库独家使用,未经 42 号车库许可,不得转载使用。
Comment · 0
Owner: 0
Sort by like

Upload
大胆发表你的想法~
12
Comment