大疆车载：不依赖激光雷达、高精地图做自动驾驶

对「软硬件解耦」理解最通透的，一定是金庸老爷子。

在金庸的武侠世界里，顶级高手都没有神兵利器，甚至都没有武器，大理段氏的六脉神剑，萧峰和洪七公的降龙十八掌，张三丰的太极拳，张无忌的九阳神功尽是如此，连顶级剑法独孤九剑，最高境界也是「无剑式」，讲究无招胜有招。

而拥有倚天剑的灭绝师太、拥有屠龙刀的金毛狮王，甚至那些需要用到武器和固定招式的功法，例如葵发宝典，都只能算是第二梯队。这就是软硬件解耦，内功心法是软件，武器是硬件，只有实现软硬件解耦，才能赤手空拳也可以分分钟教灭绝师太做人。

正因如此，看大疆车载的自动驾驶解决方案时，我脑海里同步的画面是张三丰教张无忌打太极拳。据大疆介绍，它们的自动驾驶方案以计算机视觉算法为主，可以有但并不依靠激光雷达、高精地图、RTK 高精定位、V2X 信号，甚至不依赖高算力芯片，计算平台都是按主机厂的偏好来做适配，真正意义上做到软硬件解耦，不绑定任何硬件，聚焦软件算法。

获五菱、大众合作的可量产智能驾驶方案

大疆车载团队起步于 2016 年，截止 2020 年年底，核心研发人员 500 余人，硕博比例 87%，拥有智能驾驶及相关领域专利 1000 多项。在本届车展上，大疆车载发布了面向高速公路的 D130 和 D130 + 智能驾驶方案，面向城市快速路的 D80 和 D80 + 智能驾驶方案，以及面向泊车场景的 P 5 「APA」、 P 100 「APA + 」、P 1000 「AVP」三种方案。

虽说是针对高速公路和城市快速路，但对于城区等非结构化道路场景，D80 系列和 D130 系列还提供了城区辅助驾驶功能，具备自适应巡航、车道保持、AEB 主动刹车、寻迹过十字路口等能力。

D80 系列相较 D130 系列在于支持的最高车速不同，D130 系列即能够实现 0 - 130 km/h 速度区间内的智能驾驶。车速越高意味着最远探测距离要更远，因此 D130 系列搭载了 800 万像素的高清双目摄像头，而 D80 系列搭载的双目摄像头是普通的 200 万像素。

而 D80 和 D80+，以及 D130 和 D130 + 的区别，在于安全冗余深度不同，D80 和 D130 属于 L2 级辅助驾驶，而 D80 + 和 D130 + 则属于 L3 级自动驾驶，允许驾驶员脱手脱眼，在系统运行期间获得短暂的休息。为了实现更高等级的安全冗余，D80 + 和 D130 都标配一套激光雷达以及 DMS 系统，计算上也对应配备算力更高的芯片。不过据大疆工程师透露，凭借大疆优秀的算法，即便是实现 L3 级的 D130 + 系统，算力需求也不会到夸张的数百 TOPS。

P5 辅助泊车、P100 记忆泊车、P1000 自主泊车及智能召唤功能，区别在设计运行区域不同，P5 是到达车位后调用，P100 能实现中 / 远距离全自主泊车，而 P1000 则能够实现中 / 远距离全自主召唤。

据大疆工程师现场介绍，大疆车载的核心能力在于软件算法，通过双目摄像头，便能准确识别常见物体，并估算与物体之间的距离，实现对环境深度信息的探测。凭借大疆在无人机视觉算法上的积累，大疆的双目摄像头感知系统能实现在线自标定，有效避免因温变、振动等环境因素而引起的基线变化带来的误差，输出稳定可靠的感知信息。

大疆车载公布的一系列智能驾驶方案，最能打动我的在于它核心算法的强大泛化能力。即便不使用激光雷达、高精地图、GNSS 和 RTK 信号、V2X 信号，大疆依然能够依靠视觉算法获得场景深度信息，依靠视觉 SLAM 获得位置信息，实现可靠的智能驾驶方案。这对智能驾驶方案成本下探的想象空间是非常大的，连「人民的五菱」也官宣与大疆车载建立合作，用大疆的方案，推出「年轻人的第一款智能驾驶汽车」。

虽然大疆有自己的激光雷达子公司「Livox」，但大疆车载对激光雷达的态度是，可以不用但也不排斥，甚至就算用也不会绑定带货，不是说用了大疆车载方案就一定要用大疆激光雷达。更关键的是，大疆认为既然视觉就能实现的功能，增加成本使用了激光雷达，那就一定要有「质变」的差异，要从辅助驾驶升级成自动驾驶。D80 和 D130 ，在搭载激光雷达升级为 D80 + 和 D130 + 方案后，便可以支持人机共驾，从辅助驾驶跨步到 L3 自动驾驶。

这和目前大火的华为 ADS 有所不同，华为的方案是用 L4 的功能去做 L2 的体验，虽然搭载了 3 激光雷达和 400 TOPS 的算力，但驾驶员依然是驾驶主体，驾驶过程中是无法休息的，系统是帮助驾驶员更安全的开车，而不是在特定场景帮助驾驶员开车。

视觉做高阶辅助驾驶靠谱么？

如何实现点到点的自动驾驶辅助呢？这需要汽车能理解并解决三个问题，「我在哪儿」，「我要去哪儿」，「怎么去」，如果不依靠激光雷达、高精地图、高精定位，那最难解决的便是「我在哪儿」的问题。

设想一下，把你打晕之后丢在城市的任意街道上，你该如何知道自己在哪儿？第一步打开地图，查看自己在地图上的定位，你就知道自己哪个街道。第二步放大地图，查看地图上的特征点，例如 XX 街和 XX 街的交叉口，街道一侧距离交叉口 20 米的位置有一家 KFC。第三步，抬头看路口在哪儿，KFC 在哪儿，对比就能知道自己的精准定位：XX 市 XX 街 X 侧离 XX 交叉路口 X 米。

机器有机器自己的世界，而高精地图就是属于机器的世界，同时高精地图也是现实世界的映射，机器理解自己在高精地图中的位置，也就意味着车辆在现实世界中的位置。使用高精地图的方案，例如小鹏 NGP、蔚来 NOP，和华为 ADS，就是通过车载高精地图以及 RTK 高精定位信号，知道车辆的车道级定位。华为 ADS 由于有激光雷达，还可以通过算法比对高精地图中的定位图层，提升定位精度以及定位冗余。

图片来自Momenta视觉高精地图

汽车没有高精地图和高精定位，就如同人在一个没有 GPS 和手机导航的环境，要通过无源导航知道「我在哪儿」，难度高很多，精度也会降低。首先要训练你，让你对整个城市的道路特征有记忆，变成活地图，你就可以不依靠导航和定位，就能在任意一个位置知道自己在哪儿。大疆想要仅依靠视觉和惯导组合，让车辆独立解决「我在哪儿」的问题，就得让 AI 和人一样有「记忆」。

目前并不清楚大疆是否，自己用车队采集高速公路、城市快速路的环境信息，补充一个高精地图中定位图层的功能，但车辆一定会靠双目摄像头做视觉 SLAM 同步建图并存储，形成「记忆」，当下次路过这个位置，就能通过比对，获取自己相对参照物的相对定位，如果参照物有绝对定位信息，那车辆就间接有了较为准确的定位，这本质上可以理解为双目视觉 SLAM 配合视觉众包高精地图，解决「我在哪儿」的问题。当然这听起来很偏执，有现成的厘米级定位信号干嘛不用呢？其实大疆所谓的不依靠高精定位，其实是想做冗余来补全 RTK 信号丢失的场景，技术足够强大才能用但又不依赖硬件。

图片来自千寻位置

解决了自己的位置信息，还得理解目的地的定位信息，理解交通指示的意义，理解交通规则，从而实现路线的规划，这些都需要通过深度学习使系统构建对现实世界的认知体系。在没有正式体验前，我们也无法确定大疆的这套算法是否可以达到搭载激光雷达 + 高精定位的水平，但至少从逻辑和技术上来看，是可以实现的。

写在最后

很多车企在推激光雷达车型时，都在讲激光雷达是冗余，是自动驾驶的必备传感器。但事实上「拿激光雷达做冗余」仅成了宣传的噱头，冗余的意思是，就算没有它你也能搞定，只是你搞不定的时候有替代方案不至于歇菜，现阶段激光雷达不仅不是冗余，还成了实现部分场景部分功能的主力军，顶着备胎的名分干正室的活儿。

从这一点上来看，大疆的智能驾驶方案我是很认可的，激光雷达真正被摆在了冗余的位置。用视觉算法降低自动驾驶对硬件的依赖，大疆选择的路线技术难度很大，但对推动智能驾驶发展很有意义。

不过值得警惕的是，那些看起来越完美的技术方案，背后的泡沫往往是越大的，因为技术落地过程中永远都伴随着妥协与让步，那些不完美或许才是自动驾驶的真面目吧。

获五菱、大众合作的可量产智能驾驶方案

视觉做高阶辅助驾驶靠谱么？

写在最后

请截图后在微信扫码参与互动