1. # 自动驾驶

自动驾驶面临算法之痛,这家最懂算法的芯片公司要做车企的算法顾问

「我们不是交付算法,而是做主机厂的顾问,帮助他们开发自己的算法。」

|

本文转载自建约车评(微信 ID: jianyuecheping),作者苏清涛。

跟五年前封杀特斯拉一样,Mobileye 至今仍对自己的客户严防死守——他们不希望自己的客户掌握感知算法能力,只要看到一点客户要自研算法的苗头,哪怕只是误会一场,他们也会以「断供」相威胁。

尽管自动驾驶芯片市场的竞争正在变得越来越激烈,尤其是,随着华为和高通的闯入,车企有了更多的选择机会,Mobileye 再也无法回到以前的垄断地位了,但这家公司的强势姿态却未发生任何改变。

在这种背景下,但凡有点进取心的车企,大概也不会依旧安分守己、无忧无虑地享用 Mobileye 提供的「黑盒子」了。但问题是,「算法自主」这个理想听上去很丰满,但现实却很骨干。

连车企中自动驾驶能力最强的特斯拉,在 2016 年底将自动驾驶芯片由 Mobileye 的 EyeQ3 更换为英伟达的 GPU,并采用了自研的算法后,AEB 也曾在一段时间内「功能降级」。

三四年后的今天,许多中国车企已在量产车上搭载了满足特定自动驾驶能力需求的传感器和计算平台,但算法却还要等到一年半载后才能通过 OTA「上车」,由此可见,算法面临的挑战比算力还大。

正如阿里达摩院自动驾驶实验室负责人王刚在前段时间的一次分享中所说:「算力面临的考验是『好不好』,而算法面临的考验则是『能不能』」。

但今后,那些既不愿被 Mobileye 的软硬一体化方案「绑架」,又因为算法能力暂时还不成熟而无法使用 Xavier 的车企,可以长舒一口气了。因为,有一家『最懂算法的芯片公司』要帮助他们打造自己的算法能力了。

在过去的两年多里,这家芯片公司先后拿到了全球排名前三的半导体公司中的两家的战略投资,同时,博世也成为该公司的首批合作伙伴之一。随着这家公司的崛起,中国车企将有望摆脱被国际自动驾驶芯片厂商卡脖子的苦日子。

新的摩尔定律正在出现

算力和功耗,是自动驾驶芯片的用户最关注的两个参数,而从 2015 年成立之初,这家芯片公司便把打造「强算力、低功耗」作为 AI 芯片的最关键指标。从已量产及发布的产品来看,他们真的做到了。

该公司在去年下半年发布的第二代 AI 芯片,单位功耗的算力不仅远高于当前最热门的 ADAS 芯片 EyeQ3 和 EyeQ4,而且也超过英伟达的 Xavier。目前,这款芯片已通过车规认证,并已应用在前装量产车上。

该公司的第三代芯片,已于今年上半年流片成功,而在今年下半年,该公司将发布其再下一代 AI 芯片,算力是特斯拉 FSD 芯片的 1.33 倍,功耗却只有后者的 2/3,算下来,其能效是特斯拉 FSD 芯片的 2 倍

要同时做到强算力和低功耗非常难,用这家公司创始人的话来说,这相当于「既要马儿跑得快,又要马儿少吃草」。为实现两者的平衡,这家公司没有做 GPU 和 FPGA 这种通用芯片,而是做了专门为自动驾驶场景服务的 ASIC 芯片。

可以简单地理解为,与通用芯片相比,ASIC 芯片的架构中删掉了那些跟自动驾驶场景的算法无关的模块 —— Jim Keller 在为特斯拉设计 FSD 芯片时便是这么干的。

比如,图像处理中有大量并不重要的冗余信息,而这家公司则通过算法设计「无视」掉那些跟无人驾驶无关的干扰图像信息。这就减少了处理器的计算负担,同时,也节省了功耗。

当然,只有算法能力非常强的团队才能做到这一点。

配合高效算法,该公司的第二代 AI 芯片可在 2W 的典型功耗下提供超过 4 TOPS 的等效算力。测试结果表明,这款芯片在典型算法模型上运行所达到的算力利用率超过 90%,远超其他芯片(通常,算力利用率只能达到 50%左右)。

当前,这家公司的芯片架构也正处于快递迭代中。

随着芯片的制程正在逼近物理极限,「摩尔定律已死」的观点隔一段时间就回响一次。针对这一声音,该公司创始人多次强调:摩尔定律的确正在变慢,但新的摩尔定律正在出现——结合应用场景的变化,重新定义软件的架构,进而对硬件架构进行重新设计,在提高算力的同时,降低单位算力的功耗。

说到这里,也许不少朋友已经猜到本文截至此处一直没有「实名制」的「这家公司」究竟是谁了。你猜得没错,这个「最懂算法的芯片公司」就是地平线。

地平线官方公布的芯片 Roadmap

目前,搭载征程 2 的智能驾驶解决方案已拿下多个前装量产订单。而搭载征程 2 的自动驾驶计算平台 Matrix 2(可处理 12 路摄像头的数据)也已部署在上千辆 Robotaxi 上。

之前,Matrix 1 平台上的 AI 芯片是 FPGA,在升级至 Matrix 2 平台时,算法不变,仅仅是 FPGA 换成了征程 2,但功耗便由 110W 降至 30W 以内。

地平线的征程系列,不仅能效优于 FPGA,而且,与已知的其他几款自动驾驶芯片相比,能效方面的优势也很明显。

附:各主要自动驾驶芯片能效比较

同样是基于 28nm 制程,征程 2 的能效 (2 TOPS/W )是 EyeQ4 的 2.4 倍;并且,与更先进制程英伟达的 Xavier (16 nm,1 TOPS/W )相比,征程 2 能效优势也很明显。此外,据了解,征程 3 的能效也要优于 7 nm 的英伟达 Orin (3 TOPS/W )。

除制程外,架构是影响芯片功耗的另一个重要因素——在同一制程下,芯片的架构越先进,能效越高。而我们通过对比发现,征程系列产品的能效不仅优于相同制程下的竞品,而且也可能优于更先进制程下的竞品。

这意味着,地平线的芯片架构在降低单位算力的功耗方面确实有很明显的优势。

当然,地平线能不断地优化芯片架构,要归功于他们在算法领域的深厚积累以及对应用场景的理解。

地平线团队针对自动驾驶场景设定了独特的算法模型,并前瞻性地将其计算特点融入到芯片架构的设计中,使得 AI 芯片能够随着算法的演进,始终保持相当高的有效利用率,从而真正意义上受益于算法创新。

最懂自动驾驶算法的芯片公司

感知算法,是自动驾驶的起点与基石。随着自动驾驶向高等级不断发展,对感知算法准确性的要求也大幅提升,如何持续提升感知算法的准确性、挑战感知极限,成为学界和产业界不断研究探索的课题。

地平线虽然是一家芯片公司,却也在感知算法领域有着深厚的积累。事实上,自成立之日起,地平线便坚持走「芯片+算法」的软硬一体化路线。其核心团队成员也有很强的算法基因。

创始人余凯,早在十年前便带领团队获得首届 ImageNet 图像识别评测第一名,是首个在国际人工智能算法竞赛中率队摘得桂冠的华人学者。

余凯还是某互联网巨头自动驾驶业务的创始人,在做深度学习训练期间,他发现,只有设计出一款专用芯片,使芯片跟算法高度协同,才能使算法的效力最大程度地发挥出来,于是,他便创办了现在的公司。

其算法副总裁黄畅,曾长期从事计算机视觉、机器学习、模式识别和信息检索方面的研究,作为相关学术界和工业界的知名专家,发表的论文被引用超过 3000 次,拥有多项国际专利。

黄畅开发的人脸检测技术,创造了世界上首次计算机视觉技术被大规模应用的成功范例,占领 80% 数码相机市场,并且被苹果 iPhoto 等诸多图像管理软件所采用。

公司成立几年来,先后获得 KITTI,Pascal VOC、FDDB、LFW、TRECVID 多个等国际权威算法评测的世界第一。

最近,在一场以考察感知算法为核心目标的自动驾驶挑战赛上,地平线在跟谷歌大脑、阿里达摩院、图森未来、柏林工业大学、加州大学伯克利分校等自动驾驶明星团队同台竞技中力挫群雄,在 5 个参赛项目中拿下了 4 个第一名、1 个第二名。

故事还要从一年前说起:2019 年 6 月 17 日,CVPR 2019 现场,Waymo 公开了包含 3000 段驾驶记录、60 万帧、大约 2500 万 3D 边界框、2200 万 2D 边界框及多样化的自动驾驶场景在内的全新自动驾驶数据集。

按计划,这一开放数据集将应用于外部的学术研究和实验测试领域。Waymo 这么做的目的是,集思广益,寻找出一种超越其技术标准的全新技术模型。

2020 年 3 月,Waymo 宣称将开放数据集再扩展 800 个细分市场,并首次邀请全球学术界和产业界的顶级自动驾驶研发团队参加其开放数据集挑战赛;还有一些 Waymo 自己的员工也以个人身份参加了此次比赛。

本次挑战赛,Waymo 开放了其自动驾驶车辆在 25 个城市收集的超过 1000 万英里的自动驾驶行驶里程数据,而且涵盖了在白天夜晚、黎明黄昏、晴天雨天在各种城市和郊区环境下驾驶时收集的数据。

考虑到 Waymo 的测试车辆上装了 5 颗激光雷达和 5 颗前置和侧视摄像头,这些场景数据的复杂程度,超过了 KITTI、NuScenes、Argo 等公开数据集。

Waymo 首席科学家兼项目负责人 Drago Anguelov 称,这次挑战赛所使用的数据集是有史以来规模最大、场景最丰富、最多样化的自动驾驶数据集之一。

得益于在算法领域的长期技术沉淀和自动驾驶研发的经验积累,在此次挑战赛中,地平线团队充分利用其完善的算法开发基础设施、自主开发新颖有效的感知算法,并针对数据集中的特定细分场景进行算法优化,在短时间内解决了多个技术难题。

挑战赛从 3 月 19 日开始,2020 年 5 月 31 日结束。根据 6 月 15 日在 CVPR 2020 自动驾驶 Workshop 上揭晓的结果,地平线在其中 2D 追踪、3D 检测、3D 追踪和域适应 4 项挑战中拔得头筹,在 2D 检测中获得第二名。

地平线自诩是「最懂算法的芯片公司」,而这次挑战赛的成绩,便是最佳的证明。

而余凯也曾经反复强调过一个观点:AI 计算是「算法定义芯片」,即芯片能实现什么功能、芯片的效力能发挥出多少,在很大程度上是由算法来决定的。这意味着,地平线的算法能力,也会反哺其芯片产品。

对中国道路场景的理解

AI 计算「算法定义芯片」的背后,是「场景决定算法」。自动驾驶技术的开发者们之间算法能力的比拼,归根结底是对场景理解能力的比拼,没有对场景的深刻理解,就很难写出真正牛逼的算法。

并且,哪怕一家公司的自动驾驶算法在某个场景下被证明「已经很牛逼」了,但换一个场景,可能就没那么灵验了。

如某无人驾驶巨头在刚把自动驾驶车辆从凤凰城搬到旧金山的时候发现,原本在凤凰城跑得非常欢畅的自动驾驶系统,完全不能应对旧金山如此复杂的地形和路况。在美国不同城市间尚且如此,在美国开发的方案搬到中国,挑战就更大了。

在去年底的一场 ADAS 论坛上,某车企 ADAS 项目负责人说,当前,有许多车上装的 ADAS,在欧洲的测试结果很棒,但拿到中国就变成了摆设,用户体验过几次发现效果不好,然后就不怎么用了。

在这方面,Mobileye 和特斯拉都有着深刻的教训——这两家公司的自动驾驶算法都是基于欧美国家的道路状况训练而成的,但在中国道路上经常失灵。

如广汽研究院郭继舜博士在《汽车之心》的分享中提到:

「中国南方的丘陵地区经常会出现的鱼骨线,这个交通标志的意思是道路复杂,请驾驶员保持注意力。但在智能驾驶开发中,一遇到鱼骨线,EyeQ3 的车道线识别算法拟合出的车道线就飘来飘去极不稳定,造成一系列功能的不稳定。

「另外,中国很多高速桥的限重标志,比如 30t (30 吨)类的标志,因为不是国际标准,Mobileye 的算法在识别的时候会漏掉那个小「t」。这可能导致识别结果会和限速数据搞混,比如在一个 120km/h 限速的高速公路上,过了一个桥,系统会很容易把 30t 理解为『限速 30 km/h』。」

特斯拉,自动驾驶系统在中国道路上无法识别石墩的问题已被吐槽许久,而据 42 号车库在 4 月份做的一项评测,特斯拉 AEB 的行人检测能力也不行:

在「AEB 行人碰撞测试」中,蔚来 ES6 和理想 One 在时速 60 公里的情况下也可以自动减速避让行人;相比之下,Model 3 在时速 40 公里时没有丝毫减速的意思,直接撞了上去;在时速 30 公里时遇到「鬼探头」,也撞了上去。

造成这种差别的原因是:蔚来 ES6 和理想 One 上搭载的感知系统 EyeQ4,已针对中国的路况做了算法优化;而特斯拉的算法则对中国道路上常见的行人乱穿马路的现象缺乏足够的「心理准备」。

为解决这一问题,本月初,特斯拉宣布将在中国组建 Autopilot 团队。该团队最重要的任务,便是针对中国的道路环境对算法进行优化。

从诸多自动驾驶从业者们的反馈来看,中国道路驾驶场景对算法的挑战,还包括但不限于以下情况:各个城市的交通信号灯不统一,锥形桶和石墩比别的国家更常见;物流车、快递、老年人代步车、小电驴,路上的障碍物比美国丰富 3 倍以上;因资源紧张,人心急躁、不守规矩,急刹车、强行加塞等现象比西方更常见;因频繁施工,渣土车、改装车等 '中国特色' 的异型车会更多;碰瓷等人为制造的交通事故......

无论谁家的自动驾驶车辆要在中国的道路上跑,先在感知环节把这些问题都搞定,便比较容易避免在决策规划环节出错。

正如郭继舜博士在《汽车之心》的分享中说:「感知模块判定前方是快递电动车,决策模块就需要将跟车速度降下来。同时,考虑到快递车有随时停车的可能性,决策模块还需要输出拉大跟车距离的命令。」

而在「场景决定算法」的法则下,一个团队只要对场景理解比别人都深刻,哪怕起步较晚,或者在刚开始算法能力并不是最牛逼的,假以时日,也会凭借对应用场景的理解建立起竞争壁垒。

地平线基于征程 2 的 ADAS 解决方案,便专门针对中国道路和场景进行了优化,如特殊车道线、红绿灯倒计时检测、车辆突然斜向插入等。

结果便是,地平线的 ADAS 方案在对车道线延展长度、外卖车辆、行人(包括其自行车的人)检测能力上的表现是显著优于 Mobileye EyeQ3 和 Mobileye EyeQ4。

还有一些 Mobileye 在欧美做算法训练时很少遇到的极端工况:城市道路边密集的停车位上,被遮挡的行人只露出半个身位;中国特有骑车人的雨衣;高速上司机频繁换道,车在旁边切入露出了一小部分......对这些情况下的「障碍物」,地平线的方案都可以准确地检测出来。

以开放 PK 封闭

除算法跟中国的道路场景更匹配外,车企考虑优先选择跟地平线合作的另一个理由是:看重地平线的「开放性」。或者说,他们实在无法忍受 Mobileye 的封闭了。

在之前的一场 ADAS 论坛上,有几家车企的自动驾驶工程师吐槽说,现有的方案提供的传感器都自带 ECU 和算法,虽然使用起来方便,但这样的方案是一个黑匣子,算法是怎么写的、算法的逻辑是什么,车企完全不知道,「他们也不会向我们开放权限」。

车企只能在此基础上进行后续的运算处理,而无法推演其运算逻辑。这意味着,当车辆在极端场景下遭遇感知障碍时,车企无法独立地找到问题进行修复。并且,车企也不能自己去推动 ADAS 算法的迭代。

Mobileye 将芯片和算法捆绑在一起的软硬一体化方案,也存在类似的问题:有些用户/车企虽然富有进取心,但他们没法自己写算法。

用户也可以委托 Mobileye 写一些针对特殊驾驶场景定制的算法,但后者同样要收一笔巨额的开发费用。EyeQ4 的算力,已足够支持激光雷达,但由于不开放,加了激光雷达的方案,只能 Mobileye 自己来设计(当然是要收钱的),因此,EyeQ4 的客户中很少有人使用激光雷达。

凭借庞大的数据优势,Mobileye 的算法当然也在快速地进步着,不过,优化后的算法通常只有在下一代芯片上才会出现,对已经量产的芯片,大多数已装在客户的车上了,Mobileye 是不会去做算法迭代的。

个别客户提出要求的话,Mobileye 会通过 OTA 为相关的车型上的芯片做算法迭代,但需要额外收费。

马斯克当年决定弃用 Mobileye 的方案,最根本的原因并不是那起致命事故,而是他认为 Mobileye 的封闭模式无法满足特斯拉对自动驾驶能力快速迭代的需求。

那些希望自己能掌控自动驾驶技术发展进度的中国车企们肯定也正被同样的问题困扰着。

参考特斯拉在 2015 年为了自研自动驾驶算法而跟 Mobileye 发生的几个回合的博弈来看,为迫使车企对他们的软硬一体化方案形成「路径依赖」,Mobileye 会不惜一切代价打压车企自研算法的尝试。

Mobileye 对车企自研能力的打压,首先就体现在对数据的控制上。

从法理上将,Mobileye 的摄像头产生的原始数据归车企所有,但实践中,由于 Mobileye 的控制欲极强,他们会通过技术措施限制车企拿到这些数据——数据是以Mobileye的特殊格式保存的,必须要用他们自己的工具链才能打开的,但车企没法获得Mobileye的工具链支持。

某家跟 Mobileye 合作的中国传统车企,需要装一个智能车灯,向 Mobileye 提出将感知数据开放,但被拒绝了。也许,Mobileye 一方的心理活动是这样的:鬼知道你要拿这些数据去干什么呢?

更令车企无语的是,Mobileye 甚至也不允许他们「私自」在车上安装「额外的」摄像头来搜集数据(跑影子模式)。

车企们哪怕只是加装一个摄像头做行车记录仪、搜集一些道路数据做高精地图,或是录取一些视频用来做事故后的视频回放,或是做决策规划算法,Mobileye 看见之后都会起疑心。

虽然他们并不会立马禁止车企这么做,但会不停地质问:「你到底想干什么?你是不是想自己做算法取代我?」车企需要不停地解释。

倘若 Mobileye 断定车企有自研算法的想法,哪怕只是误会一场,他们也会强迫车企将车辆召回,拆掉那个「额外的」摄像头。车企如果不配合,则 Mobileye 对该车企已量产车型的技术支持会暂停。

此外,Mobileye 对车企的控制,还会延伸至产品设计环节。

通常,Mobileye 直接合作的对象是车企指定的 Tier 1。Mobileye 虽然不直接参与 Tier 1 们对摄像头、雷达、ECU 和电路板等的选型,但 Tier 1 们在选好之后需要先交给 Mobileye 审核,而这审核的周期,通常长达 3-6 个月,这会让主机厂们特别郁闷。

更过分的是,同一家车企,仅仅因为要在一款新车型上继续使用 Mobileye 的产品,Mobileye 便要重新审核一遍,并要收钱几十万到上百万美金的费用。

与 Mobileye 的封闭模式不同,英伟达、华为、地平线等公司的自动驾驶芯片业务在商业模式上都比较开放,即允许用户自己写算法。特斯拉和小鹏便是为了「算法自主」而选择英伟达的代表。

但正如本文开头提到的例子,特斯拉在 2016 年底从 Mobileye 的 EyeQ3 切换成英伟达的 Drive PX 2 时曾出现过 AEB 功能降级的问题——只要车速高于 28 英里/小时,AEB便无法发挥作用,而在Autopilot 1.0时代,只要车速不超过85英里/小时,AEB便可发挥作用。

那次 AEB 功能降级的原因是:特斯拉当时的算法还不行。当然,在半年后,这一问题得以解决。

这意味着,对用惯了 Mobileye 的软硬一体化方案的车企而言,在算法能力还不成熟、经验不足的情况下就仓促改用英伟达的方案,其实是要冒很大的风险的。

自己搞算法的验证流程会很复杂、周期也很长,并且,如果自己的算法跟英伟达的芯片适配不好,还会出现一些自己事先未曾预料到的问题。

但如果改用地平线的方案,就不存在这种顾虑了。因为,在提供软硬一体化选项的同时,地平线还会帮助客户掌握算能力。

地平线还会选择在至少两个层面向客户开放:

  1. 将感知环节的原始数据开放出来,充分赋能 Tier 1 和车企做具体的功能;
  2. 把更底层的工具链开放出来,并在这个工具链上面提供丰富的软件模型、算法模型的样板库,客户可以根据自己的场景数据进行迭代,甚至可在此基础上开发自己特有的算法模型。

2019 年,搭载征程 2 的方案部署在某韩国客户的 1000 辆公交车上,对写着韩文的交通标志的识别功能,便是该客户基于地平线开发的工具链做出来的。

在中国,地平线跟长安合作成立了长安 - 地平线人工智能联合实验室, 大家比较熟悉的 UNI-T 的智能座舱(搭载征程 2)项目便是这个实验室的首个重大成果。在这个联合实验室里,地平线为长安提供技术指导,协助长安的算法工程师自己开发算法。

而在跟几家主机厂合作的 ADAS 项目中,地平线也扮演着类似的角色。

余凯说:「我们不是交付算法,而是做主机厂的顾问,帮助他们开发自己的算法。其实,技术上的 know-how 有时候就是捅一层窗户纸的事情,车企也有大量很聪明的人,一点就通了。」

去年 11 月,地平线还跟本土 ADAS 方案供应商福瑞泰克建立了合作关系。与国际 Tier 1 只提供黑盒子不同,福瑞泰克等本土 Tier 1 可以开放的态度来跟车企合作,算法可由车企主导,或者是双方共同来写。

并且,这些本土 Tier 1 还可以考虑参与到车企的车型设计过程中,共同定义电子电气架构,确保该车型的电子电气架构确实能满足自动驾驶的需求。

在接下来的一年里,将有多款搭载基于征程 2 的 ADAS 功能的前装量产车型落地。这些客户中,既有民企,也有央企。

最近,Mobileye 要做 Robotaxi 业务的计划引起了许多人的关注。笔者曾问余凯:「Mobileye 这一举动会给其他芯片厂商带来怎样的启示?」对此,余凯的回答是:「地平线不会去做 Robotaxi,我们就做机器人时代的底层赋能者。」

更重视中国客户,服务流程短

「你有没有拿到芯片原厂的支持?」在任何一个用到芯片的产业里,这都是一个非常重要的问题。遗憾的是,中国车企们普遍反映,无论 ADAS 供应商是 Mobileye 还是其他公司,他们都很难获得「原厂支持」。

如某车企研究院总工程师说:国外很多厂商的产品功能,对中国车企都有所保留。

更常见的一种情况是,这些供应商们并没有明确说不支持中国车企,只是,从实践上看,他们的最新技术,优先支持的肯定是欧美的车企,而不会是中国车企。

一位国内 ADAS 公司创始人说:我们之前用了一些欧洲和日本的芯片,但在厂商提供技术支持的时候,我们只能排在第二梯度,结果导致我们的批量应用时间落后于欧洲日本。

还有一个让中国车企们无奈的事实是,Mobileye 在中国并没有针对前装市场的技术支持团队。车企们在产品使用中若遇到问题了,需要 Mobileye 派人从以色列飞到中国来解决,要么是中国公司派人去以色列,无论哪种方式,时间成本都会非常高。

此外,车企们日常的服务需求,也会受到国际外国人「周末不加班」文化的制约。某车企的工程师抱怨说:「接到用户投诉了,我们很着急,我们愿意周末加班加点解决,但人家(供应商)周末可是要休息、要度假的啊。」

而地平线作为本土的芯片「原厂」,以更高的效率来响应中国车企及本土 Tier 1 们的服务需求是他们天然就具备的优势。

尤其是,地平线作为初创公司,公司内部的层级较少,流程会更简单高效,「不存在绕了好几层还没找到负责人的问题。几位老总遇到问题,直接找余凯就行了,我直接找编译器开发团队直接支持。」在去年年底的一场圆桌论坛上,余凯如是说道。

据余凯透露,已经有欧洲的合作伙伴在跟他们一起在当地采集数据了。有合作伙伴建议地平线「不要只聚焦于中国市场,还要攻占全球市场」,不过,那将是另外一个故事了。

如果您对这个话题有不同的理解,或有其他关于无人驾驶的经验可分享的,欢迎加作者微信 charitableman 交流。

观点 · 0
仅看车主: 0
按赞同排序