九章智驾

九章智驾

2021-04-18

华为自动驾驶域控制器:现货PK期货,工程能力 PK 只有算力

*作者:苏清涛

北汽 ARCFOX 阿尔法 S 上搭载的智能驾驶计算平台,是华为针对这款车定制开发的 MDC Pro 610,算力高达 400+ TOPS。而接下来,华为 MDC 将结合业界普遍的智能驾驶算力需求,基于 MDC Pro 610 的底层能力打造成面向所有车企客户的平台化标准化产品 MDC 810。

实现 L4 级自动驾驶究竟需要多少算力?并没有一个明确的答案,车企不太敢轻易下结论,而芯片厂商们的口径则一直在变。

前几年,有人说是 300 TOPS;后来,有人说是 500 TOPS;再后来,又有人说是 1000 TOPS...... TOPS 算力的 AI 芯片 Atlan 来看,自动驾驶域控制器的算力应该很快就被「哄抬」到 2000 TOPS 以上。

而车企,无论自己在未来几年的算法水平是否真的需要那么大的算力,也得或主动或被动地卷入这场「算力攀比赛」中,用某自动驾驶芯片公司销售人员的话来说,这也是「内卷」。但没办法,在现在的大环境下,似乎只有大算力才能给车企足够的「安全感」。

但在 4 月 18 日的 MDC 810(算力 400 + TOPS)发布会上,华为则强调,自动驾驶域控制器,不能光拼算力,还得看背后的工程能力。正是有了这种能力,华为才有底气在发布会当日宣布「发布即量产」。

当前,200 TOPS 以上高算力自动驾驶芯片的供应商只有英伟达、高通、华为,从目前已公开的信息来看,英伟达和高通最新款自动驾驶芯片的算力更高,并且,英伟达也拿下了最多的量产订单,但这两家公司的定位都是 Tier 2,他们只卖芯片,却缺乏系统集成经验,而定位 Tier 1 的华为,则早已积累起了强大的整机工程能力。

固然,在软硬件解耦的大趋势下,会有越来越多的车企选择绕开 Tier 1 直接跟芯片厂商谈合作,但现阶段,多数车企仍然不具备自己做自动驾驶域控制器的能力——即便有这个能力,在当前的机会成本也比较高,因此,他们仍然要委托一个 Tier 1 来负责集成工作。

因此,如果芯片厂商自己就可以提供域控制器,则车企的工作量便少了许多。

算力攀比与英伟达的「座次焦虑」

2016 年 9 月 29 日,在 GTC 欧洲大会上,英伟达首次正式公布了下一代 Tegra 处理器,代号 Xavier。按计划,Xavier 将基于台积电 16 n 制程生产,集成多达 70 亿个晶体管,可在 20 W 的功耗下达到 20 TOPS 的算力。按英伟达最初的计划,Xavier 将于 2017 年底在台积电流片。

在此之前,根据公开信息,正在规划中的自动驾驶芯片中算力最高的是 Mobileye 的 EyeQ 5——最高功耗 5 W,算力 12 TOPS。由此看,英伟达的 Xavier 是瞄着「第一」的位置而来的。

不过,到了 2017 年 12 月,已经被英特尔收购的 Mobileye 却宣布 EyeQ 5 将推出 12 TOPS 和 24 TOPS 两个版本。有了 24 TOPS 的 EyeQ 5,20 TOPS 的 Xavier 就很难保住「第一」的位子了。

事实上,不服输的英伟达早已经「先发制人」了——2017 年 10 月 11 日,在德国慕尼黑举行的 GPU 技术大会上,英伟达公布的 Xavier 参数已经升级至:12 nm、90 亿个晶体管、30 TOPS了,相应地,功耗也升级至 30 W。

在这次大会上,英伟达还推出了一款号称「面向 L4 级自动驾驶」的计算平台 Drive PX Pegasus,Drvie PX Pegasus 包括了两颗 Xavier SoC 和两颗基于图灵架构的 GPU,算力能高达 320 TOPS。尽管这款功耗高达 500 W 的计算平台完全不适合量产,但由于在它在那个阶段属于「算力之王」,仍然引起很多公司的浓厚兴趣。

不幸的是,不屑一切代价追求大算力的 Pegasus 并未能在「第一」的位子上呆多久—— 2018 年 10 月份,在华为全联接大会上,华为推出的 MDC 600 算力高达 352 TOPS,而功耗(352 W)却比 Pegasus 低。

尤其让英伟达感到紧张的是,当年华为 MDC 600(技术预研版)使用的主芯片昇腾 310 算力高达 16 TOPS,而功耗却仅有 8 W,能效为 2 TOPS / W,远高于同样基于 12 nm 制程的 Xavier(能效 1 TOPS / W )。

在被华为抢走自动驾驶算力冠军的同时,英伟达跟特斯拉的合作关系也开始走向终结。特斯拉在 2017 年底首次正式承认了正在自研自动驾驶芯片,而在 2018 年 8 月份,特斯拉称,自研芯片即将完成。

在 2019 年 4 月 22 日的「自动驾驶日」上,特斯拉正式公布了自研的 FSD 芯片的参数:16 nm,72 TOPS,36 W。无论算力还是能效,都比 Xavier 高出一大截。

诚然,考虑到 ASIC 的高能效是以牺牲了一定的灵活性为前提的,拿 ASIC 芯片的算力和能效跟 GPU 比,对基于 GPU 核的 Xavier「并不公平」,但在算力攀比的大背景下,很少有客户会理性地去看这个问题,甚至连英伟达自己也被绑架了。

于是,2019 年 9 月,在 Xavier 仅拿下小鹏一个量产客户的情况下,英伟达依然迫不及待地发布了算力高达 200 TOPS 的7 nm 自动驾驶芯片 Orin。

按计划,Orin 要到 2023 年才能量产。有人猜测,英伟达这么着急地推出 Orin,就是被华为的 MDC 600(技术预研版)给「刺激到了」。

不过,Orin 并未能坐稳算力排行榜上的第一把交椅——它很快就被高通「斩落马下」。

在 2020 年 1 月份的 CES 上,高通也发布了自动驾驶计算平台 Snapdragon Ride,该平台可在 130 W 的功耗下实现 700 TOPS 的算力,彼时,有消息称,Cruise 和 Argo 都在使用高通的自动驾驶芯片做测试。

CES 之后,多家中国车企开始跟高通接触。据知情者透露,高通的自动驾驶芯片有 SA9000 A 和 SA9000B 两款,算力分别为 200 TOPS 和 300 TOPS,跟英伟达 Orin 一样,SA9000 也是基于 7 nm 制程的,但能效却高达 5 TOPS / W(Orin 最初的版本能效是 3 TOPS / W)。

高通的芯片在手机市场上和智能座舱市场上都有极强的竞争力,但其在自动驾驶市场上完全是一个新手,之前积累的优势也未必能发挥出来——高通的强项是 CPU,但在 GPU 方面的能力积累不足,而在自动驾驶的计算中,GPU 核占的权重比较大。

小鹏自动驾驶副总裁吴新宙在加入小鹏之前曾担任高通自动驾驶负责人,据称小鹏也曾跟高通有过谈判,小鹏最终并没有选择高通的 Snapdragon Ride 或 SA9000,而是选择了英伟达的 Orin。

2020 年 9 月份以来,理想、小鹏、蔚来、上汽知己、上汽 R 品牌等在做「硬件预埋」方案时纷纷选择了 Orin。看上去,英伟达已取得了阶段性胜利,但在硬件军备竞赛的大背景下,算力再多都是「不够用」,因此,英伟达仍不能高枕无忧。

有几则小插曲:

  1. Orin 原计划是在 2023 年量产,但为了配合理想 X01 的上市节奏,黄仁勋亲自拍板决定将量产时间提交前到 2022 年;

  2. Orin 的功耗,最初说是 67 W,但在 2020 年 9 月份跟理想合作的发布会前后被后调整到 45 W;

  3. Orin 的算力,从发布到跟理想合作时,对外说的都是 200 TOPS,但到了 2021 年 1 月份蔚来 ET7 发布会的时候,算力升级至 254 TOPS。

本来,量产时间提前一年就已经很仓促了,而英伟达却又先后来了一次降功耗与一次算力升级,这个就很令人好奇了——如果已经有样品了,那功耗降低及算力升级就需要重新设计、重新流片(可能是重来了 2 次);而如果还没有样品,则功耗降低及算力升级就应该只是在 PPT 上「降低」或「升级」。

此外,高通 SA9000 目前也停留在样品阶段。而 2020 年 9 月底的北京车展上,笔者在华为的展台上了解到,其算力高达 160 TOPS 的 MDC 610 所用的芯片,在美国制裁之前已经有了备货。

也是在那次北京车展期间,Momenta 公司 CEO 曹旭东在一场演讲中说,「MDC 610 在已量产的自动驾驶计算平台中是算力最高的」。

2021 年 4 月 12 日,对「排座次」看得很重的英伟达又发布了全新的自动驾驶 SoC Atlan,单颗 SoC 的算力能够达到 1000 TOPS,相比 Orin SoC 算力提升接近 4 倍。

不过,据佐思产研近日在《详解英伟达最新自动驾驶芯片 -Atlan》一文中的评论,Altan 实如此大算力的前提是高算力是「不太考虑成本,不太考虑功耗」。

作者还指出,英伟达推出 Atlan 的一个用意是「拉上对手做算力军备竞赛,在宣传上大造声势,压迫对手必须跟进算力游戏,直到拖垮对手」「其他厂家恐怕不会跟进这种算力数字游戏,这脱离了实际需求。Orin 恐怕将是英伟达未来数年的主力产品。」

此外,Altlan 要到 2023 年才能向开发者提供样品,至于量产装车时间,则要等到 2025 年了。

算力再牛,如果一时半会儿还无法提供样品,便不能为客户创造任何价值。

也是在那那天,笔者无意间在华为 MDC 平台负责市场营销的一个朋友的朋友圈那里看到一句话「不比期货吹牛逼,只拼现货真实力」。而最近凭强大的自动驾驶能力屡屡登上热搜的北汽 ARCFOX 阿尔法 S 上搭载的自动驾驶计算平台,便是华为为这款车定制开发的「现货」MDC Pro 610。

MDC Pro 610 总算力高达 400+ TOPS。看起来,算力比不上 4 颗英伟达的 Orin,但胜在「有现货」。

话说,近几天,当华为跟北汽极狐合作的自动驾驶汽车在城区开放道路上跑的视频火起来后,许多业内人士都非常震惊,有朋友来问我的看法,我的回答是:

「我丝毫不感到意外。这些年,自动驾驶圈有个风气很不好,很多公司,还没有想清楚要不要做一件事的时候就开始放出说「我计划做」,做到 30 分的时候,说「马上做好」,只做到 60 分的时候,开始强调自己「已经是第一了」;

而我发现,华为的风格则是,如果他们说「我打算做」,就已经做到30分了,如果说「正在做」,就已经做到 60 分了,等到搞发布会的时候,差不多已经做到 80 分了,甚至是已经有可交付的成熟产品了。

这是华为在长期做 To B 业务的过程中形成的一种习惯。他们这么搞,往往使竞争对手很难跟进。」

言归正传,华为对 MDC 810 做了大量备货,却一直秘而不宣,这也是跟其长期以来「少说多做」的文化一脉相承的。

接下来,华为 MDC 将坚持平台化标准化的研发布局,结合业界普遍的智能驾驶算力需求,基于 MDC Pro 610 的底层能力打造成面向所有车企客户的平台化产品 MDC 810。

英伟达和高通为什么只卖芯片,不卖「盒子」?

细心的朋友应该已经注意到了,华为 MDC 产品在市场推广中很少提芯片的具体参数,而是直接讲整个 MDC 平台的总算力、整体功耗等。这是由华为自动驾驶业务的商业模式决定的——不单独卖芯片,而是「卖盒子」。

所谓「卖盒子」,是指华为提供包括自动驾驶芯片、操作系统、算法、传感器方案、开发工具链在内的全栈式解决方案(包括但又不局限于域控制器)。这套全栈式方案,已经过 ISO 26262 ASLD 认证,并即将搭载在北汽、长安跟华为合作的量产车上。

当然,在提供盒子的同时,华为又保持足够高的开放性,比如,客户可以自己决定算法怎么写、传感器怎么搭配。此外,华为不会跟车企争夺对数据的控制权。

相比之下,英伟达和高通主要是提供芯片和开发工具链,「盒子」主要由车企指定的 Tier 1 来完成。比如,在英伟达跟小鹏和理想的合作中,「盒子」的工作由德赛西威来承担。

在软硬件解耦的大趋势下,有不少车企是希望自己写算法、设计传感器方案的,因此,他们也倾向于只从芯片厂商那里买芯片,然后再跟 Tier 1 合作做「盒子」;但还有不少车企,现在比较着急在量产车上搭载自动驾驶套件,而自研算法、自己设计合作却又来不及,那么,对这些客户,如果芯片厂商直接提供包括算法在内的「盒子」,反而是更好的选择。

即便是那些具备自研算法能力、只从芯片厂商那里买芯片的车企,也应该很快会意识到,并非「只要有了芯片,搞个域控制器很容易」。事实上,「从算法到盒子」的过程,充满了各种「坑爹」的工程挑战。如果选择的「盒子集成商」(Tier 1)不够给力,车企的自动驾驶量产进度便会被拖延;或者是,尽管如期交付了,但效果跟预期有差距。

这个时候,如果芯片厂商有很强的系统集成能力,能把「盒子」做得很好,则车企便可选择从芯片供应商这里这里买回整个盒子的硬件部分及操作系统、工具链,然后再注入自己写的算法。

站在车企的角度看,与只卖芯片相比,芯片厂商「卖盒子」还有一个重大好处是:责任比较清晰,出了问题,他们只找盒子供应商就行了,而不是被芯片厂商、操作系统厂商及域控制器供应商互相「踢皮球」。

此外,即将成为潮流的「硬件升级」趋势,客观上也利好能提供「整个盒子的芯片厂商。

谈「硬件升级」之前,需要先谈谈现在比较流行的「硬件预埋」。正如我们在本本文开头所说,L4 级自动驾驶究竟需要多少算力,谁也没个准数;事实上,我们看到的是,这个「多少才算够用」的标准,正在持续升级。

特斯拉在 2016 年下半年推出 Autopilot 2.0 的时候说是「可支持 L4 的硬件」,后来发现不够,又在 2017 年夏天加了两颗小芯片,升级至Autopilot 2.5;再后来,发现 2.5 也不够用,于是又推出了 Hardware3.0 硬件。Hardware 3.0 号称能满足 L4 的需求,但如今特斯拉又在搞4.0的硬件,新版硬件打算在 2021 年底之前量产, 这就等于承认了 3.0 硬件的算力是「不够用的」。

此外,心细的朋友应该早就注意到了,英伟达 的 Xaiver,之前说是「L4 芯片」,现在却只敢在 L2 市场上玩了。Orin 之前说是 L4 芯片,但也许等 Atlan 量产之后,Orin 会被归为「L2 芯片」。

所以,我们需要设想一个问题:过几年,若芯片厂商们纷纷推出了算力高达 2000 TOPS 的低功耗芯片 / 计算平台,那些现在预埋了「可支持 L4 的硬件(算力 1000 TOPS 左右)」的车企们还能「坐得住」不?

由于芯片的迭代周期短于车的寿命周期,因此,特斯拉、理想、丰田等有前瞻性的车企在做「硬件预埋」的同时,还会为「硬件升级」做准备,即当预埋的硬件不能满足更高等级自动驾驶功能对数据处理的需求时,可对硬件进行升级,这需要车辆设计之初便预留好相应的硬件接口。若不能直接升级,就需要在改款版本中采纳新的硬件。

在应对「硬件升级」趋势时,华为这种「卖盒子」的公司,显然会比英伟达和高通这种只卖芯片的公司有更大的优势。事实上,华为早就为此做好了准备。在去年 9 月份的北京车展上,华为展出的 MDC 610 与 MDC 210 的尺寸及接口完全一样,就是为了保证日后做硬件升级时能「即插即用」。

相比之下,芯片厂商如果不做盒子,则在后续车企需要做「硬件升级」时,进度可能会被盒子集成商给拖累。

英伟达曾基于 Xavier 芯片做过 DRIVE PX2 Parker 、DRIVE Xavier、DRIVE Pegasus 等盒子,但都是定位于「开发板」(用于功能验证与技术培训之类的),而不适合量产,否则就不必让德赛西威基于 Xaiver 芯片又专门做一个 IPU03 盒子了。

从理论上讲,对英伟达和高通来说,在卖芯片之余再增加一个「卖盒子」的选项,是比只卖芯片更好的选择。然而,他们为什么没有这么做呢?

答案是:工程化能力不足。尤其是,高通从来就没有做过整机产品。

工程技术能力,类似于日本的「工匠精神」,表面看起来「单调枯燥」,实则有很高的壁垒。

比如,你能不能搞定散热问题?

算力比较小的「盒子」,因为功耗比较低,可以自然散热,既不需要风扇也不需要液冷;但通常只有功耗在 30 W 以下的产品才可以自然散热,一旦功耗超过 30 W,便很难自然散热,如果散热问题处理不好,温度会急剧上升、发烫,导致产品的寿命和稳定性都会受到影响。

并且,无论制程多高,算力的提升总会带来功耗的上升,至于通过优化架构来降低芯片功耗,往往只能使功耗问题得以缓解,而不能根治,这意味着,算力的提升也必然会对系统的散热能力提出很大的挑战;而散热问题如果处理不好,则会严重影响产品的可靠性。

比如,搭载在乘用车上的「盒子」主要靠液冷散热,没有风扇,即便气密性做得很好,盒子里面还是会有少量空气存在,如果外面的温度变低而里面的温度比高,当里面的水汽碰到「盒子」冰冷的壳,就很容易液化;

有时,底盖下面结的露水,如果处理不好,就会滴到电路板上,导致电路板被烧毁。

需要再强调一下:做芯片时,实现低功耗是壁垒;但在芯片算力既定、做「盒子」的时候,如何处理高功耗下的散热问题,则是个很高的壁垒。遗憾的是,在算力竞赛的热潮下,后一种壁垒往往被忽略了。

传统汽车时代,由于电子元器件占比不高,并且 ECU 算力普遍比较小,功率也不太高,因此,中小型 Tier 1 们没必要经常去处理散热问题,也这导致他们在应对自动驾驶域控制器的散热问题时经验不足。

再比如,电路板上的线怎么排布?间距太大会占用板子面积,导致空间不够用;间距太小,则信号干扰会比较严重,进而导致产品性能极不稳定。

再比如,电子元器件用的胶水能不能防浸水?有些经验不足的 Tier 1 出于成本的考量选择了价格比较低的胶水,结果,只能防泼水,却不能防浸水。

工厂技术能力方面的壁垒,往往是靠花足够的时间来街垒的。而华为在做基站的过程中就已积累起了散热及精密制造等工程技术能力。

大算力自动驾驶芯片的市场格局性对稳定

除英伟达、高通和华为外,大算力自动驾驶芯片市场也许还会有一个很容易被忽略的潜在玩家:Waymo。

因为「看不上」别的公司做的芯片,Waymo 已经自研了自动驾驶芯片,该芯片将由三星代工。而自 2019 年下半年以来,Waymo 开始探索在做 Robtaxi 运营商的同时也做 Tier 1,为车企提供包括自动驾驶操作系统、算法、芯片、激光雷达、毫米波雷达在内的全栈式方案。

以 Tier 1 身份出现的 Waymo,在商业模式上跟华为极为相似。但有个重大区别是:Waymo 是个软件出身的公司,完全没有做硬件的基因,他们的,他们的「盒子」集成工作,会交给麦格纳来完成。

理论上讲,如果 Waymo 这一条路能走通,则英伟达、高通、华为在自动驾驶市场上的份额都会减少。 但现实也许并不会朝着 Waymo 设计的剧本走。

华为跟北汽合作的车上,装了 3 颗激光雷达 + 6 颗毫米波雷达 + 13 颗摄像头,相比之下,Waymo 的车上装了 5 颗激光雷达,而摄像头则多达 29 颗,这完全就没有考虑到量产的可行性,没有成本意识。

从 John Krafcik 的下课看,Waymo也许已经意识到直接做 L4 的路线走不通,接下来,他们计划跟车企合作攻前装量产(L2 +)市场,传感器方案也会「减配」。但是,对 Waymo 来说,做 L2 市场的 Tier 1,也许比做 Robotaxi 运营商更难。

因为,在做 Robotaxi 业务的时候,Waymo 自己就是甲方,可以自己定义需求,买车和元器件来集成就行了;但如果做 Tier 1,他们还需要先搞定 Tier 2 甚至 Tier 3,不仅确保各种零部件的质量没问题,还要控制好成本,这似乎已经远远超出了 Waymo 的能力。

此外,Waymo 原来 L4 的算法架构,都是基于5颗激光雷达做的,现在做 L2 +,传感器已经减配了,你的算法架构能不调整吗?

由俭入奢易,但由奢入俭难,在传感器减配后,Waymo 会经历相当长一段「阵痛期」。

更糟糕的是,尽管 Waymo 终于放心身段给车企做「乙方」了,车企们也未必买账。

Waymo 在去年上半年的 30 亿美元融资中,没有一家整车企业参与投资;也就是说,暂时,还没有一家车企跟 Waymo 这个潜在的「技术供应商」深度捆绑。

也许,以是否投资 Waymo 为标准,可以把汽车制造商们分两种:有钱但不愿意投的;想投但没钱的。

先看看那些「有钱的」头部车企吧:

大众-福特、丰田、通用-本田这些公司 / 联盟,都已经为自研自动驾驶砸下了至少 50 亿美元的资金;

宝马已跟 Mobileye 深度结盟,戴姆勒的乘用车已跟英伟达深度结盟,只在卡车业务上跟 Waymo 合作(但仍未放弃自研自动驾驶卡车技术)。

现代已出资 16 亿美元跟安波福成立了合资公司......

不排除这些车企会在局部市场上拿出几百辆、甚至几十辆车跟 Waymo 做一些探索性的合作,但也仅此而已。

实际上,肯做 Waymo 的客户(搭载 Waymo 的自动驾驶技术去做运营)的,也仅限于一些比较弱势的车企,至少是一些在自动驾驶领域存在感不强的车企。

但 Waymo 跟这些「弱势车企」的关系并不牢固。

如 Waymo 的第一个车企客户雷诺日产三菱。在戈恩事件后,雷诺日产三菱联盟的关系能否持续,还存在很大疑问。假如联盟解体,之前跟 Waymo 签的协议能否照常履行?

FCA,虽然可能跟 Waymo 合作在意大利开展出行运营,但该公司早在 2017 年便加入了宝马 - 英特尔 - Mobileye - 德尔福的联盟,旗下玛莎拉蒂也确实已打算使用该联盟开发的自动驾驶技术。

目前给 Waymo 做供应商的捷豹路虎,好像并不打算再做 Waymo 的客户了。因为,该公司在 2020 年初刚已美国第二大出行公司 Lyft 投入了 2500 万美元,合作开发自动驾驶技术。

Waymo 在 2020 年 6 月份跟沃尔沃达成了合作,但据沃沃尔一位曾参与过合作谈判的人士透露,其实双方合作的性质仍然是「沃尔沃卖车给 Waymo」,而非「沃尔沃采用 Waymo 的自动驾驶技术」。

实际上,Waymo 的技术授权模式喊了至少有两年时间了,却没有什么斩获。

因为车企不愿意做「富士康」,所以,Waymo 觉得做运营商不容易;但技术授权这条路也不好走,因为,有进取心车企也不愿意做「惠普」「戴尔」或「安卓手机制造商」——即操作系统和芯片完全依赖供应商。

梳理后发现,车企中愿意做「惠普」「戴尔」的,应该主要是马自达、斯巴鲁、铃木这种存在感更弱的中小车企了。

至于中国车企,鉴于中国市场上有那么多自动驾驶方案公司,而且头部车企们自研自动驾驶技术的决心也很大,Waymo 就别指望做他们的 Tier 1 了吧?

结合我们上面的种种分析来看,Waymo 的技术授权模式,理想丰满,但现实骨感,很有可能找不到客户。因此,最终,Waymo 将会「被迫造车」,从而实现「内循环」。但内循环之后的 Waymo ,就不大可能跟英伟达、高通、华为会在芯片市场上竞争了吧?

本文著作权归作者所有,并授权 42 号车库独家使用,未经 42 号车库许可,不得转载使用。
评论 · 0
仅看车主: 0
按赞同排序

传图
大胆发表你的想法~
12
评论