308

308

车库报道组负责人

关注

毫末的智能驾驶「平衡术」:左手大模型,右手性价比

毫末智行

2023-10-12

高阶智能辅助驾驶,正在迎来一场大爆发。

根据工信部公布的数据,2022 年,具备 L2 级高阶智能辅助驾驶的乘用车新车渗透率达到了 34.9%;今年上半年,具备高阶智能辅助驾驶功能的乘用车新车销量占比达到了 42.4%。

不仅如此,到 2025 年,预计乘用车高阶智能辅助驾驶的渗透率将会达到 70%。

面对这样的市场大趋势,如果在技术和成本之间做取舍,成为自动驾驶公司在量产落地时要面临的一个关键问题——于是,致力于在乘用车高阶智能辅助驾驶市场占据一席重要之地的毫末,在第九届 AI Day 上出招了。

三款 HPilot 产品,强调极致性价比

与往届相比,这次毫末 AI Day 的一个重大不同在于:它不再仅仅侧重于强调毫末在 AI 算法、数据、算力等自动驾驶技术方案层面的突破,而是加入了商业落地层面的元素。

一个最为典型、也最受外界关注的动态,就是毫末重磅发布了第二代三款 HPilot 产品,分别是毫末 HP170、毫末 HP370、毫末 HP570,各自瞄准的是低、中、高三个层次价位的车型量产需求。

当然,这三款产品有一个共同的标签,那就是「极致性价比」。具体来看:

毫末 HP170 是 3000 元级的高速无图 NOH 产品方案,可以实现行泊一体智驾。硬件配置上,算力为 5TOPS,传感器方案标配 1 个前视相机、4 个鱼眼相机、2 个后角雷达、12 个超声波雷达,灵活选装 1 个前视雷达和 2 个前角雷达。

场景上,毫末 HP170 可实现高速、城市快速路上的无图 NOH,短距离记忆泊车等功能,并获 E-NCAP 5 星 AEB 的高安全标准认证。

毫末 HP370 是 5000 元级的城市记忆行车与记忆泊车产品方案,可以实现行泊一体智驾。硬件配置上,算力为 32TOPS,传感器方案标配 2 个前视相机、2 个侧视相机、1 个后视相机、4 个鱼眼相机、1 个前雷达、2 个后角雷达、12 个超声波雷达,灵活选装 2 个前角雷达。

场景上,毫末 HP370 可以实现高速、城快,以及城市内的记忆行车,免教学记忆泊车、智能绕障等功能。关于这个产品的定位,毫末智行董事长张凯表示:「毫末的记忆行车可看作毫末城市 NOH 的最小集,是城市 NOH 的强有力补充。」

毫末 HP570 是 8000 元级的城市全场景无图 NOH 产品方案,未来将在 100+ 城落地。硬件配置上,算力可选 72TOPS 和 100TOPS 两款芯片,传感器方案标配 2 个前视相机、4 个侧视相机、1 个后视相机、4 个鱼眼相机、1 个前雷达、12 个超声波雷达,还支持选配 1 颗激光雷达。

场景上,毫末 HP570 可实现城市无图 NOH、全场景辅助泊车、全场景智能绕障、跨层免教学记忆泊车等功能。关于毫末 HP570,张凯强调:「HP570平台的历史使命是打造行业内最具性价比的高阶城市智驾产品。」

综合来看,毫末 HP570 代表了毫末智驾方案在量产落地上面向城市 NOH 的最新成果,而毫末 HP370 和毫末 HP170 则更多事基于市场洞察而面向中低端乘用车做出的对应选项,满足的是不同用户的需求。

比如,之所以推出毫末 HP170,是因为毫末认为,到 2025 年,行泊分体的硬件设计、一体机逐步退出市场,更具性价比的行泊一体的域控方案将成为主流。

在现场采访环节,毫末方面也告诉我们,虽然它推出了基于 72TOPS 和 100TOPS 算力的 HP570 方案,但是这个方案不会影响此前已经宣布的基于 360TOPS 算力的 HP550 方案,而毫末 HP570 方案将会在明年第四季度才能量产。

当然,无论是从算力来看,还是从价格本身来看,这三款产品确实都贴上了浓厚的「性价比」标签——对此,毫末的答案非常直白,就是要把「价格打下来的同时性能打上去」。

一个字,卷。

大模型该如何助力自动驾驶?

除了推进量产落地和市场规划方面的突破,毫末也在不断推进自动驾驶 AI 技术层面的探索和突破——这些也在本届毫末 AI Day 上得到了集中展示。

而这次的话题核心只有一个:大模型。

在活动现场,毫末智行 CEO 顾维灏带来了主题为《自动驾驶 3.0 时代:大模型将重塑汽车智能化的技术路线》的演讲。其中,此处所定义的「自动驾驶 3.0 」指的是以大数据、大模型为特征,以数据驱动为开发模式。

与「自动驾驶 2.0」相比,毫末所定义的「自动驾驶 3.0」在技术框架上的主要不同点,就是「大模型」。具体来看:

  • 首先,自动驾驶会在云端实现感知大模型和认知大模型的能力突破,并将车端各类小模型逐步统一为感知模型和认知模型,同时将控制模块也 AI 模型化。
  • 随后,车端智驾系统的演进路线也是一方面会逐步全链路模型化,另一方面是逐步大模型化,即小模型逐渐统一到大模型内。
  • 然后,云端大模型也可以通过剪枝、蒸馏等方式逐步提升车端的感知能力,甚至在通讯环境比较好的地方,大模型甚至可以通过车云协同的方式实现远程控车。
  • 最后,在未来车端、云端都是端到端的自动驾驶大模型。

那么,基于这一理念,在 4 月份推出 DriveGPT 之后,毫末是如何将大模型应用到 DriveGPT 的框架中去的?

这里面主要从感知和认知两个阶段来看。

先来看感知阶段。

DriveGPT 首先通过构建视觉感知大模型来实现对真实物理世界的学习,将真实世界建模到三维空间,再加上时序形成 4D 向量空间;然后,在构建对真实物理世界的 4D 感知基础上,毫末进一步引入开源的图文多模态大模型,构建更为通用的语义感知大模型,实现文、图、视频多模态信息的整合,从而完成 4D 向量空间到语义空间的对齐。

毫末在感知阶段的突破主要有两点:

一是视觉大模型的 CV Backbone 持续进化,当前基于大规模数据的自监督学习训练范式,采用 Transformer 大模型架构,实现视频生成的方式来进行训练,构建包含三维的几何结构、图片纹理、时序信息等信息的 4D 表征空间,实现对全面的物理世界的感知和预测——这部分是对已有感知能力的进化。

二是构建起更基础的通用语义感知大模型,在视觉大模型基础上引入图文多模态模型来提升感知效果,图文多模态模型可以对齐自然语言信息和图片的视觉信息,在自动驾驶场景中就可以对齐视觉和语言的特征空间,从而具备识别万物的能力,也由此可以更好完成目标检测、目标跟踪、深度预测等各类任务——这相当于让感知能力超脱图像的范畴,使得它变得更加立体。

再来看认知阶段。

基于通用语义感知大模型提供的能力,DriveGPT 通过构建驾驶语言(Drive Language)来描述驾驶环境和驾驶意图,再结合导航引导信息以及自车历史动作,并借助外部大语言模型 LLM 的海量知识来辅助给出驾驶决策。

值得一提的是,在引入大语言模型的过程中,毫末对大语言模型进行了专门训练和微调,从而让大语言模型更好地适配自动驾驶任务,使得大语言模型能真正看懂驾驶环境、解释驾驶行为,做出驾驶决策——认知大模型通过与大语言模型结合,使得自动驾驶认知决策获得了人类社会的常识和推理能力(即获得了世界知识),从而提升自动驾驶策略的可解释性和泛化性。

在分享了最新的 DriveGPT 大模型技术框架后,顾维灏随后也给出了毫末基于 DriveGPT 大模型开发模式的七大应用实践,包括驾驶场景理解、驾驶场景标注、驾驶场景生成、驾驶场景迁移、驾驶行为解释、驾驶环境预测和车端模型开发。

当然,最为关键的是 DriveGPT 在实际场景中赋能车端自动驾驶的实际效果,这也在活动现场得到了展示——举例来看,DriveGPT 基于通用感知的万物识别的能力,从原有感知模型只能识别少数几类障碍物和车道线,到现在可以识别各类交通标志、地面箭头、甚至井盖等交通场景的全要素数据。

其最终目的,还是为了实现毫末智能驾驶解决方案的低成本和高可用性,也就是「性价比」。

一手抓技术,一手抓落地

对于毫末来说,这次 AI Day 已经透露出它在当前市场环境下的一个新选择:一手抓技术,一手抓落地。

在技术层面,毫末已经确定了以 DriveGPT 为核心的自动驾驶渐进式发展路线,并且会继续推进和探索大模型在自动驾驶场景中的云端和车端部署;在落地层面,则是将此前的技术积累根据市场需求落地为产品和成果。

那么,今年毫末在自动驾驶落地方面取得了哪些成果?具体来看:

第一是智能驾驶装机量。在活动现场,毫末宣布已经位于「中国量产自动驾驶第一名」,辅助驾驶产品 HPilot 整体已经搭载到 20 款多车型,用户辅助驾驶行驶里程突破 8700 万公里——其中,最新搭载毫末 HPilot 的车型为山海炮 HEV 版和新摩卡 Hi-4S 等。

在采访中,毫末告诉我们,除了长城系的车型之外,毫末与其他车企的定点方案也在持续快速推进中,因为今年还是比较忙碌的。

第二是关于 MANA 大模型。毫末表示,在 DriveGPT 发布 200 天左右的时间里,已经累计了 480 万段 Clips 高质量测试——关键是,目前已经有 17 家生态伙伴,并帮助生态伙伴提效 90%。

第三是关于城市 NOH 百城大战。此前在今年 4 月,毫末宣布其城市 NOH 将在 2024 有序落地 100 个城市——在这次 AI Day 上,毫末表示具备城市 NOH 导航辅助驾驶功能的毫末 HP550(原 HPilot 3.0) 将搭载魏牌蓝山在 2024 年第一季度正式量产上市。

有意思的是,在 AI Day 现场,毫末方面也展示了搭载毫末 HP550 的魏牌蓝山在城市 NOH 下的测试视频,其中在保定闹市区全程 12 公里、历时 35 分钟的行驶中,手动接管 3 次。

第四是关于毫末的末端物流自动配送。毫末的末端物流自动配送车「小魔驼 3.0」,售价 89999 元,是全球首款 9 万元内中型末端物流自动配送车,可以满足在物流、商超、零售等 9 大场景的需求。

在现场,毫末也宣布:小魔驼已配送超过 22 万单,并且会在 2023 年第四季度在商超履约配送场景实现盈利。

从这次毫末 AI Day 的整体情况来看,尽管大模型等技术依旧是核心标签,但量产落地的重要性再次得到了前所未有的强调。

在采访中,毫末方面也告诉我们,过去几年,自动驾驶在技术层面确实经历了快速的迭代;最近,通过算法轻量化等方面的一些工作,此前需要大算力来支撑的自动驾驶方案,目前也已经能够落地到中等算力平台;同时,芯片的迭代也在加速,所以成本也在下降。

所以,在毫末看来,随着行业对于自动驾驶的探索越来越深入,以及芯片等硬件价格的下探,全场景的 NOH 下降到万元,已经成为必然的趋势。

当然,通过在本次 AI Day 上发布的技术突破和落地进展,毫末也在认真面对一个任何一家科技型创业公司都必须回答的核心问题:那就是如何在技术投入和商业落地之间做一个最终指向商业正循环的平衡。正如毫末管理层在接受采访时所言:

毫末在快速降低成本的时候,也要保存自己的财务健康,这样才能使自己还有自己的客户和合作伙伴一起走得非常远。

本文著作权归作者所有,并授权 42 号车库独家使用,未经 42 号车库许可,不得转载使用。

评论 · 0

0/3
大胆发表你的想法~
4
1