作者 / 白雪
编辑 / 叶方
「长途开车请勿疲劳驾驶,助手已经为您开启车内冷风。」
这是语音助手对车内驾驶员的一则温馨提示。
这背后的技术原理是,车辆通过摄像头检测到驾驶员眼睑开合度低,认为驾驶员很可能正在打瞌睡所做出的反应。
然而一切都有限定条件。
比如,车内驾驶员其实并没有打瞌睡,而是因为眼睛太小意外触发车内 DMS (疲劳/分神预警系统) 。
这并不是假设,而是真实发生在汽车媒体人常岩身上的故事。
因为他的眼睛比较小,所以被系统判定为「开车睡着了」,从而多次被系统扣减了智驾分,由此他在微博发出质疑:眼睛小的难道不配使用智能驾驶?
当问题反馈至车企,几乎所有车企都想第一时间拿到常岩的面部图像,开始调整算法策略。
但除了他之外,特例可能还有更多。
「这不是正确的解题思路。」
9 月 12 日,在长城汽车大模型交流会上,长城 AI Lab 负责人杨继峰的回答十分斩钉截铁。
他认为,一味地补充数据、写代码迟早有一天会崩盘,但规则并非如此——真正的解题思路是从单一任务变成多模态。
比如如何定义疲劳?需要用多种数据定义疲劳,既要考虑眼睑开合度等 DMS 状态,同时也要考虑驾驶员与车机的互动情况、驾驶情况、行驶车速等。
比如眼睛再小,车辆也能通过稳健的驾驶风格判断出驾驶员正在安全驾驶。
一切的底层逻辑还是要回到 AI。
以前自动驾驶是最大的 AI 问题,现在随着智能汽车渗透率逐渐增大,中国消费者市场对于车辆作为第三空间的依赖在增加——智能座舱的体验,也成为亟需攻克的问题。
在杨继峰看来,围绕 AI 时代的汽车命题无非三点:
- 机器如何像人一样开车;
- 机器如何形成人开车的驾乘空间;
- 以及在 AI 时代,如何定义车企。
当这三个问题落地,剩下的只是抽丝剥茧解决技术问题。


AI Lab (智能空间实验室) 就是在这一背景下成立的,以此掀起一场范式变革,推动长城汽车快速适应 AI 时代。
目前 AI Lab 已经 超过 400 人 。这个新组织的定位,是梳理长城汽车的数据结构,充当数据能力、计算能力、体系能力和模块化能力的 AI 技术前台与中台。
长城的这次亮牌,似乎已经准备好在 AI 时代的战场上攻城略地。
机器怎么像人开车:城市领航辅助开辟 100 城、开发 Drive GPT
自动驾驶对长城而言,并非做不做的问题,而是进展多少、有没有取得领先地位的问题。
过去两年,长城对于智能化进展的信息披露,一直保持着某种克制,让外界一度以为这只能算是踩着新能源浪潮的老牌车企。
一场沟通会,让我们重新审视了长城的智能化进展。
如果将自动驾驶在中国的发展分为二个阶段:
第一个阶段是从 2015 年开始,诞生了一批自动驾驶解决方案,传统的模块化自动驾驶分为环境感知层、决策规划层和控制执行层三层。
这种模块化的技术缺点是:系统复杂庞大,往往需要人工设计成百上千个模块。
第二个阶段是 2017 年后,自动驾驶领域开始尝试引入 Tranformer 这种基于注意力机制的神经网络模型,进一步实现端到端自动驾驶。
这带来的好处是没有人工设计的繁复规则,只需要极少的来自人类的训练数据,深度学习神经网络就能学会驾驶。
与外界认知不同,长城旗下的自动驾驶公司毫末智行是国内第一家引入 Transformer 的企业。
其实,长城发力自动驾驶至少可以追溯到六年前。
成立于 2019 年的毫末智行,前身是长城汽车智能驾驶前瞻部。
这约等于往前再推数年,长城就在内部启动自动驾驶技术开发。

直到 2019 年,为了保证毫末智行发挥出最高效率,才从长城内部拆分出来独立运营。
长城在自动驾驶领域的决心,在今年上半年已现端倪,长城主要做了三件事——围绕 Drive GPT 发布了 感知大模型 、 认知大模型 以及 3D 场景构建大模型 。
据汽车之心了解,最开始长城是用 Drive GPT 在内部的初始形态是 Dencoder,只用于解决路径规划的问题,后来才变成了用与 GPT 一样的 Dencoder knowledge 算法架构去解决预测和路径规划。
现在,长城开始极致释放 GPT 的性能,开始用 GPT 最大的压缩和推理能力去解决概率预测的问题。
「所有视觉信息压缩到 4D 智能空间里,再加入 3D 网络结构以及 4D 深度策略。我们用了 400 万个 Clips 训练,2021 年之后我们就用 Clips 去衡量数据,总性能提升了 20%。」杨继峰解释道。
通过 Drive GPT 大模型可以预测自车未来轨迹、同时生成多个「平行宇宙」来展现未来可能发生的驾驶情况,并最终完成逻辑严密的输出决策推理链。
据汽车之心了解,目前认知大模型的认知算法通过率已经提升了 30% 以上。

另一个重要进展则是 3D 场景构建大模型的诞生。
从自动驾驶诞生那一天起,行业就有一个经典命题:自动驾驶训练到底要用实车数据更好还是虚拟数据更好?
用实车数据成本高、效率低但效果好,用虚拟数据成本低了,但数据真实度难以保证、也无法解决交互性的问题。甚至有行业人士表示,很长一段时间,用虚拟数据做仿真带来的问题多过带来的收益。
至少,按照传统的方式,全物理级的建模需要把传感器表现都用数学模型构建出来,这个过程难度极大,不仅因为成本高,这些底层数据也并不透明。
3D 场景构建大模型,某种程度上是解决这个问题的思路。
通过 3D 重构加上自动插入目标物范式,重建精度可以达到 10cm,这也使得场景还原度、重建效率更高,面对 Coner case 的构造成本也降低了百倍以上。
自动驾驶技术层面的三张王牌,长城已经有了。

面对已经展开的车企城市 NOA 开城之战,长城也第一次有了回应:
- 长城预计在 2024 年将城市 NOH 拓展至百城。
- 2024 年第一季度,城市 NOH 会先在魏牌蓝山的车型上量产落地。
- NOH 首批开放的城市包括北京、上海、保定,后续会陆续拓展到其他一线城市。
就在前天 (9 月 19 日) ,小鹏宣布将城市 NGP 在 2023 年底拓展至 50 城,2024 年扩增至 200 城。更早之前,华为宣布今年 12 月城市领航辅助驾驶「全国都能开」。
对比之下,长城 2024 年 100 城的目标,给人的感觉并不亮眼。
但只卷数量、卷速度,就像智能汽车卷价格一样,维度十分单薄。
根据长城向外界释放的信息,长城对于城市 NOH 的规划有贴合自身实际的步调。
长城把全面铺开城市 NOH 分成了三步:
- 第一步采用低算力平台达到高速/快速 NOH (无图) ;
- 第二步采用中算力平台,达到高速 NOH (无图) 、记忆行车、自动泊车等功能;
- 第三步则是在以上基础上实现城市 NOH (无图) 、跨层记忆泊车。
显然,对一个拥有 5 大品牌的超级车企来说,长城的智能驾驶必须要分场景来实现。
长城汽车智能驾驶高级总监姜海鹏解释,魏牌将搭载最高级智驾平台做城市 NOH,很大程度上是因为魏牌的定位能覆盖平台成本。其次是坦克、哈弗和欧拉,将实现高速、自动泊车等基本功能。
自动驾驶的地已经耕好了,长城究竟能种出怎样的庄稼还有待观察。
机器怎么形成与人互通的驾乘空间?用 Space GPT 把定义座舱变成生成式座舱
亿欧智库调研显示:年龄位于 25-35 岁的年轻人,有 51% 的人表示将座舱的智能化水平作为其购车的重要参考因素, 甚至有 28% 的人将座舱的智能化水平视为其购车时的首要参考因素。
当天下午,我体验了哈弗枭龙的座舱系统,这款车内座舱系统搭载了长城 2021 年发布的 Coffee OS 2.0 版本。
两个最直观的感受:
Coffee OS 2.0 版本支持「一语十意」功能,笔者在车内一次性给出了「空调温度调低打开视频打开座椅通风打开车窗」,系统仍然能快速识别,时延被降到了难以感受的程度。据悉,Coffee OS 2.O 最多可以一次性实现 10 个指令。
另一个直观感受是界面「所见即所得」。我试着对话小哈查询明天保定飞往深圳的机票,车机提供航班结果的同时,还能通过语音实现上下翻页,让人颇感惊喜。
但缺点仍然存在。
比如,在遇到无法识别的指令时,车机有时不会为人类驾驶员提供反馈,往往导致驾驶员「蒙圈」状态。
同时,尽管 Coffee OS 2.0 可以支持多音区识别,但对较为混乱的车内场景,仍需要较长反应时间。
不过这些问题将会在 Coffee OS 3.0 上车后得到解决。
据了解,Coffee OS 3.0 将会在今年第四季度上车部分车型。
在展开智能座舱之前,可能要先思考智能座舱是不是一个 AI 问题?
过去智能座舱的测评标准,往往是时延,各大汽车媒体围着车机测试反应快不快、交互灵敏不灵敏。
但今天似乎变了。
开始有更多消费者好奇:「如果我今天对车机说『我心情不好』,我的车会干什么?」
到了这个层面,智能座舱绝对是 AI 问题。
有行业人士认为,大模型对智能座舱至少有三个层面的影响:
- 第一层:大模型上下文理解能力可增强语音助手对于乘客的语音语义理解能力、响应能力,实现连续对话等功能;
- 第二层:大模型赋能车载助手多模态理解能力、感知能力,以减轻驾驶员交互压力;
- 第三层:大模型提升车载导航对路线优化与判断的准确性。
AI 大模型加持下,智能座舱悄然起了变化。
杨继峰认为,过去的智能座舱可能是产品经理定义出来的,在此阶段智能座舱不是 AI 问题,但未来的智能座舱要从定义座舱走到 生成式座舱 。
他向我们举了一个简单的例子:
过去,大多数智能座舱会针对某一类群体的显性特征来定义一个专属模式,比如针对女性用户来设计女王座椅、化妆镜的互动等,但用 AI 来定义智能座舱,不止跟群体相关,还跟每个人的年龄、状态、心情、性格相关。
「一个好的交互,不是用户坐在车上了才提醒今天降温,要多穿衣服,而是坐在车上的时候,车机壁纸、外观堆上了小雪人。」
而实现智能座舱从定义走向生成式的核心算法在于,把交互变成多模态的输入+多任务的输出。
长城这一次做了 Space GPT 的三种模型:感知大模型、认知大模型和 AIGC 生成式大模型。
回到文章开头常岩的案例,这三种大模型在座舱内的应用可能会彻底解决他的困扰。

感知大模型 : 首先通过多模感知 (包含 DMS 检测眼睑开合度,同时加入车辆动力学参数、车机交互输入、用户语音输入等) 一同评估驾驶者的驾驶状态,然后进行任务输出 (包括疲劳监测任务、心情预测任务、用户行为任务等) ,最终为其进行交互行为推荐、生态内容推荐等。
认知大模型: 认知模型则是让 AI 理解驾驶者,将生态内容喜好、交互行为预测、导航出行需求认知等等与用户进行匹配,久而久之标签与标签对齐,AI 能够变得越来越像用户。

AIGC 生成大模型: 则是结合文生文、文生图、大模型+知识库组成的一系列应用功能。这种大模型+插件的模式,将会变成擅长不同技巧的用车助手。
杨继峰认为,智能座舱的变革本质上就是范式变革,要将多模态+认知+各种用户推荐平台融合在一起才能完成范式创新,达到数据闭环的状态。
这其中要经历小模型变成多模态的算法范式创新,要做到刷新落后底层架构,最后才能有颠覆性的产品形态和交互形态。
今天出现了这样的产品形态吗?
可能还没有。
在与长城谈论智能座舱的过程中,理想是一个常被讨论和提及的对手。
理想几乎定义了一个家庭出行需要的智能座舱,第一个提出了 Mind GPT,将其进化为主动式座舱。

异曲同工,长城也以 Space GPT 为内核研发生成式智能座舱。据汽车之心了解,长城目前也是唯一一个座舱算法团队超过百人的团队。
「很有意思的是,当现在很多人玩 ChatGPT,跟 GPT 对话的时候甚至还会用『请』字,这本质是相信它拥有平等对话能力的表现。」
未来有吗?
应该会有——当座舱日活量、主动交互率高起来,这样的产品就诞生了。
怎样用 AI 定义车企?所有组织都将是 AI 组织
智能驾驶、智能座舱的关键部分渗透完了,此时的车是车吗?
对于这个问题,每家车企的思考都不一样。
有的认为是汽车机器人,有的认为是电脑+四个轮子,有的认为车还得是车。
长城内部习惯先思考一下:「这个问题究竟是不是 AI 问题」。
这个习惯显然是最近长城成立的 AI Lab 带起来的风潮。

据了解,目前长城 AI Lab 已经 超过 400 人 。
在汽车之心看来,AI Lab 很像长城内部的一次「再创业」,尝试用 AI 激活智能汽车的更多可能性。
而这一举动,也与许多新势力不谋而合,蔚来创始人李斌在 2023 蔚来创新科技日上也大胆断言:AI 将会成为智能电动汽车企业的核心基础能力。
AI Lab 怎么掀起组织变革?
长城内部这样解释组织变革三个时代:
以产品交付为目的的开发时代:汽车产品 SOP 后,它 95% 的开发工作就结束了,这一阶段最典型的组织架构就是每个产品拥有一个开发团队和项目团队。
服务多产品时代:随着 OTA 升级的实现,就进入到第二个阶段,这一阶段交付并不是结束,而是新的开始。组织架构也从单个团队仅服务一款产品,到服务多款产品。
数据驱动整车时代:这一阶段该思考整车的数据采集、数据清洗、数据挖掘、数据标注如何支撑驾舱一体化,车云一体化等架构。
AI Lab 的成立让长城进入智能汽车第三个时代。据了解 AI Lab 新组织的定位,正是梳理长城汽车的数据结构,充当数据能力、计算能力、体系能力和模块化能力的 AI 技术前台+中台。
这个新组织的定位,是梳理长城汽车的数据结构,充当数据能力、计算能力、体系能力和模块化能力的 AI 技术前台+中台。
杨继峰认为,长城做的每个问题都是 AI 问题,每个要素都是 AI 要素,每个组织都是 AI 组织。
那怎么判断一个东西是不是 AI 问题?
杨继峰表示:「考虑有没有更好的思考逻辑或者数据帮助我们做开发。这种开发可以是算法团队和设计团队一起做整车设计,让机器也能像人一样设计出来足够好的图,也可以是面向整个公司的 AI 化调整。 」
他坦言,尽管从设计师、工程师再到品牌、客服、工厂,每个人都在 AI 化,但车企还是很焦虑,「没有人能拍着胸脯保证下一代的数据架构、计算架构甚至车型就是规划当中的那个样子。」
尤其是对于长城这种超级主机厂而言,并不乏挑战。
挑战之一是品牌,挑战之二是模式泛化之后,是否真的能呈现出用户满意的产品。
每个人的驾驶风格和驾驶习惯不同,长城也在根据这些特点做品牌区别,但目前来说效果还不是很明显,至少各个品牌在智能座舱风格的区分上并不明显。
姜海鹏表示,在这一代量产车里,长城的发力点是平台化以及 AI 能力打磨。但在下一代车型中,长城智能化的品牌区隔将会越发明显。
姜海鹏拿欧拉、坦克举了两个例子。
欧拉为女性量身打造,主要解决女性开车中的痛点问题。第一个是泊车,欧拉未来会更强调自动泊车属性,把一键泊车打造成标杆产品。第二是通过记忆路线来保证智能驾驶过程中不会出现激进决策,为女性提供充足的安全感。
坦克围绕城市越野而生,针对越野场景,开发类似魔毯模式的特色功能,同时还针对非铺装道路的地盘调整,另一方面开坦克的消费者可能会更偏向激进驾驶的风格,所以在加减速上的反应更加强烈、灵敏。
据汽车之心了解,明年魏牌车型将会优先落地城市 NOH,并逐渐覆盖欧拉、坦克等品牌。
5 大品牌对于长城是幸福的烦恼,大模型的加持或许能够让 5 大品牌的智能化风格变得各有千秋。 是否真的能利用大模型打造出让用户满意的产品,还是一个未知数。
杨继峰认为,在今年内,长城可以让用户感受到 AI 到底是什么,但本质上这个技术还没有形成产品。到今天,大模型应用仍处于早期过程,今天能想到的所有模型轻量化范式、模型 SMT,不过也就 6 个月而已。
行业处于早期,并不意味着就可以等待成熟再下场。
「你也可以仍旧维持现有的体验,停留在数字化座舱,但多模态已经开始产生了很强的产品壁垒。多模态这件事情明年不做,基本上就没机会了。」他说道。
当特斯拉 FSD V12 呈现出令人惊艳的表现,大洋彼岸的中国玩家早已蠢蠢欲动,城市 NOA 借着 AI 大模型东风不断开城,各家新势力围绕大模型不断提出各类座舱功能。
造车三十年,长城被不少人贴上了「传统」的标签。
在这次交流中,他们彼此有时也打趣道,「长城对智能化相关的内容发布实在是太低调了,这锅给品牌部来背。」
话是这么说,实际上长城内部早就已经起了变化。
活动当天,长城汽车董事长魏建军没有参加,但第二天早上 7 点不到,魏建军从离长城哈弗技术中心不远的一家普通商务酒店出门跑步,59 岁的魏建军仍十分自律。
内部交流中,许多人评价他面对 AI 的态度是「投入了很多精力」,而 AI Lab 的诞生或许已经是无声证明。
可以确定的是,相较于长城当年「此诚危急存亡」地重注 SUV,用现象级爆款哈弗 H6 打遍天下,如今的长城,有着更殷实的家底和更充沛的人才储备来跨越更加漫长的 AI 时代。