作者: 大眼
导读
今天,特斯拉 AI DAY 隆重登场。
2003 年,特斯拉的首度亮相时,估计谁也没有想到它会对全球汽车市场产生如此深刻的影响。
2016 年,将 Solarcity 收入麾下的特斯拉,开启了一场特斯拉背后的能源革命。了解特斯拉的人都会知道,现在的特斯拉不仅仅是一家电动车生产制造企业,更是一家能源公司。而特斯拉的电动车只是特斯拉庞大的储能帝国中的一环。放眼如今国内电动车市场,风头最盛的宁德时代和比亚迪,同样是两家在储能领域有较大的布局和业务的企业。
2019 年,特斯拉为我们带来了自研的 FSD 芯片,全面落地的自动驾驶技术即便离我们依然遥远,但我们不会再去怀疑,类似于高速公路这样有限场景下的自动驾驶离我们已经非常接近。
而 2020 年,4680 电池 + 一体式底盘,让我们可以畅想 16 万元人民币的 Model 2,而这款车在年底可能就会在中国发售。
曾经被我们视为天方夜谭的梦想,正在一个一个地实现,那今天 AI DAY 上的成果,会否在今后十年也一个一个落地,引领新一轮的全球汽车行业的发展呢?
超级计算机 Dojo,出道即巅峰
在 2019 年时,特斯拉抛弃英伟达芯片,对外发布的算力更强的自研芯片,就已经让举世哗然。其实特斯拉的逻辑很简单,就是让这块芯片专门为自动驾驶服务。如今特斯拉在实现最好的 AI 训练性能方面,也在重复着之前设计芯片的思路,通过专属的 AI 训练超级计算机,赋能深度神经网络模型,达到更高效率以及更低成本。这就是超级计算机 Dojo。

Dojo 的核心是特斯拉研发的 D1 芯片,其基于 7 nm 工艺打造,单芯片 FP32 算力达到 22.6 TFLOPs。尤其值得一提的是,D1 的 On-chip 带宽达到了 10 TB / 秒,Off-chip 带宽 4TB / 秒,遥遥领先英伟达最新的 GPU 产品。自动驾驶运算需要极高的带宽和较低的延迟,D1 芯片未来在自动驾驶领域同样能够给特斯拉非常大的帮助。

基于此,特斯拉提出了由 25 个 D1 芯片组成的训练单元概念。一个训练单元的接口带宽每秒 36TB,算力达 9 PFLOPS,采用了集中供电和散热设计,散热能力 15 kW。而拥有 120 个训练单元、3000 颗 D1 芯片、超过 100 万个训练节点的特斯拉机柜模型 ExaPOD,其 BF16/CFP8 算力高达 1.1 EFLOPS,是特斯拉日后深度神经网络学习的基础。

根据特斯拉官方的说法,特斯拉 Dojo 是史上最快的 AI 训练计算机。在特斯拉打造出自己的超算之前,其已经利用英伟达 GPU 搭建了一个世界排名第五的超级计算机。作为一家私营企业,其能够同时打造出两台超级计算机,如果结合埃隆马斯克旗下的 SpaceX 公司在太空探索方面的一往无前,我们不得不对其功能能力叹为观止。更让人吃惊的是,特斯拉在 AI DAY 现场还预告了下一代 Dojo 超算性能将在现有的基础上再提升 10 倍,只不过特斯拉并没有揭晓这个时间会在什么时候到来。
特斯拉会否转型成为机器人公司?
机器人也是当前一个热点,只不过风头都被自动驾驶和新能源汽车抢了个去。Tesla Bot 的身高 5'8",体重 56.7 公斤。从结构上来看,Bot 全身有 40 个电动促动器,Bot 的眼睛会是 Autopilot 摄像头,身体会搭载 FSD 芯片。多摄像头视觉架构的深度神经网络架构,包括规划、自动标注、仿真、Dojo 训练等特斯拉正在开发的技术,也会被垂直整合到 Bot 机器人中。从功能上来看,Bot 可以拉 150 磅(68 公斤),或者搬运 45 磅(20.4 公斤)的物体,伸开手的状态下可以拿 10 磅(4.5 公斤)的物体,最高时速 8 公里,可以帮助人们去实现一些简单、重复的劳动。

也许现在的 Bot 还有很多不尽如人意的地方,但未来的 Bot 肯定可以通过不断优化,去实现更多的可能。毕竟利用机器人去取代很多重复劳动,同样也是一个具有非常广阔前景的领域。不久的将来,我们就可以在特斯拉的官网上面预定一个机器人,帮助我们处理各种日常生活。以特斯拉现有 6000 亿美元的市值来看,说不定机器人行业会带给特斯拉一个新的万亿的市值机会。

自动驾驶,同样也有新突破
之前蔚来 ES8 由于开启 NOP 所导致的事故,将没有激光雷达的自动驾驶 / 驾驶辅助解决方案推向了风口浪尖。作为坚定的在自动驾驶技术上不使用激光雷达,甚至在今年北美销售的 Model 3/Y 取消毫米波雷达的车企,特斯拉在今年的 AI DAY 上也向我们展示了其在纯视觉识别方面的进展。

HydraNets 多任务学习网路将使用 「极度简化」 的思想来对 FSD 架构进行一个重构。
在放弃了毫米波雷达后,特斯拉将完全依靠车身四周的 8 枚摄像头,采用 1280 * 960 分辨率 12bit HDR 图像,以每秒 36 帧的速率采集,在时间序列的基础上,通过采集 4D 的数据来实现对道路场景的感知。在比较复杂的交叉路口时,RNN 循环神经网络将帮助特斯拉基于过往的经验来进行预测和判断,以达到能够识别全新的道路场景的目的。试验结果也证明,FSD Beta9 版本比 Beta8 版本在识别效果上有了很大的进步,而这也是特斯拉取消毫米波雷达的底气所在。

被标注过的数据是特斯拉的 FSD 控制器进行深度学习的基础,特斯拉还成立了一个 1000 人的数据标注团队。当前,特斯拉行驶在全球的车型都在为其采集各种数据,每天都会产生大量的数据,而且随着标注从 2D 向 4D 演进,整个标注工作量是非常大的。为此,特斯拉开发了专门的自动标注软件,以帮助企业加速对相关数据的标注工作。
今天,特斯拉可能给出了我们它的终极梦想:成为一家人工智能公司。如果说今天所演示的强化版的 FSD 还有很浓的车企的影子的话,那人工智能训练芯片 D1,以及目前性能最强的人工智能计算机柜 DOJO Pod,还有机器人 Tesla Bot,都预示着一个全新的特斯拉可能将在几年内展现在我们面前。我们很难再从一个车企的角度来衡量特斯拉在技术领域的发展,也许未来的智能网联汽车需要建立在强大人工智能的基础上。汽车人们,我们做好准备了吗?