FSD V9.2 七点变化详细解读

作者：小董同学

8 月 15 日，Tesla 向内测用户（约 2000 名）推送其自动驾驶最新版本 —— FSD Beta 9.2。相比 Tesla CEO Elon Musk 曾经承诺的两周更新一次 FSD 版本只晚了一天，这次没有「Two weeks」。

最新版本 2021.12.25.15 的版本信息中，内测用户车内更新说明与上一个版本无差，并没有提及具体更新内容。

好在，Elon Musk 在推特上提供了关于 FSD Beta 9.2 的详细技术更新，同时也暗示在未来版本中会有更多改进。

techAU 创始人 Jason Cartwright 对 FSD Beta 9.2 七点变化进行了详细解读，类星频道编译如下：

这是 Elon 的推文，详细说明了这些变化，虽然我很想在公开发行说明中看到这种级别的详细信息，但我可以理解，大多数普通人可能会被这些信息搞糊涂。也许发行说明可以有一个高级选项，可以显示有关变更内容的高级技术信息，来帮助 Beta 测试人员了解他们的车辆发生了哪些变化。随着我们走向公测，这可能会变得更加重要。

这里只有 7 个要点，但这条推文里有很多东西要解释，所以让我们来分析一下。

Clear-to-go boost through turns on minor-to-major roads (plan to expand to all roads in V9.3)

更果断地从小路并入大路（V9.3 会扩展到所有道路）

这是我们第一次听到特斯拉使用「Clear-to-go boost」的说法。这是指当车辆汇入主干道时，利用计算机视觉识别车流中是否存在安全距离。令车辆自然地行驶到限速更高的路段上。

当你离开小路进入主干道时，作为驾驶员，我们通常会加速以达到限速或跟随车流。这种改进有一些好处，比如在完成汇入车流后不会影响到你后面的车辆。

Elon 表示，FSD 下一个版本 9.3 将在两周后发布，9.3 版本的此功能将适用于所有道路。

Improved peek behavior where we are smarter about when to go around the lead vehicle by reasoning about the causes for lead vehicle being slow.

改进了的探头行为策略。通过推理解析前车行驶缓慢的原因，更聪明地理解何时应该绕过前车。

与 FSD 的公开版本相比，FSD Beta 版的独特之处在于，车辆在路径规划是基于可驾驶空间，但会优先考虑车道保持和道路法规。这意味着在安全的情况下，车辆会越过本车所在的车道线，超过停在本车道上的其他车辆（即借道超车）。

在 YouTube 上观看了大量的 FSD Beta 9.1 视频后你会发现，很明显，车辆有时会在本应停车并等待的情况下尝试执行借道超车操作。

这种「探头策略」的改进表明，FSD Beta 9.2 现在在决定超车时会更加智能。我们经常利用前车（或头车）的提示来指导自己的驾驶。

如果一辆车停在我们前面，这可能是因为许多因素。如果一辆车开着双闪灯并与路边停放的车辆并排停放，很明显，那辆车短期内不太可能会走，我们会绕过它。如果前车为了躲避一辆停下的车，而穿过车道线，我们很可能也会这样做。同样，如果前方车辆正在躲避事故或道路施工，我们可以从前车的行为中学到很多东西，而且大多数时候我们应该跟着它，这是对的。

这里 FSD 的目标是准确预估前方未知环境，并预测正确的驾驶策略。选择完全停下来等待一辆停着的前车动起来显然也是错误的。因为当等待时间过长时，后面的司机超过你，并会让你感到沮丧，所以这是一个很好的平衡。

v1 of the Multi-modal prediction for where other vehicles expected to drive. This is only partially consumed for now.

周边车辆的多模行为预测 V1.0，目前只是部分预测。

多模行为预测是对周围物体状态和未来可能行为的预测。这意味着要计算其他车辆、行人、非机动车、动物等的潜在行为轨迹，这些轨迹都是车辆决定行驶路线和是否需要刹车的依据。

第二句话是，目前它只是部分预测，这表明特斯拉在未来将预测更多像这样的潜在场景。如果车辆能够准确预测行人何时会走到本车的前面，或者附近停着那辆车的司机是否会打开车门侵占本车的车道，那么 FSD Beta 就可以更安全地绕过它，保证每个人的安全。

在复杂环境中，如何高效地进行这些预测所需要的计算量是一个挑战。这比简单的你现在在哪里和你周围其他一切在哪里要难得多，它需要模型来预测未来会发生什么，重要的是要发现预测何时会出错。

如果我们举一个例子，当你接近一个有对向车流的十字路口时，你想穿过那个车流。一种情况是对向车辆直行，另一种情况是对向车辆也转弯，还有一种情况是对向车辆停下来什么也不做。基于数百万个类似的场景，如果我们对这三种情况来测试，人们可以做出很好的预判，会踩下刹车减速并进行自然的转弯，以避免跟对向的那辆车撞上。这对计算机来说很复杂，而我们经过多年的训练，我们每天做的驾驶策略都会变得自动化。

New Lanes network with 50k more clips (almost double) from the new auto-labeling pipeline

基于 5 万个（几乎翻倍）自动标注的视频片段训练的车道深度神经网络。

与特斯拉过去用来训练神经网络的人工标注图像相比，自动标注是一个巨大的进步。当然，特斯拉不仅仅只有一个神经网络，他们还有很多，而且还在不断增加，每个神经网络都专注于自动驾驶挑战的不同部分。

特斯拉的人工智能高级总监 Andrej Karpathy 以前就提到过自动标注的概念，其目的是大幅加快训练神经网络的过程。

你可以把 Ta 想成一问一答。如果我们找到一段行车录像，当事故发生时，你可以在几秒钟后找到答案。然后你录制前几秒钟的视频(出现问题)，并围绕类似的场景不断的训练深度神经网络不同的问答组合。视频中的帧幅就可以回答深度神经网络的「我在这里应该做什么?」这个问题，而不是人类详细标注给深度神经网络答案（极端场景是什么）。

虽然在某些情况下，驾驶员可能会做出错误的驾驶行为，但绝大多数司机会在任何给定的情况下采取正确的策略，因此向深度神经网络提供大量相同场景的示例，它可以自动找出应该采取的正确策略。

理论上，数据越多，得到的模型（通过训练）越好，该模型被推送到 FSD Beta 版本，并且随着 Tesla 转向更多的视频片段处理，而不是单个帧，它可以在每种情况下可提供更多的上下文信息，就像全景影像一样（使用所有 8 个摄像头，而不仅仅是 1 个）。

「New Lanes」网络使用大约有 50,000 个以上的自动标注的视频片段，这表明特斯拉现在能够在他们的数据引擎中扩展的神经网络，同时运行更多的网络。

自动标注的视频片段翻倍至 50,000 个，标志着计算能力发生了重大变化，这可能是 Tesla Dojo 超级计算机上线的结果，其详细信息应在定于 8 月 19 日（美国时间）的 AI 日上发布。

New VRU velocity model with 12% improvement to velocity and better VRU clear-to-go performance. This is the first model trained with “Quantization-Aware-Training”, an improved technique to mitigate int8 quantization

新的 VRU 速度模型提升 12% 的速度并具有更好的性能，是第一个使用量化训练的模型。这是一种减轻 int8 量化的改进技术。

弱势道路使用者 (Vulnerable road users) 是指非汽车、公共汽车或卡车上的道路使用者，通常被认为包括行人、非机动车和摩托车的使用者。当特斯拉谈到将这些速度提高 12% 时，这可能是指车辆随着时间推移跟踪物体的程度，可能以毫秒为单位。正如我们之前所讨论的，要了解场景中的对象，尤其是像 VRU 这样可能与本车行驶轨迹相交行为的对象，更快地跟踪它们总是更好。

当谈到「clear - to - go」时，它表明如果行人在我们的车辆前面横穿，道路不通，我们需要刹车。一旦行人过完马路后，道路会再次可以提速，但什么时候是 clear - to go 是重要的部分。

如果 FSD 可以更准确地预测人（或头部）的行为，那么它不仅可以更好地确定何时可以通行（即他们在人行道上），而且还可以计算我们与十字路口的距离，从而能够更流畅地让车辆通过十字路口。简而言之，「clear - to - go」应该留出足够的空间让 VRU 安全通过，但又不能激进，这里要很好的平衡。

许多最先进的深度学习模型都太大太慢，特斯拉就是一个很好的例子。尽管他们的 HW3 平台非常强大，但它仍然有一些限制，包括功率、存储、内存和处理器速度。

量化通过存储模型参数并使用 8 位整数而不是 32 位浮点数（因此是 Int8 ）执行计算来减小模型大小。通过使用 QAT 可以提高模型性能，但也存在计算误差和模型精度降低的缺点。这些错误会随着计算最终答案所需的每个操作而累积。

如果你对进一步的信息感兴趣，可以观看来自 TensorFlow、软件工程师 Pulkit Bhuwalka 的关于量化感知训练的精彩视频。

Enabled Inter-SoC synchronous compute scheduling between vision and vector space processes. Planner in the loop is happening in v10

启用视觉和矢量空间进程之间的 SoC 同步计算调度，V10 加入规划。

特斯拉的完全自动驾驶计算机，也被称为 HW3.0，具有双系统芯片(SoC)冗余功能。如果其中一个芯片出现故障，另一个芯片将有足够的算力来操控车辆，因为大多数时候芯片是运行正常的，所以特斯拉将利用这两个芯片的性能来“同步计算”是可行的。

在这一点上，Tesla 解释说，在 FSD Beta 9.2 中，他们已经允许通过两个 SoC 计算跨 SoC 工作负载。描述这一点的最佳方式是将视觉栈中车辆周围的所有物体（即摄像头输入）转换为向量空间的过程。当我们在屏幕上看到漂亮的图像模型时，汽车在后台也看到了带有边框的 3D 对象。

在 v 10 中对 Planner 的引用可能与生成路线规划的过程有关，而不是规划路线。一旦建立了向量空间，理解了轨迹，接下来的逻辑步骤就是规划你在该环境中的路径。在 SoC 之间分配这些潜在的路径计划可能会获得一些性能优势。

Shadow mode for new crossing/merging targets network which will help improve VRU control

新的交叉/合并目标网络的影子模式，将有助于改善 VRU 控制。

最后，我们来到影子模式。这个概念在特斯拉自动驾驶日上首次展示，Tesla 解释说他们会在你的车辆上运行模拟，来想象「假设场景」。这个模型和量产版本相同的场景下，下一个（未发布的）代码分支会做什么？会做出一个更好还是更坏的策略。如果是更好的策略，车队会报告这个变化是积极的，它将进入下一步量产，如果不是，则需要更多的训练。

这种影子模式首先在潜在的自动变道被证明，但作为自动驾驶解决方案的一部分，它确实可以应用于大部分的决策过程。

最后一点表明 Tesla 现在正在将影子模式用于处理新的交叉/合并目标网络，旨在改进 VRU 控制。关于交叉或合并的部分，想象一下你在一个非常繁忙的十字路口，甚至可能是一个全向十字路口，行人可以像在上海商城路那样斜交叉行走。

一旦绿灯亮起，车辆需要确定道路是否畅通，但如果行人在障碍物后面穿过，视线就会被挡住，这就给预测行人的路径轨迹带来了问题，因此就会有个问题 —— 行人会出现在哪里？在 FSD 9.2 中，Tesla 似乎使用影子模式来测试他们是否能更好的跟踪和预测 VRU 的轨迹。

好了，关于这个版本的所有细节，它再次提出了一个更广泛的公测版的问题，以及什么时候可以推送？Elon 之前曾表示，V10 可能会大规模推送，但 V11 肯定会全面推送。

这一次，Elon 表示 9.3 将是下一个 FSD Beta 版本（正如我们所知，这应该是 2 周之后。接下来是 9.4，同样是 2 周之后，或者大约一个月之后，也就是九月中旬。）

在那之后，Elon 表示 FSD Beta 10 可能会进入全美推送，并表示 FSD 10 将会有重大的架构变化。但 FSD 10 的重大结构变化可能会减少 FSD 10 更广的推送预期（之前由 Elon 的设定），因为重大变化肯定需要先由内测用户进行测试。

这将 FSD Beta V10 的推送时间至 9 月底左右，至于这个重大的架构修改可能会是什么，Elon 曾经披露导航自动驾驶（NoA）和智能召唤会一起转移到纯视觉路线，即目前用于 FSD Beta 的城市街道驾驶的技术栈。

我认为我们今天学到了很多关于特斯拉为自动驾驶所做的努力，但同时也表明，我们距离 Elon 之前设定的 2021 年底实现全功能的 FSD 还需要一些时间。

请截图后在微信扫码参与互动