寒武纪行歌 - 智能驾驶大算力芯片入局者

作者：陈康成

引言

2021 年 10 月 12 日，中国电动车百人会在南京举办的「推动车用半导体产业可持续发展」的峰会上，寒武纪行歌执行总裁 - 王平发表了主题为「单车智能突破，云边端车协同」的演讲。

演讲中提到：「寒武纪行歌在正在研发一款基于 7 nm 制程的、算力大于 200TOPS 的 SoC 产品，未来还会通过各种车规认证，在车上实现 SOP。」

寒武纪行歌刚成立，首款产品就是 7 nm 制程，算力大于 200 TOPS 智能驾驶 AI 芯片。带着很多的疑问，九章智驾近日专访了寒武纪行歌执行总裁王平先生。

正文

九章智驾：寒武纪本身是做云边端芯片相关业务的，又是出于什么样的考虑，成立子公司寒武纪行歌入局车载领域，开始去做智能驾驶 AI 芯片的？

寒武纪行歌：首先，我们认为车载领域是一个很有前景的市场。汽车产业体量很大，自动驾驶领域是 AI 的很好的一个落地场景；从人工智能的产业应用来讲的话，自动驾驶是一个不可或缺的市场。

这个领域对于国家和社会的战略意义是不一样的，智能汽车不仅仅是一个消费品，还会涉及到数据安全、社会安全等方面的因素，因此智能驾驶的大算力、先进制程芯片很有必要国产化。

最后，主要从寒武纪自身来讲，在寒武纪没有上市之前，主要还是专注于把云边端的 AI 芯片做出来。成立行歌科技入局这个领域，是因为无论从知识的积累，人才的积累，还是财力的积累上，都已经达到了能够支撑我们进入该领域的条件，所以我们觉得是在合适的时间做了一个正确的选择。

九章智驾：车载领域 AI 芯片从体量来讲，相比手机芯片要小不少，市场上已有多家有实力的厂商，并且一些 OEM 又打算自研 AI 芯片，行歌直接入局车载领域会不会有些冒险，您是如何考虑这个事情或者去评估这种风险的？

寒武纪行歌：第一点：我认为车载领域芯片市场，如果单从片数来讲，也许比不过手机市场的。但是单车上芯片所占的价值量每年都是在增长的，这是一个很大的增量市场。比如，高端的大算力芯片 - 英伟达的 OrinX，几百美元一颗，蔚来 ET7 单车就要装配 4 颗这样的智能驾驶芯片。

智能驾驶主控芯片这个市场还是非常可观的一个市场，全球新车一年销量差不多 9000 万辆左右吧，中国销量接近 3000 万辆，未来智能驾驶 AI 芯片应该会是标配，所以渗透率会越来越高。

第二点，我认为主机厂自研 AI 芯片这件事情并不容易。虽然说特斯拉现在已经自研出 AI 芯片了，但毕竟是专供自己使用的，相对整个汽车行业的规模而言，占比还是很小的。

未来能够像特斯拉这样把芯片自研出来，并且成功运用的 OEM，我认为会很少。因为芯片也需要人才和相关技术的积累，这个是需要很长时间的。我觉得应该是由专业的人去做专业的事儿，产业链有分工才更有利于整个汽车行业的发展。

九章智驾：寒武纪行歌的定位是去做通用、大算力芯片；大算力好理解，那么通用化是怎么理解的？通用到什么程度，有哪些通用性特征？

寒武纪行歌：说我们的车载智能驾驶芯片是通用芯片，严格来讲这个也是不准确的。准确来讲，应该叫车载 SoC 芯片，它是一个异构芯片，不仅包括 AI 模块，还包括 CPU、GPU、DSP 以及 ISP 等其它处理模块。

我们讲所谓的通用性，指得是 SoC 上 AI 模块的通用性；它具有一个通用的 AI 软件栈或者说基础软件平台，可以让 OEM 车厂或者算法公司在上面比较灵活的、方便地移植或者开发他们自己的算法。也就是说，它的灵活性和兼容性比较好。

反之，所谓的专用 AI 模块，它的软件平台不具有通用性。它的软件栈是专门针对某一种芯片或者说某种算法进行了专门的定制优化，虽然可以在一定程度上降低功耗，提升性能，但是它也会导致一个不好的后果。

因为它是专用的，所以能够适配的算法受到局限，这就导致当 OEM 或者算法公司要去移植或者是开发其他算法的时候，需要重新花大量的时间和精力去做适配工作，投入到软件开发的工作量会非常大，甚至无法实现。比如 Mobileye 的芯片即使开放 AI 部分给 OEM 厂商，也很难有人能把感知算法在它上面跑起来。

九章智驾：寒武纪行歌在车载领域这块起步较晚，国内一些芯片公司，有的现在已经具有量产装车经验，并且也在打造生态，行歌有哪些需要追赶的地方，或者说会面临哪些挑战？

寒武纪行歌：第一点，虽然我们真正开始做车载芯片在时间上是晚一些，但是寒武纪之前是做云边端芯片的，很多能力是可以迁移到车端上去应用，也就是说我们是具备一定的技术基础的。说起步早或起步晚，其实只是相对的，或者说只是针对不同的模块来说的。

第二点，我认为车载智能驾驶 AI 芯片这个赛道很长，从辅助驾驶到真正的无人驾驶还有很长的路要走，我们预计至少 10-20 年甚至更长的时间。

刚才问寒武纪行歌现在的差距是什么？首先，关于大算力、通用性 AI 架构设计能力，我们可以基于母公司的云端及边缘端芯片架构设计能力直接搭建。其次，在基础软件这部分，我们的积累也是够的。现在唯一不足的地方，我觉得是在车规级要求、可靠性和功能安全方面。这块是一个新的课题，需要我们抓紧时间去提升。虽然说做云端和做车端对能力的要求是不太一样的，难度是有的，但是我们有信心去克服这样的一个挑战。

九章智驾：刚才您也讲了，寒武纪行歌做车载 AI 芯片，母公司寒武纪做云边端 AI 芯片的一些能力是可以直接迁移过来复用的，能具体讲一讲，具体都有哪些能力能迁移过来复用么？

寒武纪行歌：实际上，我们可以把车规芯片的设计分三大部分来看：第一部分：芯片架构设计；第二部分：基础软件平台设计；第三部分：车规级设计要求。

我们一开始的定位就是做一款大尺寸、大算力的智能驾驶芯片。大尺寸和大算力芯片的架构设计能力，以及基础软件开发这两部分的能力是寒武纪之前就具备的，这两部分能力我们大多可以直接迁移过来复用。

当然了，母公司之前的产品主要是针对工业产品来设计的，或者说高端的工业产品，工业级规格；车规级芯片有更高的一个要求，比如在可靠性和功能安全等方面，它是需要根据车规级要求具体去调整和优化的，但核心的基础模块是一样的。

九章智驾：前面您说了，寒武纪行歌的车载智能驾驶 AI 芯片的通用性主要是体现在 AI 模块，那么把 AI 模块做成通用型的技术壁垒和挑战是什么？

寒武纪行歌：首先，需要大量的软件人员，寒武纪现在约 1500 人，大概 60% 的人是软件人员，为什么？因为做一套通用的 AI 硬件架构去适应不同的网络，就需要对不同的算子去做适配，所有做通用 AI 处理器的都要面对这个问题。

关于视觉感知的算子是大概有 1000 个，如果做成通用的，这 1000 个算子便都需要投入人力去做适配，这需要很大的工作量。如果是做专用的 AI 感知模块，就无需这么麻烦，因为它只使用一部分网络，也许只用到了几十种算子，那么只需要针对这几十种算子做适配就好了，其他的 900 多种都不用管。做 AI 模块本身的技术原理很简单，难的是怎么把那些千奇百怪的算法适配到我们的硬件上来。把通用性和网络利用率做好的同时，还能兼顾低功耗，这是关键，也是困难的部分。

这个通用型，考验两方面的能力，一方面是处理器架构能力，如何用一个处理器架构支持好不同类型的众多算法和算子。另外一个就是算法工具链的能力，如何做一个好用易用的 SDK，快速适配新的算法算子。

其次是工艺，要把算力做大，性能做强，最主要的就是工艺方面的限制。高制程的芯片，不仅制造工艺难，而且设计也比成熟制程难得多。以 7 nm 制程为例，需要芯片设计公司和晶圆厂家协作把所有 7 nm 相关的、所能用到的 IP 全部都得验证一遍。每前进一个工艺节点是需要花费很长时间努力以及大量人力、财力等资源的投入。

九章智驾：提升 AI 芯片算力的方案，除了工艺手段，通过采用先进制程能提升算力外，通过改进架构是否能够提升算力？目前的芯片架构大多还是冯若依曼架构，未来会不会出现一种新的架构会颠覆这种传统架构？比如说存算一体芯片，未来的前景如何？

寒武纪行歌：从本质上讲，提升算力的方法就是增加晶体管数量，增加里面乘法器的和累加器的数量；在传统的架构下，无论如何改进软件架构，只能提升硬件利用率，提升不了实际算力。硬件不会随着的软件变化而变化，芯片流片出来就固定了，里面有多少个乘加器，有多少个晶体管是可以数出来的。

从宏观的角度看，想要大幅度提升算力就一个办法，就是提升工艺。除非不用深度学习，不用 CNN 网络，那是另外一个概念了；改变 AI 处理器架构只是改变了对不同网络的适应程度；

有可能出现新的架构，不过至少目前还没有看到批量应用或者是实际产品落地的。

传统的架构处理器跟存储器分离，中间需要通过总线来通信，性能受到限制；所谓的存算一体，就是要把计算单元和存储器一体化的。也就是说同一个处理单元既可以做计算，又可以存储；这种设计相比之前，整个架构将会产生很大的一个变化。这不是一个简单的事情，所有的上层的软件以及系统都得跟着改变和调整。

九章智驾：对于乘用车来说，L4 有点遥遥无期，中短期内车上的智能驾驶配置还会是以 L2 级为主，对于该级别来讲，14 nm 或者 16 nm 制程的高性价比芯片基本已经满足需求了。为什么行歌还要选择从 7 nm 制程的大算力芯片入局？行歌在 7 nm 制程上的优势在 L2 级别这个市场会不会反而成了成本上的劣势？

寒武纪行歌：首先，之所以我们从做大算力芯片开始，是因为我们看到 OEM 对大算力芯片有比较强烈的需求。尤其是新能源车，由于它的电池和电动机是用液冷，大算力域控制器的散热问题相对来说要好解决；其次，电动车上用「数字发动机」- 大算力芯片代替了燃油车的发动机」，OEM 都需要在这个地方下功夫去实现差异化，给消费者更好的驾乘体验。

第三，从做大算力开始，可以更好抢得市场，更快塑造我们的品牌力。很明显，当前做低算力的芯片厂商相对较多，市场竞争也比较激烈，做大算力、先进制程这种技术壁垒更高的智能驾驶芯片更符合我们品牌的定位，也更容易切入车载领域市场。

在 L2 这个级别上，用 7 nm 制程的话，成本上的劣势也许会比较明显，所以我们也会准备好低一些的工艺制程的。只是我们的产品计划是一步一步来的，先从做大算力芯片开始，然后再往下探。

小结

未来很长一段时间内，算力的比拼将是智能汽车重点比拼的性能参数之一；大算力 AI 芯片的需求也会越来越高；针对车用半导体及其供应链痛点，需要整个产业同心协力，分工合作，让国内的大算力、先进制程的 AI 芯片在未来也能尽早的实现国产化。

引言

正文

小结

请截图后在微信扫码参与互动