华人澳洲中文论坛

热图推荐

    再大的芯片算力,也治不了车企的精力内耗

    [复制链接]

    2022-9-28 06:33:32 21 0

    来源:远川钻研所


    一块汽车芯片抵一台超算的时间正在邻近。
    一周前,英伟达公布智能汽车最强芯Thor,单片算力达到2000TOPS,机能至关于Orin的8倍,在相近精度下,算力简直是前段时间被禁的A100的4倍。
    更恐惧的是,Thor的泛起间接把尚未问世的Atlan抹杀在摇篮里,这类卷王行动把业内人士都看傻了。
    但是,话音未落,在三天后的投资者会议上,另外一家芯片寒门高通也发大招,宣告推出“集成式汽车超算SoC” :Snapdragon Ride Flex,SoC外挂NPU的组合算力最高也将达到2000TOPS。
    听说有高通工程师在敌人圈放话:这就是咱们的回应,给这场算力争霸赛削减了一丝炸药味。
    英伟达与高通的隔空斗法,实在地反应了智能汽车在数字目标上日趋重大的贫富不均——燃油车时期,即便是一台轩逸这样的买菜车,F1方程式赛车的马力也不外是其8倍;而在智能电动汽车上,旁边一辆车的算力可能会是你车的数十倍,乃至数百倍。
    透过通货收缩个别的智能汽车芯片算力,咱们尝试回答几个问题:
    1、汽车芯片的算力,是怎么卷到2000T的?
    2、智能汽车芯片,是否算力越大越牛X?
    3、汽车智能芯片超算化,会变为英伟达和高通的仙人打架吗?
    01算力卷王
    近年的智能驾驶开展史,某种水平上能够概括为芯片算力暴跌史。
    2016年,因辅佐驾驶致死变乱和Mobileye各奔前程的特斯拉,找到英伟达定制了计算平台 Drive PX2,算力为24TOPS[1]。个别来讲,TOPS越高,每秒能进行的AI计算越多,能承载的人工神经网络机能也越好。
    就像手机、电脑经常用芯片跑分作为卖点,在深度学习席卷汽车行业的浪潮中,TOPS成为了权衡智能驾驶才能先进与否的第一目标,英伟达CEO黄仁勋亦着名言:“TOPS就是新的马力[2]
    往年CES展上,在算力层面吃过亏的Mobileye 公布算力为176T的EyeQ Ultra,比拟EyeQ4晋升50倍。一样,地平线往年行将登陆现实L8的J5芯片,算力亦高达十二8T,是J2芯片的34倍,惟恐后进于对手。
    英伟达更是深谙算力即权力的游戏规定,继Drive PX2之后,英伟达在6年时间内公布了三代智能驾驶芯片,从Xavier、Orin再到Thor,算力完成从30TOPS到254TOPS再到2000TOPS的跃迁,每一个代都是“芯皇”般的存在。
    假如以Drive PX2为基准,10年内英伟达的智能驾驶芯片AI算力增长了83倍,比传统的摩尔定律还要快。


    英伟达Thor智能驾驶芯片
    为何智能驾驶芯片这么“丧心病狂”地堆算力?这傍边,既有英伟达两年一更新芯片架构的致力,也有台积电不停进步芯片制程工艺极限的功勋,但更首要的是有市场,翻译过去就是,上游企业纷纭患上了算力饥渴症。
    其一,智能汽车上的传感器规格与数量均在近几年有了奔腾,带来了数据的暴跌。
    好比往年开始交付的蔚来ET7,全车搭载33个传感器,其中包罗十一枚800万像素高清摄像头,1个高精度激光雷达,5个毫米波雷达等,传感器每秒发生仅图象数据就达到8G,约等于一部90分钟的高清蓝光电影[3]。
    为知足智能驾驶的实时处置需要,蔚来不能不启用4枚Orin组成算力1016T的计算平台——传感器太多致使数据爆炸,单芯算力已经是已经应答不迭。
    同时,智能驾驶算法的“大模型化”,也让芯片算力愈发吃紧。


    特斯拉FSD感知算法比初期的Autopilot算法繁杂很多
    去年,特斯拉率先在智能驾驶零碎的感知模块中启用新型神经网络Transformer,比拟于传统的CNN,Transformer机能大涨,能够帮忙零碎完成三维感知,并能具有和人类同样的“记忆”才能。
    特斯拉开路之后,Transformer迅速席卷行业,但它并不是没有代价——参数极多,损耗计算资源大,长城汽车旗下的自动驾驶公司毫末智行就发现,“Transformer所需算力是CNN所需算力的100倍(在训练端)[4]。
    其次,汽车电子电气架构的集中化,也在催生超级芯片。
    为了便于车内数据交互、升高整体本钱,汽车行业正在极力增加散落在车内遍地的上百个ECU,将它们担任的计算工作整合到尽量少的芯片中——汽车电子电气架构已由最先的散布式计算迭代到目前的域控计算,而下一代将是所需芯片更少的地方计算。
    与之对应,“舱驾融会”的概念被提出来,这是一个终纵目标:一枚主芯片同时担任智能驾驶与智能座舱的计算工作(固然会有其余小芯片辅佐)。而自动驾驶动辄上千T的算力要求,和车内动辄几块2K屏的大屏趋向,欺压这枚芯片必需在机能上狂飙。
    面对这些需要,英伟达在产品线上果决砍掉了去年公布的智能驾驶公用芯片—算力1000T的Atlan,以2000T算力的Thor取而代之,高通Flex平台紧迫跟进,两家企业(在口头上)将智能汽车芯片送进了超算时期。
    02算力越大≠成果越好
    在剖析英伟达制霸AI芯片市场,股价五年暴跌20倍的缘故时,剖析师们往往会草草地抛出一个观念:算力为王。车企们在鼓吹智能汽车时,也经常无意有意地向用户转达一种思想:算力越大越牛X。
    不外这并不是事实。在真正的智能驾驶零碎中,更大的算力只提供牛逼的可能性,但不包管牛逼确实定性。
    一方面,企业通常对外鼓吹的TOPS,是一块芯片的AI峰值算力,但在实际运转中,芯片算力很难被充沛利用。
    一个不那末为人所知的事实是,在高数据量的计算工作中,最大的瓶颈经常是存储带宽而非算力。由于计算单元的运转频率远高于存储单元,芯片会堕入“算力等数据”的形态,高算力其真实空转[5]。
    这就至关于餐厅里有一名米其林大厨,做饭又快又好吃,但受制于切菜工的效力,致使出餐率始终上不去。


    存储才能成为AI运用的次要瓶颈
    无效应用高算力的一个办法是在芯片中搁置更多的高速缓存(SRAM),这类存储单元与计算单元间隔更近,数据传输的提早更低,可无效晋升带宽。
    好比特斯拉在其FSD芯片内封装了32MB的高速缓存,缓存带宽达到2TB/s,将每秒能处置的图象从Drive PX2的100余帧晋升至2300帧,为其FSD Beta算法提供了根底[6]。
    但特斯拉做到这所有的条件是斥巨资从硅谷找到顶级半导体人材,进行自主研发,而能同时知足这样前提的车企其实不多。
    另外一方面,即便经过各种办法尽量把芯片算力用满,也不代表万事大吉——算力是智能驾驶的根底,算法才是灵魂。
    对于算法的首要性,在游戏行业有一个生动的例子。2021年前,游戏玩家在关上GTA5联机版时,即便具有机能不错的电脑,也需求等候一段漫长的时间。起初有顺序员解包发现,因为部份代码品质太低,某个只需一步实现的步骤,自愿跑了19.8亿次if语句——这段代码很简略,但占用了60%的计算资源[7]。
    一样的情理在智能驾驶行业同样成立:堆砌、损耗算力其实不难,难的是经过高效算法将算力转化为实打实的用户体验。
    一个有教训的算法团队经常能取得更高的算力费效比。好比小鹏刚刚向广州区域的P5车型推送了城市高阶辅佐驾驶CNGP,外行业大多基于上百T算力完成这一指标时,小鹏P5仅搭载了算力30TOPS的Xaiver芯片,依托的即是算法优化和高精地图加持[8]。
    不久前与五菱一同推出低算力辅佐驾驶计划的大疆车载以为,完成智能驾驶面临传感器、算力、算法、数据四座大山,四座山头需求一同翻越。换句话说,智能驾驶零碎实际上是一个木桶,抉择终究体验的是否某块长板,而是短板。
    而在当下,全部汽车行业将芯片算力堆到数百甚至上千T的大有人在,但没有一家车企的辅佐驾驶零碎成果,比得上特斯拉基于144T算力做出来的FSD Beta。面对这类状况,很难说智能驾驶行业的短板在芯片算力上。
    03
    仙人打架,车企真成组装厂?
    英伟达与高通仙人打架,会形成智能汽车芯片三名之后寸草不生的场面吗?谜底是不是定的。
    这是由于,与另外一个芯片使用小户消费电子比拟,汽车行业对本钱更为敏感,市场高度分层,且对平安要求更高。而在目前,一枚汽车超算芯片很难同时知足上述前提。
    本钱和市场角度来看,高算力芯片等于高本钱,象征着只要部份高端车型才用得起,其上游车企往往是多数舍得下血本的硬件预埋派:先掏大价格把算力、硬件堆高,再经过OTA更新功用。
    英伟达曾经量产的Orin,采取7nm工艺出产,算力254T,每片价钱便达到400美元[9],目前只要蔚小理、智己、飞凡等品牌30万+的车型搭载。而Thor的算力达Orin 8倍,采取更先进的5nm工艺,其价钱必然会比Orin更为惊人。
    而从平安角度看,统管智能驾驶与智能座舱的超算级芯片虽然更为简洁,数据流转效力更高,但代价是失去了硬件级的平安冗余。假如芯片没有做好隔离,智能驾驶与智能座舱的运用可能会互相带崩(好比车机死机形成辅佐驾驶忽然退出),影响车辆平安。这给长于把控平安的传统汽车半导体大厂留下了时机。
    因为本钱高企且难以知足整个需要,车企中也分化出了硬件自研派,好比蔚小理一边与英伟达、高通称兄道弟,另外一边则各自建设芯片自研团队,研发与自家算法、软件婚配水平更高的芯片,试图将命运掌握在本人手中。
    而在宽广的辅佐驾驶市场,更为主流的实际上是办事中低端车型的够用就好派。他们不寻求(也有力使用 )高端配置,而是用低本钱芯片、传感器,在无限场景内将辅佐驾驶功用做好。
    好比大疆与五菱往年协作推出的智驾版 KIWI EV则更进一步,采取200万像素摄像头为主传感器,计算平台算力仅16T,全套辅佐驾驶套件本钱在一万之内。
    跟着此类计划的盛行,一些平价智能驾驶芯片如地平线J3(算力5T)、德仪TDA4(算力8T)正在关上愈来愈大的市场。


    地平线CEO余凯的敌人圈
    但是将时间线拉长,智能汽车对算力的需要在切实晋升,汽车单枚大算力芯片取代多枚小算力芯片的趋向难以逆转,时间更像是英伟达与高通的敌人
    跟着5nm工艺成熟、芯片出货量减少,超算级汽车芯片的价钱会升高,从而在总体本钱上更为勤俭。在公布会上,黄仁勋就夸下海口,表现Thor可以“一片顶六片”,总体上能为车企降本数百美元。


    Thor芯片以一挑六
    而影响一款芯片市场表示的隐形前提:软件与生态方面,英伟达各自手握AI训练和安卓开产生态,并具有对应的软件工具链。近两年,英伟达与高通正在用软硬结合的形式,把愈来愈多的车企拉入其生态中。
    国产智能汽车芯片的代表地平线也抉择参加战局:明年,地平线将公布单芯片算力1000T的征程6,一样反对驾舱融会。在这以前,地平线的大算力芯片征程5获取了比亚迪、上汽、现实、红旗等国际车企的定单。
    只是对车企们来讲,一个辣手的问题在愈发明晰:一辆车的产品力正在愈来愈多地被一枚芯片所定义,车企如今的产品节拍正在被芯片大厂拿捏。假如不加码自研,车企很难逃脱罗永浩口中的“计划整合商”咒骂。
    参考材料:
    [1] AI领强算力时期,GPU启新场景落地,华西证券
    [2] 英伟达终究活成为了三芯,雷锋网
    [3] 蔚来公布首款自动驾驶车型ET7,蔚来官网
    [4] 毫末和自动驾驶的3.0时期,顾维灏
    [5] 人工智能遭受“存储墙”,存算一体势必破墙而出,雷石投资
    [6] 多是全网最具体的特斯拉FSD芯片解析:是猛兽仍是小猫?电动星球
    [7] GTA 5家传「屎山」代码终于修复!R星认可黑客计划,还给他发了1万美元奖金,量子位
    [8] 30TOPS算力就可以完成自动驾驶?小鹏P5城市NGP体验,搜狐汽车
    [9] 自主品牌转型7大不合,看十余位车圈大佬高品质互怼,XEV钻研所

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题28

    帖子41

    积分192

    图文推荐