华人澳洲中文论坛

热图推荐

    百度公布「AI大底座」:一口吻把10年AI技术积攒打包了

    [复制链接]

    2023-1-12 21:34:01 18 0

    原标题:百度公布「AI大底座」:一口吻把10年AI技术积攒打包了  
    鱼羊 发自 凹非寺   
    量子位 | 大众号 QbitAI   
    技术翻新的节点性时辰,往往是以基建改革的方式展示。  
    当初,中国AI头等玩家百度,再次明白复现了这一法则:  
    AI大底座,已正式对外推出。   
    就在刚刚完结的百度AI开发者大会上,李彦宏判别, 深度学习算法是第四次科技反动的标记。   
    而且“翻新驱动增长,反馈驱动翻新”,这类技术气力向产业蔓延的过程当中,真实的运用翻新要靠在产业实际运用中的“反馈”能力完成。  

    s3yn0ih1ik0.jpg

    s3yn0ih1ik0.jpg

      
    百度开创人、董事长兼首席履行官李彦宏   
    而集百度AI才能之大成的AI大底座,恰是百度交出的答卷。   
    甚么是AI大底座?  
    能够这样了解:这一根底设施涵盖从芯片、框架,到大模型、运用的AI开展全因素。 等因而把大数据、大算力、大模型集结到了同一个体系构造傍边。   
    比拟于传统云办事,能够说是片面“AI化”,把计算跟智能更严密地绑定在了一同。  
    百度此举,如何解读?又详细印证了怎么样的技术大势?  
    咱们按例一层层拆解来看。  
    AI大底座如何构成?   
    仍是先来看看AI大底座的残缺构成。  
    展开全文    详细分为两层:  
    根底架构AI IaaS层:最中心的组成部份是提供AI算力反对的芯片。在百度AI大底座中,中心芯片包罗百度自研的AI芯片 昆仑芯 ,以及 太行DPU 等。  运用平台AI PaaS层:整合百度AI两大王牌 飞桨深度学习框架 和 百度文心大模型 ,可以完成从数据存储,到AI模型训练、出产、部署、测试的全链路、批量化出产。    从架构下去看,AI大底座既在底层的AI计算、存储、减速、容器方面进行了零碎优化和产品自研,也在更高层的AI开发、模型供应才能方面,释出了百度长时间积攒的AI技术劣势。  

    v523lta0kn1.jpg

    v523lta0kn1.jpg


    更值得关注的是,因为百度在全因素上都完成了中心产品自研,集大成的AI大底座各层之间深度耦合,使得 端到真个整合优化成为可能。   
    基于这样的架构,AI运用开发的模式再也不是手任务坊式的“一名目一训练”,需求耗损少量数据标注本钱和人工调优本钱,而是更像流水线工厂:  
    AI底层技术被笼统出来,造成了通用化、模块化的平台套件,企业只需求根据实际业务需要“搭积木”。  
    AI大底座有何用?   
    这样一种根底设施的方式,能带来甚么新价值?  
    中心仍是与产业降级最实质的需要无关,即降本增效。  
    结合实际案例来看。现实汽车和百度智能云协作,基于百度AI大底座,构建了用于自动驾驶研发的“现实汽车智能云”。  
    现实的需要在于,跟着自动驾驶研发的深化,其所面对的业务场景愈来愈宏大、繁杂;而且跟着智能汽车出货量愈来愈多,得多车载数据要回传进一步再训练,其中波及到繁杂的AI开发运用环节,对算力、模型泛化才能的要求也很高。  
    因而,百度AI大底座一方面为其提供了残缺的开发运用工具链,涵盖数据收集标注、数据闭环、模型开发、云仿真等AI开发环节,让现实能够不必破费额定的时间精神,斟酌资源调度、训练机能、模型部署验证等问题。  
    另外一方面,在百度AI大底座的体系之中,运用落地过程当中泛起的模型成果问题,可以在深度学习框架的反对之下,疾速驱动迭代新的模型构造;同时当下层运用对底层芯片算力提出新的要求,也可以迅速失掉反馈调剂。  
    经过这样端到真个优化,AI大底座使自动驾驶罕用的算子训练和推理速度均匀晋升了100%,同时使研发迭代效力晋升了100%。  

    0lddclyl4fh.jpg

    0lddclyl4fh.jpg


    从这个案例中能够看出,企业做智能化、做AI开发的中心痛点包罗两方面:  
    其一,根底设施构建需求破费少量时间精神。尤为在智能计算占比减轻的状况下,芯片、框架、模型、运用各个环节,都需求大范围投入和长时间技术积攒。  其二,所构建的根底设施假如不克不及从底层硬件到下层运用深度耦合,就会影响AI开发的实际效力和迭代速度。    而AI大底座作为一个全栈融会的智算根底设施,凭借其全因素、端到端优化的特征,在知足产业对根底设施的最新需要的同时,偏偏能解决智能化过程当中资源效能和模型效能的瓶颈问题。  
    另外,下层文心大模型的引入,还驱动AI大底座造成了平台化的反馈闭环机制。  
    简略来讲,就是产业运用中发生的新常识和教训,还能不停被用来再训练大模型,让AI完成“自我降级”,以顺应不同的业务环境。  
    国网福建,就已受害于这一机制。  
    为理解决繁杂天然环境中的装备巡检等业务问题,国网福建一样选择了智能化降级。  
    他们遇到的一个问题是,虽然摄像头、无人机等装备能够充任巡检人员的“眼睛”,替人进入到繁杂、风险环境中回传数据,再靠AI来辅佐判别平安隐患、瑕疵点。但实际上,天然界的阳光、云彩、光线、植被,任何一点变动均可能给数据带来新的乐音,影响模型的精确率。  
    此外,国网是一个大团体,底下各个分公司面对的天然环境都纷歧样,因此通用模型落实到当地,成果往往不尽善尽美。  
    国网福建的最新解决计划,是依靠于百度AI大底座,打造了一个电力大模型。  
    这个电力大模型每到一处,经过排汇大量本地样本信息进行微调,就可以疾速顺应本地需要。同时,微调的进程又会被反馈到通用大模型本体傍边,进一步增强通用大模型的泛化才能。  

    q4faxxdia3q.jpg

    q4faxxdia3q.jpg


    AI大底座,为何是当初?   
    简略总结起来,百度AI大底座,从技术的角度来看,就是百度AI技术的集大成者。从产业价值的角度来看,则是以集中气力办小事的形式,解决了产业降级以后面临的痛点问题。  
    但,为何是当初?  
    当ChatGPT为首的一众大模型,在2022年里掀起一波又一波AIGC的狂欢。  
    在更凑近实际运用的产业侧,新一轮技术冲击也正在引爆各行各业对AI运用的需要增长。  
    无论是现实的案例,仍是国度电网的案例,实质上看,这一轮根底设施之变,实际上就是环抱智能之变。  
    这一点,在数据上亦有反馈。IDC最新讲演就预测,2022年,中国AI私有云办事市场范围将达到74.6亿人民币。相较于2021年的44.1亿元人民币,增长了近41%。  
    所以,为何百度选择在此时推出AI大底座, 第一重谜底,就是时期所需,大势所至。  
    假如说根底云计算,减速了企业数据、业务电子化、数字化的过程,那末当AI开始更深档次地被嵌入到企业开展的链路之中,新一代AI根底设施的推出就变失势在必行。  
    百度团体副总裁侯震宇也坦承:  
    AI大底座恰是应经济减速智能化的大潮流而生。
        AI大底座恰是应经济减速智能化的大潮流而生。  

    kxib0onnon1.jpg

    kxib0onnon1.jpg


    百度团体副总裁侯震宇   
    而只管在通用云产品上,百度智能云更多表演的是“追逐者”的角色,但其与AI的渊源,却是时间跨度最长的。  
    有不少行业剖析以为,百度智能云从降生起就是百度AI技术的输入窗口,能够说从出世起就是一朵打着AI标签的云。  
    这就是第二重谜底:在AI+Cloud这一标的目的上,百度拥有“人无我有”的技术劣势和教训积攒。  
    AI畛域出身的玩家,在底层芯片和零碎才能上往往欠缺教训。而有着深挚底层设施根底的厂商,在下层AI软件才能上,又短少丰硕的落地案例积攒。  
    从这个层面下去说,在芯片、深度学习框架、大模型、产业运用各个环节都有自研根底,且已积攒丰硕落地教训的,百度算得上是唯一家:  
    芯片方面,20十一年,百度就启动了自研FPGA AI减速器名目。2017年,曾经有超过1.2万片FPGA在百度业务体系中被部署。  
    2018年,百度更是公布了自主研发的AI芯片昆仑芯。2020年,第一代昆仑芯开始大范围部署。目前,这颗芯片曾经落地超过2万片,而且被普遍运用在百度搜寻和自动驾驶等畛域,同时办事 50 多家内部客户,是国际为数未几真正派受过大范围算法考验的芯片。  

    xtvjj01zzj3.jpg

    xtvjj01zzj3.jpg


    框架方面,百度飞桨是国际最先启动研发的自研深度学习框架。2016年开源至今,已凝聚406万开发者,办事过15.7万企事业单位,开发模型达47.6万个。  
    按照IDC讲演,截至2021年上半年,TensorFLow、PyTorch以及百度飞桨成为国际最高频使用的开源框架。  

    dk5bcdzx1fb.jpg

    dk5bcdzx1fb.jpg


    大模型方面,百度文心大模型是基于百度逾10年的AI技术积攒,和20年来产品业务积淀下的用户实在需要打造。从2019年ERNIE 1.0公布算起,文心大模型在地下权威语义评测中已斩获十余项世界冠军。  
    基于文心大模型,百度目前已公布十一个行业大模型,大模型总量达36个,已构成业界范围最大的产业大模型体系。目前已大范围运用于搜寻、信息流等互联网产品,并在工业、动力、金融、汽车、通讯、媒体、教育等各行业落地运用。  

    veybhxkrhut.jpg

    veybhxkrhut.jpg


    这些技术规划,往往始于技术微末之时,乃至被冠以“烧钱”的字眼。  
    但也恰是十年饮冰的坚持投入,使得百度AI大底座成了行业内首个 全栈自研的智算根底设施。   
    又恰是长时间技术积攒带来的全栈自研才能,给行业和百度自身,都带来了更深远的影响。  
    关于行业而言,一个全因素、端到真个根底设施,实际是在AI运用密度愈来愈高、需要计算量愈来愈大的状况下,把高门坎技术以低门坎形式输入完成,同时还使得更高性价比成为可能。  
    用百度本人的话说,是:  
    他人用100张卡来做的事,咱们用五六十张就可以解决。
      百度AI大底座可晋升千卡并行减速比至90%以上,训练场景资源利用率70%以上,模型开发迭代效力晋升100%以上。
        他人用100张卡来做的事,咱们用五六十张就可以解决。  
    百度AI大底座可晋升千卡并行减速比至90%以上,训练场景资源利用率70%以上,模型开发迭代效力晋升100%以上。  
    这一点,还更加具象化地体当初了百度初次对外凋谢的阳泉智算核心上。  
    这一智算核心是目前已建成的亚洲最大单体智算核心,具备4EFLOPS的算力,千卡减速比达到90%,异构资源利用率超过70%。  
    在绿色节能方面,其PUE值(电能使用效力)低至1.08。这象征着百度一家企业一年节俭的电量等于德国一个中型城市全年用电量。因节能而节俭的本钱,跟着智算核心的对外凋谢,也将投射到客户的本钱勤俭上。  
    注:PUE=数据核心总能耗/IT装备能耗,越接近1标明能效程度越好。  
    这也就象征着,将来能参预到智能化降级过程中的企业,将不止于实力更加微弱的产业头部企业,更多中小企业亦将为前沿科技所辐射。  
    而关于百度而言, 自主可控自身亦是更深档次社会价值的体现。   
    技术的翻新,驱动着基建的改革,又经过新一代根底设施的种种特点,更加明晰地被标注在产业运用之中,切切实实地影响着产业智能化转型的节拍和开展速度。  
    面前科技自立的价值,显而易见。  
    是以,时分到了。  

    tbtr4kbejzt.jpg

    tbtr4kbejzt.jpg

      
    百度团体履行副总裁、百度智能云事业群总裁沈抖   
    而且就如百度团体履行副总裁、百度智能云事业群总裁沈抖所分享的那样:  
    智能化为行业发明价值的浪潮才刚刚开始。
        智能化为行业发明价值的浪潮才刚刚开始。  
    —   
    点这里 ?关注我,记得标星哦~   
    一键三连「分享」、「点赞」和「在看」  
    科技前沿停顿日日相见 ~

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题26

    帖子31

    积分138

    图文推荐