华人澳洲中文论坛

热图推荐

    英伟达停货,伤了谁

    [复制链接]

    2022-9-2 07:53:10 23 0



    作者| 宇多田
    出品| 虎嗅科技组
    封面来自视觉中国
    假如能给人工智能与迷信计算产业设一个热搜榜,那末从昨晚到明天,榜单只要两个热词:
    英伟达停货,AMD停货。
    作为寰球顶级计算芯片企业,两家的布告简直一晚上之间刷遍算法工程师的敌人圈:英伟达的云端减速器系列A100与H100,以及AMD的数据核心级GPU MI100与MI200,都将暂停向中国客户发货,等候下一步通知。


    图片由产业提供
    虎嗅第一时间分割了英伟达与AMD民间分割渠道,失掉的回答均为“不予回复”。但这个动静,曾经失掉了国际产业相干推销人士的证明。
    昨日,一份由英伟达在8月26日提交给美国证券买卖委员会(SEC)的讲演里明白显示,出口英伟达的办事器GPU A100与H100系列,需求向政府请求新许可证。
    “将来峰值机能与芯片I/O机能等于或大于A100的任何英伟达产品,以及包孕这些电路的任何零碎,都需求遵照新的许可要求。” 文件里特地标注出受限的产品型号。换句话说,代际在A100之后的高端AI减速卡系列(包罗A100、H100以及与这些硬件产品亲密相干的DGX零碎),都将在中国市场遭到更为严苛的销售限度。
    英伟达承受美国媒体采访时抵赖,本人正在与中国客户做代替产品相干的交涉。虽然在请求新的许可证以连续中国出口名目,但其实不分明政府能否给予豁免。
    从中国市场范围来看,英伟达遭遇的打击不小。
    据英伟达本人预算,2022年第三季度,他们在中国的潜伏销售额会增加4亿美元,而此前的预估支出为59亿美元。动静一出,其股价在周三的盘后买卖中跌幅达6.5%。


    来自SEC文件
    无庸置疑,英伟达各系列GPU产品始终都是产业焦点。特别是数据核心级减速卡,根本代表着寰球图形处置器软硬件的最高水准。
    而A100,是在V100公布4年后,于2020年才推出的新一代数据核心级云端减速芯片。
    假如说2019年先后,国际华为等中国企业陆续公布了可对标V100系列的产品(很显著,参数上的超出不代表实际运用的超出),那末A100无论从制程(7nm)、架构(Ampere)仍是“运算与浮点机能”,都对市面上的其余产品进行了全方位碾压。


    4年时间,每个系列的高机能运算才能迭代
    “A100比V100强太多,这不仅仅是绝对机能的问题,而是在于‘怎么用’。” 一名虎嗅芯片剖析师表现,A100在运用层面有很大的想象力,而其配套的算法组件、算法库方面都是顶级的,在软件层面建设的全壁垒劣势太难打破。
    而基于Hooper架构的H100,则是2022年2月公布可取代A100的新一代异步计算巨兽。
    除了比A100多出最少250亿个晶体管,它也在FP16、FP32和FP64计算上比A100快三倍。英伟达曾特别指出,它十分合用于当上流行且训练难度高的“大模型”。
    “国际尚无能与这两代减速器相对于标的硬件产品与零碎才能。” 只管国际优秀团队与守业公司看起来得多,但一名剖析师指出,研发周期跨度最少有3年。
    商用影响不大
    与强悍机能相对于应的,则是低廉的价钱。
    以英伟达A100为例,单台 DGX A100办事器的售价高达19.9万美元,大部份学术机构担负不起,取而代之的是V与T系列的普遍运用。
    另外一方面,从人工智能掩盖的多产业(人脸、摄像头、金融、客服等等)与自动驾驶的企业级商用市场反馈来看,英伟达与AMD的顶配线始终不在他们的斟酌规模内
    “机能虽弱小,但关于城市路途级别的感知和布局,就过于牛鼎烹鸡了。自动驾驶对精度的要求,英伟达RTX(游戏)系列与Tesla系列的显卡足以应答。” 多位自动驾驶从业者表现,“性价比”是绝对的第一考量要素。
    而近些年来,在逐渐往汽车市场下沉的过程当中,过来不计本钱寻求高端算力芯片与高端工控机的L4自动驾驶公司,终究在车规级与高机能之间找到了均衡
    譬如在2021年,自动驾驶公司最喜爱做的事件,就是晒“与英伟达车规级Orin芯片的协作证书”。这是一款英伟达专门面向车规级自动驾驶市场开发的“可调理”计算芯片。


    2019年底英伟达正式公布Orin
    而英伟达数据核心云端减速器产品的绝对大客户——办事器厂商与云计算厂商们,也许会喜忧参半。
    一方面,2021年范围达到53.9亿美元的中国减速器市场还在不停壮大,GPU办事器占绝对主导。其中,减速卡的推销型号次要集中在英伟达的T4、V100、V100S以及A100系列上,外加大量的AMD与英特尔。
    2021年,中国减速卡数量出货超过80万片,其中英伟达占领超过80%市场份额(数据来自IDC)。
    “A100的推销量没有那末多,次要仍是T4与V100。” 一名云计算产业人士告知虎嗅,从2021年下半年后,包罗云计算和办事器厂商在内,为了应答不停变动的市场环境,在被动升高这种GPU的推销需要。
    但另外一方面,A100在更多繁杂模型训练上的吸引力依然极大。云巨头和一些有财力的科技公司加起来的购买量最少有万台范围。譬如,国际某家人工智能独角兽企业,推销了上千块A100
    不外值得留意,他们购买A100的理由并不是只为商用,而是与“超算”“高机能运算”等畛域有亲密瓜葛。
    “顶配”的迷信奉献
    就像下面那位虎嗅剖析师所说,享受A100与H100这种高端线的机构也需求具有更多“想象力”。或者说,使用者也需求具备与之相婚配的零碎级实力。
    2022年5月30日,第59届的寰球超算TOP500榜单上,美国橡树岭国度试验室开发的超级计算机Frontier以绝对劣势称霸。值得留意,Frontier 有9408个节点,每个节点配置了1个 AMD Epyc CPU 和4个AMD MI250X GPU。
    而橡树岭另外一台超算 Su妹妹it 排名第四,有4356个节点,每个节点配置了2个 IBM Power9 CPU和6个英伟达 V100;而美国动力钻研迷信计算核心公布的AI超级计算机 Perlmutter 则排名第7,GPU 采取了英伟达的A100。
    乏味的是,寰球排名第8的超级计算机由英伟达公司本人开发,其每个节点由AMD Epyc CPU与A100组成。


    图片来自TOP500超级计算机榜单
    “无庸置疑,英伟达的高端减速器对大范围迷信运算的钻研有严重影响力。” 一名国际专攻芯片机能调优的技术大佬指出,在这个市场,英伟达和AMD临时尚无对手。
    而乏味的是,愈来愈多的商业巨头也开始参预到“高机能运算”畛域的技术竞演中。
    就在2022年终,转型元宇宙的Meta地下抵赖,本人正在机密建立一台名叫“AI钻研超星团”(RSC)的AI超级计算机。
    虽然Meta建造这台机器的理由,次要集中在“防止遭到芯片与零部件供给链的太多株连”。但实际上,他们早在2017年就建设了一个由2.2万片V100组成的超级计算集群,天天履行3.5万个算法训练工作。
    而这次,RSC的工作规模也相应扩张——除了训练与天然言语处置与计算机视觉相干的大模型,也会探究更多未知的迷信工作。
    “大范围并行运算的钻研掩盖面十分普遍,毫不仅仅是人工智能方面的运用。或者说,经过人工智能,能够‘解密’更多天然迷信层面的钻研。”一名产业人士表现,“并行计算”也是仿真学、空气能源学、磁学等学科不成或缺的钻研工具。譬如,高端工业仿真软件,便需求高机能计算架构的强无力撑持。
    “因此,投入和开展这种底层并行计算产品,对咱们极其首要。”

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    中级会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题34

    帖子45

    积分203

    图文推荐