华人澳洲中文论坛

热图推荐

    可继续专栏 | ChatGPT的环境本钱到底有多大?

    [复制链接]

    2023-2-11 15:28:46 85 0

    号称史上最强AI的ChatGPT知道本人天天排放多少二氧化碳吗?一番沟通后,华尔街见闻失掉了否认的谜底。
    看来临时只能由人脑来替它回答了。
    环球零碳钻研核心钻研员唐淑姝告知华尔街见闻,假如粗略合算ChatGPT的总生命周期碳脚印,自2022年十一月30日运转60余天来,其制作装备碳排放超过33.41吨,模型训练碳排放超过552吨,运转60天碳排放约为229.2吨;三者相加,ChatGPT上线后的碳排放超过814.61吨。
    要想从大气中排汇这些二氧化碳,至关于需求栽种超过6.5万棵树。
    虽然“虚构”的属性让人们容易无视数字产品的碳帐本,但事实上,互联网却无疑是地球上最大的煤炭能源机器之一。
    训练机器成碳排“小户”
    聊天机器人、数字助理以及来自流媒体办事的电影和音乐保举都依赖于“深度学习”——一种训练计算机模型以辨认数据模式的进程。
    这类训练需求弱小的计算机和少量的能量撑持。关于ChatGPT全生命周期的碳脚印数据,这个阶段是货真价实的排缩小户。
    最精密的深度学习模型之一,指标就是发生相似人类的言语。在ChatGPT问世前,OpenAI公司先开发了一套繁杂的天然言语模型,命名为GPT-3。ChatGPT和GPT-3都是在少量文本数据上训练而成的,允许它们对文本输出发生相似人类的响应,但因为后者专门为会话工作而设计,GPT-3则更通用一些,所以参数库要小100多倍。
    “ChatGPT是基于GPT-3的一个降级版本,在GPT-3的模型架构根底上又进行了优化并在训练时代减少了强化学习。”唐淑姝对华尔街见闻剖析,“所以要预算ChatGPT在训练阶段的碳排,能够参考GPT-3的排放值。”
    无数据显示,过后训练 GPT-3 损耗了十二87MWh,排放出552吨温室气体。
    “GPT-3 的少量排放能够部份解释为它是在较旧、效力较低的硬件上进行训练的,但由于没有权衡二氧化碳排放量的规范化办法,这些数字是基于估量,此外,这部份碳排放值中详细有多少应该调配给训练ChatGPT,规范也是对比隐约的,需求留意的是,因为强化学习自身还需求额定损耗电力,所以ChatGPT在模型训练阶段所发生的的碳排放应该大于这个数值。”可继续数据钻研者卡斯帕-路德维格森如是剖析。
    仅以552吨排放量计算,这些至关于十二6个丹麦家庭每一年损耗的能量。
    运转阶段的碳本钱
    用户在操作ChatGPT时的举措耗电量很小,但因为寰球天天可能产生十亿次,累积之下使其成了第二大碳排放来源。
    唐淑姝对华尔街见闻表现,能够将另外一个大型言语模型BLOOM作为类最近揣测ChatGPT运转阶段的碳排放。BLOOM曾在拥有16个Nvidia A100 40GB GPU的Google Cloud Platform实例上部署并运转了18天,共432小时。
    “BLOOM与ChatGPT前身GPT-3的模型大小大抵相反,假定把相反的硬件用于ChatGPT,并在16个Nvidia A100 40GB GPU上运转,并揣测硬件利用率一直为100%,”唐淑姝经过使用ML CO2 Impact计算机,预算出ChatGPT的逐日碳排放为25.92 kg。
    Databoxer联结开创人克里斯·波顿则解释了另外一种计算办法。
    “首先,咱们估量每个响应词在A100 GPU上需求0.35秒,假定有100万用户,每个用户有10个问题,发生了10000000个响应和天天300000000个单词,每个单词 0.35 秒,能够计算得出天天A100 GPU运转了29167个小时。”
    Cloud Carbon Footprint列出了Azure数据核心中A100 GPU的最低功耗46W和最高 407W,因为极可能没有多少ChatGPT处置器处于闲置形态,以该规模的顶端损耗计算,天天的电力能耗将达到十一870kWh。
    “美国西部的排放因子为 0.000322167 吨/kWh,所以天天会发生3.82吨二氧化碳当量,美国人均匀每一年约15吨二氧化碳当量,换言之,这与93个美国人每一年的二氧化碳排放率至关。”克里斯·波顿说。
    Ai的动力账
    依据唐淑姝的观念,从全生命周期角度看还应该包孕ChatGPT在制作阶段的隐性碳排。仍以BLOOM作为参照,训练总时间共继续108万小时,均匀使用48个计算节点上的384个GPU,能够估量与模型训练相干的办事器隐含碳排缩小约为7.57吨和GPU3.64吨,共计约十一.2吨。
    “ChatGPT的训练时间大约比BLOOM长3倍,单从这个角度预算,预算ChatGPT中模型训练的隐含碳排放总量约为33.6吨。”唐淑姝对华尔街见闻解释道。
    事实上,学界关于人工智能与环境本钱的瓜葛很是关切。伯克利大学对于功耗和人工智能主题的钻研以为,人工智能简直吞噬了动力。
    好比谷歌的预训练言语模型T5使用了86兆瓦的电力,发生了47公吨的二氧化碳排放量;谷歌的多轮凋谢畛域聊天机器人Meena使用了232兆瓦的电力,发生了96公吨的二氧化碳排放;谷歌开发的言语翻译框架-GShard使用了24兆瓦的电力,发生了4.3公吨的二氧化碳排放;谷歌开发的路由算法Switch Transformer使用了179兆瓦的电力,发生了59公吨的二氧化碳排放。
    深度学习中使用的计算才能在20十二年至2018年间增长了300000倍,这让GPT-3看起来成了对气象影响最大的一个。但是,当它与人脑同时任务,人脑的能耗仅为机器的0.002%。
    据估量,寰球科技行业占寰球温室气体排放量的1.8% 至 3.9%。只管这些排放量中只要一小部份是由人工智能和机器学习惹起的,但人工智能的碳脚印关于技术中的单个畛域来讲依然十分高。
    颁发于Nature的一项计算碳本钱的钻研暴-露了与人工智能相干的碳脚印在各种云计算数据核心训练一系列模型。后果标明,在美国中部或德国的数据核心训练 BERT(一种常见的机器学习言语模型)会排放22-28千克二氧化碳。这是在挪威(大部份电力来自水力发电)或在次要依赖核能的法国进行相反试验发生的排放量的两倍多。
    而一天中进行试验的时间一样首要。例如,在美国华盛顿州,当该州的电力仅来自于水力发电时,在夜间训练人工智能致使的排放量低于在白昼训练,由于那时的电力来自于燃气站。
    经过更好地理解 AI零碎损耗了多少动力,也许有助于人类衡量做出在净化和本钱之间的更优选择。

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    中级会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题38

    帖子46

    积分218

    图文推荐