华人澳洲中文论坛

热图推荐

    让ChatGPT长“手”!Meta爆火新论文,让言语模型学会自主使用工具

    [复制链接]

    2023-2-14 07:00:24 36 0

    原标题:让ChatGPT长“手”!Meta爆火新论文,让言语模型学会自主使用工具  
    鱼羊 Pine 发自 凹非寺   
    量子位 | 大众号 QbitAI   
    ChatGPT爆火,Meta也坐不住了。  
    微软和谷歌正在搜寻引擎那边刺刀拼刺刀呢,谁想Meta冷不防抛出一篇新论文,登时吸引全场眼光:  
    瞄准ChatGPT的“软肋”,让大言语模型 自行学会了使用工具!   


    简略来讲,基于Meta的这个思绪,ChatGPT这些大言语模型能够缺啥补啥:  
    不会算数,就本人取出计算器计算;需求最新信息,就本人衔接搜寻引擎搜寻……  


    是否有点AI本人操作本人内味儿了?  
    论文一出,不少AI钻研者就将其视作“ 过来几周里最首要的论文”。   
         


    这篇论文给人们关上了思绪,让大言语模型将来能够成为一切事件的终点。
        这篇论文给人们关上了思绪,让大言语模型将来能够成为一切事件的终点。  


    还有网友表现:我老婆本来不太关怀AI,据说Meta这论文都惊了。普通人真的得好好想一想这事儿了。  


    自学工具用法的大言语模型   
    这一回,Meta给这个会使工具的言语模型起名 Toolformer。   
    Toolformer的内核逻辑,总结上去很简略,就是:  
    专业的工作交给专业的工具来做
        专业的工作交给专业的工具来做。   
    在生成文本的过程当中,遇到特定的工作,Toolformer会间接调用所需工具的API。  
    好比说,在履行这个工作:1400名参预者,有400人经过了测试,占多大比例? (为了让ChatGPT掌握数学运算,OpenAI可没少折腾【加链接:ChatGPT连夜迭代:你老婆欠好使了】)  
    Toolformer涓滴不慌,间接“取出”计算器,现场计算得出后果: 29%。   


    又或者说,想要备注个事件,只知道是周五,详细日期还不知道?  
    不妨事,翻出日历查一下就行-了。  




    除了这些工具以外,Toolformer还可以调用Q&A以及搜寻引擎等工具。  
    这时候,就曾经有网友开始畅想将来了:  
    当初,ChatGPT版必应能帮你对比酒店价钱,那将来有了Toolformer,预约性价比高的酒店岂不是也能够甩给AI去做了。
        当初,ChatGPT版必应能帮你对比酒店价钱,那将来有了Toolformer,预约性价比高的酒店岂不是也能够甩给AI去做了。  
    不外话说回来,Toolformer面对不同的工作都能行云流水般地调用对应的工具,它是怎么做到的呢?  
    一言以蔽之,Toolformer通过训练,可以在生成文本中拔出曾经API调用,间接将工作外包出去。  
    在这其中,训练的进程是以 自监视的形式实现的。这象征着无需少量人类标注好的数据,Toolformer只需求大量演示就可以学会调用API。   
    详细来讲,先给Toolformer提供大量曾经手动标注好的例子,而后让言语模型在理论中 生成一个更大的包孕示例的数据集。   
    这个进程次要分红三步:  
    首先是 取样,艰深点讲就是看输出的文本提醒中,哪一个中央需求调用哪一种工具,而后间接将“调用的API”拔出曾经到对应之处;   


    其次是 履行,履行上一步的“调用API”工作,将生成的文本间接拔出曾经进去;   
    最初是 过滤,上一步中工具生成的文本假如对输出文原本说用途不大的话,就能间接pass掉,保存对文本有用之处。   


    这样一来,基于这些有用的数据集,Toolformer即可以对事后训练好的大言语模型进行微调。  
    讲了这么多,Toolformer的实在成果究竟如何,有无一个横向的数据比较?  
    论文将Toolformer和多个其余大言语模型,包罗GPT-J,OPT (66B)以及GPT-3 (175B)进行了比较,对比了它们在数学、Q&A以及机器翻译等方面的才能。   
    后果显示,在学习使用工具后,GPT-J的零样本学习机能的到了明显的进步。  


    Toolformer:是在GPT- J上微调,并增强了CCNet子集中的API调用/ Toolformer (disabled):同上,但解码期间禁用API调用   
    而且在大少数工作上机能都有显著进步,在一些上游工作中Toolformer乃至曾经超过了GPT-3。  


    “将来大言语模型开展的首要分支”   
    说到这里,不知道你怎么看这件事儿。  
    有不少网友是曾经抑制不住,想着去拔AI电源了。  


    而诱发更多探讨的,是这样一种观念:Toolformer多是将来LLM(大言语模型)开展的一个首要分支。  


    大言语模型进化出使用工具的才能,知道应该在什么时候、使用何种工具来完成需要,也就象征着许多在明天还需求人类和AI合作实现的任务,将来AI都能本人搞定了。  
    好比当初还多少有些“人工智障”的语音助手,假如面前有ChatGPT+Toolformer的技术才能撑持,那末从挑拣合乎需要的餐厅,到间接订座,这一系列举措均可以被丝滑地串连起来。  
    又好比微软的必应搜寻接入ChatGPT。假如这些大言语模型能充沛调用各种API、使用UI,那它不只能帮人们实现搜寻,还能彻底改动人们操作网页的形式——所有输出均可以化简为天然言语。  
    乃至,ChatGPT这样的模型,借助各种API重写本人的代码,也将成为可能。  


    事实上,让AI掌握工具的使用办法这个钻研标的目的,也其实不只要Meta在做。  
    好比谷歌行将嵌入到搜寻中的 Bard,面前模型LaMDA就内置了一套工具箱,包罗计算器、翻译器和拜候搜寻引擎获得内部信息的接口。   
    还有开源名目 LangChain,也努力于将大言语模型与内部的计算、常识来源相结合,以开发真正可用的运用顺序。   
    而当初,Meta又使大模型对工具的使用“纯熟度”、“自主性”,更上一层楼。  
    不外,也有网友指出,Toolformer所展示出的“自学”才能,仍是一个高级、“广义”的版本。  
    这些模型自身依然是纯正的函数:给定相反的输出(包罗采样时的随机值),它将老是发生相反的输入。
      有点像是在说,一个大言语模型能学会将特定畛域的言语作为其天然言语的一部份,以此归入来自内部工具的常识。
        这些模型自身依然是纯正的函数:给定相反的输出(包罗采样时的随机值),它将老是发生相反的输入。   
    有点像是在说,一个大言语模型能学会将特定畛域的言语作为其天然言语的一部份,以此归入来自内部工具的常识。   


    One More Thing   
    Meta新论文炸场,还挑动了人类的“反思”神经。  
    这不,陈腐梗图曾经出炉:  
    人类在沉浸,而机器在学习。
        人类在沉浸,而机器在学习。  


    —   
    《中国AIGC产业全景讲演暨AIGC 50》调研启动  
    谁会是中国的“ChatGPT”?最有竞争力和后劲的AIGC气力位于何方?  
    量子位《中国AIGC产业全景报暨AIGC 50》正式启动对外征集,期待有更多优秀的机构、产品、案例与技术可以被公众看到。   
    点这里 ?关注我,记得标星哦~   
    一键三连「分享」、「点赞」和「在看」  
    科技前沿停顿日日相见 ~

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题34

    帖子43

    积分199

    图文推荐