华人澳洲中文论坛

热图推荐

    轻量版ChatGPT训练办法开源!仅用3天环抱LLaMA打造,号称训练速度比OpenAI快15倍

    [复制链接]

    2023-3-1 21:50:06 21 0

    原标题:轻量版ChatGPT训练办法开源!仅用3天环抱LLaMA打造,号称训练速度比OpenAI快15倍  
    萧箫 发自 凹非寺   
    量子位 | 大众号 QbitAI   
    基于Meta模型打造的轻量版ChatGPT,这就来啦?  
    Meta宣告推出LLaMA才三天,业界就泛起了把它打形成ChatGPT的开源训练办法,号称比ChatGPT训练速度 最高快15倍。   
    LLaMA是Meta推出的超快超小型GPT-3,参数量只要后者的10%,只需求单张GPU就可以运转。  
    把它变为ChatGPT的办法名叫ChatLLaMA,基于RLHF (基于人类反馈的强化学习)进行训练,在网上很快掀起了一阵热度。   


    所以,Meta的开源版ChatGPT真的要来了?  
    先等等,事件倒也没那末简略。  
    把LLaMA训练成ChatGPT的“开源办法”   
    点进ChatLLaMA名目主页来看,会发现它实际上集成为了四个部份——  
    DeepSpeed、RLHF办法、LLaMA和基于LangChain agent生成的数据集。  
    其中, DeepSpeed是一个开源深度学习训练优化库,包孕名叫Zero的现存优化技术,用于晋升大模型训练才能,详细指帮模型晋升训练速度、升高本钱、晋升模型可用性等。   
    RLHF则会采取嘉奖模型来对预训练模型进行微调。嘉奖模型即先用多个模型生成问题问答,再依托人工对问答进行排序,让它学会打分;随后,基于嘉奖学习给模型生成的回答进行打分,经过强化学习的形式加强模型才能。   
    LangChain是一个大言语模型运用开发库,但愿将各种大言语模型整合起来,结合其余常识来源或计算才能创立一个实用的运用顺序。LangChain agent则会像思惟链同样放出GPT-3思考的全进程,将操作记载上去。   
         这时候候你会发现,最症结的仍旧是 LLaMA的模型权重。它从哪里来?   
    嘿嘿,本人去找Meta请求吧,ChatLLaMA其实不提供。 (虽然Meta宣称开源LLaMA,但仍旧需求请求)  
    所以实质下去说,ChatLLaMA 并非一个开源ChatGPT名目,而只是一种基于LLaMA的训练办法,其库内集成的几个名目本来也都是开源的。   
    实际上,ChatLLaMA也并不是由Meta打造,而是来自一个叫做Nebuly AI的初创AI企业。  
    Nebuly AI做了一个叫做Nebullvm的开源库,外面集成为了一系列即插即用的优化模块,用于晋升AI零碎机能。  
    例如这是Nebullvm目前包孕的一些模块,包罗基于DeepMind开源的AlphaTensor算法打造的OpenAlphaTensor、自动感知硬件并对其进行减速的优化模块……  


    ChatLLaMA也在这一系列模块中,但要留意的是它的开源license也是不成商用的。   
    所以“国产自研ChatGPT”想要间接拿去用,可能还没那末简略 (doge)。   
    看完这个名目后,有网友表现,要是有人真搞到LLaMA的模型权重 (代码)就行-了……   
    但也有网友指出,“比ChatGPT训练办法快15倍”这类说法是一个纯纯的误导:  
    所谓的快15倍只是由于LLaMA模型自身很小,乃至能在单个GPU上运转,但应该不是由于这个名目所做的任何事件吧?
        所谓的快15倍只是由于LLaMA模型自身很小,乃至能在单个GPU上运转,但应该不是由于这个名目所做的任何事件吧?  
    这位网友还保举了一个比库中成果更好的RLHF训练办法,名叫trlx,训练速度要比通常的RLHF办法快上3~4倍:  


    你拿到LLaMA的代码了吗?感觉这个训练办法如何?  
    ChatLLaMA地址:  
    http://github.com/nebuly-ai/nebullvm/tree/main/apps/accelerate/chatllama  
    —   
    「中国AIGC产业峰会」启动  
    邀您共襄盛举  
    「中国AIGC产业峰会」行将在往年3月举行,峰会将约请AIGC产业相干畛域的专家学者,独特讨论生成新世界的过来、当初和将来。   
    峰会上还将公布 《中国AIGC产业全景讲演暨AIGC 50》,片面平面描画我国以后AIGC产业的竞争力求谱。点击链接或下方图片查看大会详情:   
    寻觅中国版ChatGPT,量子位邀你独特参预中国AIGC产业峰会   
    点这里 ?关注我,记得标星哦~   
    一键三连「分享」、「点赞」和「在看」  
    科技前沿停顿日日相见 ~

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    中级会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题39

    帖子53

    积分245

    图文推荐