华人澳洲中文论坛

轻量版ChatGPT训练办法开源!仅用3天环抱LLaMA打造,号称训练速度比OpenAI快15倍

[复制链接]

2023-3-1 21:50:06 74 0

原标题:轻量版ChatGPT训练办法开源!仅用3天环抱LLaMA打造,号称训练速度比OpenAI快15倍  
萧箫 发自 凹非寺   
量子位 | 大众号 QbitAI   
基于Meta模型打造的轻量版ChatGPT,这就来啦?  
Meta宣告推出LLaMA才三天,业界就泛起了把它打形成ChatGPT的开源训练办法,号称比ChatGPT训练速度 最高快15倍。   
LLaMA是Meta推出的超快超小型GPT-3,参数量只要后者的10%,只需求单张GPU就可以运转。  
把它变为ChatGPT的办法名叫ChatLLaMA,基于RLHF (基于人类反馈的强化学习)进行训练,在网上很快掀起了一阵热度。   


所以,Meta的开源版ChatGPT真的要来了?  
先等等,事件倒也没那末简略。  
把LLaMA训练成ChatGPT的“开源办法”   
点进ChatLLaMA名目主页来看,会发现它实际上集成为了四个部份——  
DeepSpeed、RLHF办法、LLaMA和基于LangChain agent生成的数据集。  
其中, DeepSpeed是一个开源深度学习训练优化库,包孕名叫Zero的现存优化技术,用于晋升大模型训练才能,详细指帮模型晋升训练速度、升高本钱、晋升模型可用性等。   
RLHF则会采取嘉奖模型来对预训练模型进行微调。嘉奖模型即先用多个模型生成问题问答,再依托人工对问答进行排序,让它学会打分;随后,基于嘉奖学习给模型生成的回答进行打分,经过强化学习的形式加强模型才能。   
LangChain是一个大言语模型运用开发库,但愿将各种大言语模型整合起来,结合其余常识来源或计算才能创立一个实用的运用顺序。LangChain agent则会像思惟链同样放出GPT-3思考的全进程,将操作记载上去。   
     这时候候你会发现,最症结的仍旧是 LLaMA的模型权重。它从哪里来?   
嘿嘿,本人去找Meta请求吧,ChatLLaMA其实不提供。 (虽然Meta宣称开源LLaMA,但仍旧需求请求)  
所以实质下去说,ChatLLaMA 并非一个开源ChatGPT名目,而只是一种基于LLaMA的训练办法,其库内集成的几个名目本来也都是开源的。   
实际上,ChatLLaMA也并不是由Meta打造,而是来自一个叫做Nebuly AI的初创AI企业。  
Nebuly AI做了一个叫做Nebullvm的开源库,外面集成为了一系列即插即用的优化模块,用于晋升AI零碎机能。  
例如这是Nebullvm目前包孕的一些模块,包罗基于DeepMind开源的AlphaTensor算法打造的OpenAlphaTensor、自动感知硬件并对其进行减速的优化模块……  


ChatLLaMA也在这一系列模块中,但要留意的是它的开源license也是不成商用的。   
所以“国产自研ChatGPT”想要间接拿去用,可能还没那末简略 (doge)。   
看完这个名目后,有网友表现,要是有人真搞到LLaMA的模型权重 (代码)就行-了……   
但也有网友指出,“比ChatGPT训练办法快15倍”这类说法是一个纯纯的误导:  
所谓的快15倍只是由于LLaMA模型自身很小,乃至能在单个GPU上运转,但应该不是由于这个名目所做的任何事件吧?
    所谓的快15倍只是由于LLaMA模型自身很小,乃至能在单个GPU上运转,但应该不是由于这个名目所做的任何事件吧?  
这位网友还保举了一个比库中成果更好的RLHF训练办法,名叫trlx,训练速度要比通常的RLHF办法快上3~4倍:  


你拿到LLaMA的代码了吗?感觉这个训练办法如何?  
ChatLLaMA地址:  
http://github.com/nebuly-ai/nebullvm/tree/main/apps/accelerate/chatllama  
—   
「中国AIGC产业峰会」启动  
邀您共襄盛举  
「中国AIGC产业峰会」行将在往年3月举行,峰会将约请AIGC产业相干畛域的专家学者,独特讨论生成新世界的过来、当初和将来。   
峰会上还将公布 《中国AIGC产业全景讲演暨AIGC 50》,片面平面描画我国以后AIGC产业的竞争力求谱。点击链接或下方图片查看大会详情:   
寻觅中国版ChatGPT,量子位邀你独特参预中国AIGC产业峰会   
点这里 ?关注我,记得标星哦~   
一键三连「分享」、「点赞」和「在看」  
科技前沿停顿日日相见 ~

发表回复

您需要登录后才可以回帖 登录 | 立即注册

返回列表 本版积分规则

:
中级会员
:
论坛短信
:
未填写
:
未填写
:
未填写

主题39

帖子57

积分261

图文推荐

  • 撞穿学校栅栏害死十一岁男孩的司机不必坐牢

    一位女司机撞穿学校栅栏、害死了11岁男孩,被罚20

  • 全科医生正告花粉症时节正在好转

    全国各地的全科医生正告春季的开端标记着花粉症时

  • 新西兰总理:出世在新西兰的新纳粹Thomas S

    新西兰总理拉克森称新纳粹Thomas Sewell是坏人,

  • 新州护士和助产士承受暂时加薪3%的前提

    新州护士和助产士投票承受政府提出的暂时加薪3%以

  • 新纳粹份子如何利用“普通父母”的掩护在反

    星期天,新纳粹份子在反移民集会开端前大约一个小