华人澳洲中文论坛

热图推荐

    谷歌开源了最新的200亿参数的预训练大言语模型Flan-UL2 20B!

    [复制链接]

    2023-3-4 07:41:21 39 0

    日期,谷歌开源了最新的200亿参数的预训练大言语模型Flan-UL2 20B。Flan模型是谷歌2021年公布的基于指令调教的办法,帮忙言语模型生成更为无意义的文本。而UL2则是谷歌2022年公布的一个一致的言语模型(一致的意思是用一个框架构造来训练不同的工作)。


    这里的20B是指20 Billion参数,也就是200亿参数。这个模型是基于2022年蒲月份开源的UL2 20B模型训练的,参加了Flan那种指令调教,使得该模型在大范围多工作言语了解和Big-Bench方面有很好的成果。
    按照民间声称,该模型成果比Flan-T5 XXL更好,与Flan-PaLM 62B模型比也颇有竞争力。最首要的是基于Apache 2.0开源协定开源,能够商用哦!

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    中级会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题38

    帖子46

    积分213

    图文推荐