谷歌开源了最新的200亿参数的预训练大言语模型Flan-UL2 20B！

蝈蝈

日期，谷歌开源了最新的200亿参数的预训练大言语模型Flan-UL2 20B。Flan模型是谷歌2021年公布的基于指令调教的办法，帮忙言语模型生成更为无意义的文本。而UL2则是谷歌2022年公布的一个一致的言语模型（一致的意思是用一个框架构造来训练不同的工作）。

这里的20B是指20 Billion参数，也就是200亿参数。这个模型是基于2022年蒲月份开源的UL2 20B模型训练的，参加了Flan那种指令调教，使得该模型在大范围多工作言语了解和Big-Bench方面有很好的成果。
按照民间声称，该模型成果比Flan-T5 XXL更好，与Flan-PaLM 62B模型比也颇有竞争力。最首要的是基于Apache 2.0开源协定开源，能够商用哦！

华人澳洲中文论坛

热图推荐

谷歌开源了最新的200亿参数的预训练大言语模型Flan-UL2 20B！

发表回复

浏览过的版块

蝈蝈
关注TA

图文推荐

华人澳洲中文论坛

热图推荐

谷歌开源了最新的200亿参数的预训练大言语模型Flan-UL2 20B！

发表回复

浏览过的版块

蝈蝈 关注TA

图文推荐

蝈蝈
关注TA