|
日期,谷歌开源了最新的200亿参数的预训练大言语模型Flan-UL2 20B。Flan模型是谷歌2021年公布的基于指令调教的办法,帮忙言语模型生成更为无意义的文本。而UL2则是谷歌2022年公布的一个一致的言语模型(一致的意思是用一个框架构造来训练不同的工作)。
这里的20B是指20 Billion参数,也就是200亿参数。这个模型是基于2022年蒲月份开源的UL2 20B模型训练的,参加了Flan那种指令调教,使得该模型在大范围多工作言语了解和Big-Bench方面有很好的成果。
按照民间声称,该模型成果比Flan-T5 XXL更好,与Flan-PaLM 62B模型比也颇有竞争力。最首要的是基于Apache 2.0开源协定开源,能够商用哦! |
|