华人澳洲中文论坛

热图推荐

    初期名目 |AI企业「澜舟科技」自研开源言语大模型 ,提供以 NLP 为中心的行业常识办事平台

    [复制链接]

    2023-2-27 12:09:01 21 0

    文 | 周鑫雨
    编纂 | 苏建勋
    在由ChatGPT诱发的大模型热潮中,不少国际的初创企业但愿能走出一条中国化路途。
    成立于2021年的澜舟科技是由李开复的翻新工场从0孵化的AI企业。据开创人周明引见,澜舟科技努力于解决人类的言语了解和生成困难,提供基于NLP(天然言语了解)技术的开源大模型以及聚焦于营销、金融、文明创意等场景的功用引擎和运用。
    2018年以来,BTA、华为等国际互联网厂商在大模型的研发上曾经开始涉猎。周明发现,互联网企业的大模型次要办事于企业外部,鲜少对外赋能。研发大模型对中小企业来讲有较高门坎,国际相干的AI办事较少,大多公司只能选择接入海内的开源模型。
    为此,澜舟科技于2021年7月推出了孟子大模型及相干系列开源模型。基于Transformer,孟子大模型可反对以及疾速交换自回归(如GPT)、自编码(如BERT)等多种预训练模型。
    在周明看来,初创公司在大模型畛域仍然有摸索天花板的时机。基于网上的地下数据和协作火伴提供的数据,澜舟科技选择在算法才能上下工夫,而非狂堆参数的“暴力”模式。
    终究,澜舟科技花了近一年的时间打磨出了孟子大模型。在模型榜单CLUE公布的中文了解评测排行榜中,孟子大模型分数冲破84分,迫近人类基准分数(85.61分)。
    目前,孟子大模型已开源17个模型,分别可运用于天然言语了解、金融材料分类、可控文本生成和图片生成等场景。同时,澜舟科技还为上游运用场景提供了句向量计算(用于捕获文本间的语义类似性)和大模型定制的办事。
    除此以外,面向营销、金融、文明创意等场景,澜舟科技推出了AIGC(智能创作平台)、机器翻译平台、金融NLP平台等toB+toC办事。目前,澜舟科技已与华为云、逼真语联网、中文在线等企业达成协作,并与北京大学、清华等10所高校进行产学研的联璧。
    目前澜舟科技也在打磨不同范围的ChatGPT模型,从10亿参数、100亿元参数到1000亿参数,顺应不同需要。同时在大模型底座根底上,也在斟酌训练垂直畛域的大模型。澜舟长时间以来始终从事金融畛域的大模型,比来与中文在线协作宣告,协作打造一款用于网文写作的类ChatGPT模型。
    澜舟科技开创人周明于1999年参加微软亚洲钻研院并长时间领导NLP钻研,其团队为微软必应搜寻、Office、Azure、微软小冰等产品奉献了中心的 NLP 技术。澜舟科技三名合伙人在大数据、人工智能等畛域均有较为丰硕的从业或钻研教训。
    “在国际开源语料稀缺的状况下,中文的数据量大略在英文的1/10,短时间内,中文大模型追逐上ChatGPT有一定难度。”周明告知36氪,“不外,只有AI大模型与上上游自上而下或自下而上造成一个良好的生态或闭环效应,国产的中文ChatGPT是能够期待的。”
    36kr制图

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题29

    帖子39

    积分175

    图文推荐