华人澳洲中文论坛

热图推荐

    要做中国OpenAI的得多,但智源要打造大模型畛域的Linux

    [复制链接]

    2023-3-1 21:50:55 13 0

    原标题:要做中国OpenAI的得多,但智源要打造大模型畛域的Linux  
    衡宇 发自 凹非寺   
    量子位 | 大众号 QbitAI   
    “要做中国的OpenAI!”“要打造中国版ChatGPT!”ChatGPT的火以燎原之势蔓延到每一个个角落。  
    人们眼光的焦点会萃到这个详细的景象级运用,或者其它大模型撑持的类ChatGPT产品上。大模型似乎成了人人都能参预的游戏? 智源钻研院院长黄铁军其实不这样想。   
    ChatGPT的泛起,比如用电灯点亮了一个街区。
      然而要建全国、寰球的电网,两头还有很长的路要走。
        ChatGPT的泛起,比如用电灯点亮了一个街区。   
    然而要建全国、寰球的电网,两头还有很长的路要走。   
    “很长的路”上,技术、资金、算力、算法、根底设施,搭建了一道难以攻破的壁垒。要持续前行,得凿开壁垒,开凿的斧头应是少量的技术钻研和翻新协作。  
    智源钻研院 就提供了这么一把斧头,它联结30多家产学研单位,开发了FlagOpen(飞智)大模型技术开源体系。这也是国际首个大模型开源体系。  


    黄铁军  
    黄铁军表现,但愿大家的关注点从AI“海立体以上”冰山一角的大模型,回归到“海立体下列”的AI技术生态的整个,尤为是技术体系上。  
    桂林一枝,不如升高AI的运用门坎   
    2022年的云栖大会上,阿里推出了AI大模型开源社区 “魔搭”Model Scope,推出伊始,达摩院就向社区奉献了300余个AI模型,片面开源凋谢。   
    FlagOpen是不是象征着又一个魔搭的降生?智源钻研院副院长兼总工程师林咏华解释了两者的不同。  
         “魔搭有点像抱抱脸 (HuggingFace)”林咏华谈道,“FlagOpen和魔搭纷歧样之处是,咱们的次要指标不是构建一个会萃得多人的繁荣社区,而是推进大模型技术的开展。”   
    基于这个指标,FlagOpen配套了 六个模块,分别是FlagAI、FlagPerf、FlagEval、FlagData、FlagStudio和FlagBoot。   


    FlagAI   
    FlageAI集成为了得多主流大模型算法技术,以及多种大模型并行处置和训练减速技术,并反对微调。目前涵盖的模型包罗NLP、CV与多模态等畛域,如言语大模型OPT、T5,视觉大模型ViT、Swin Transformer,多模态大模型CLIP等。目前,FlagAI 曾经参加Linux基金会。   
    “悟道2.0”通用言语大模型GLM,“悟道3.0”视觉与训练大模型EVA,视觉通用多工作模型Painter,文生图大模型AltDiffusion (多言语),文图表征预训练大模型 (多言语)等智源钻研院“悟道”大模型名目多个效果也开源在FlagAI。   
    FlagPerf   
    AI软硬件评测面临异构水平高、兼容性差、运用场景繁杂多变的应战。FlagPerf搭建的AI硬件评测体系,反对多种深度学习框架,及时跟进最新主流模型评测需要,便于AI芯片厂商拔出曾经底层撑持工具,且不以排名为中心指标  
    截至FlagOpen体系公布,FlagPerf已和天数智芯、百度PaddlePaddle、昆仑芯科技、中国挪动等进行协作。  
    FlagEval   
    FlagEval是掩盖多个模态畛域、包孕评测维度的评测工具,首先凋谢的是近期很火的 多模态畛域-CLIP系列模型评测工具,反对多言语多工作、开箱即用。   
    FlagData   
    FlagData数据工具开源名目集成包孕荡涤、标注、紧缩、统计剖析等功用在内的多个数据处置工具与算法。此前,智源钻研院曾经构建了WuDaoCorpora语料库。  
    FlagStudio   
    FlagStudio是文生图、文生音乐等艺术创作相干的开源名目聚拢,聚拢的算法和模型更贴合中文场景,以后次要提供智源钻研院 文生图相干才能的运用。   
    FlagBoot   
    FlagBoot是基于Scala开发的轻量级高并发微办事框架,默许彻底异步,且没有宏、隐式转换等艰涩难懂的代码。极少的代码量便于开发者等闲理解面前逻辑,然后进行自定义修正。  
    “大数据+大算力+强算法=大模型”是以后AI开展的主流,用FlagOpen,开发者尤为是初创公司,能够尝试大模型的开发和钻研任务,换句话说,AI的研发、运用门坎被升高了。   
    以大模型为主导的标的目的提供根底开源体系,某种意义上,智源钻研院在追逐ChatGPT产品的热点上退了一步。这也许是其 非营利性机构的性质使然。   
    而ChatGPT面前的OpenAI,也是打着非营利性机构的旗帜出道的 (2019年3月1日,OpenAI LP子公司成立,旨在营利)。一样的机构性质,一样押注AI,并关注大模型赛道,   


    智源钻研院有打算,或者可能成为中国的OpenAI吗?  
    ChatGPT逐日调动后盾参数的本钱曾经是天文数字。假如要在中国打造一个OpenAI, 需求多少本钱打底?  
    “智源要不要做一个OpenAI,很难简略做比较。”黄铁军回答这个问题时说道,DeepMind、OpenAI和智源钻研院是同类机构,但不克不及简略同等。寻求AI前沿,做凋谢钻研是三家机构的共识;没有少量投资就没有那末多人做少量探究,三个机构也都有各自的社会资源投入方法,好比微软刚追投了OpenAI100亿美元。  
    但黄铁军同时表白了本人的不解,那就是: 中国版的OpenAI怎么定义?  
    “某种意义上, 这就是很不分明的问题。”   
    我没有批判的意思。然而有人站出来讲要做中国的OpenAI,他究竟是甚么意思?是想和OpenAI同样有100倍的盈利吗?更多的仍是要问想做中国OpenAI机构阿谁人,他眼中的定义是甚么。
        我没有批判的意思。然而有人站出来讲要做中国的OpenAI,他究竟是甚么意思?是想和OpenAI同样有100倍的盈利吗?更多的仍是要问想做中国OpenAI机构阿谁人,他眼中的定义是甚么。  
    至于做出OpenAI的须要本钱投入,黄铁军给出的谜底是 “很难估量”,并表现,投资不是他自己也不是智源钻研院关怀的问题。   
    开源的打不外关闭的?   
    PC时期,Linux打破Wintel同盟的垄断;在iOS的关闭生态和Android的准关闭生态下,开源的RISC-V异军崛起。开源象征着凋谢,象征着多家机构同时保护带来的危险升高和问题增加。  
    FlagOpen是国际首个大模型开源体系,智源钻研院拿出了这样的态度:  
    大模型时期,需求这样的开源。智能时期需求真开源,就像Linux、RISC-V和2022年彻底转入开源社区的PyTorch。
        大模型时期,需求这样的开源。智能时期需求真开源,就像Linux、RISC-V和2022年彻底转入开源社区的PyTorch。  
    聊到此处,林咏华表现更违心把FlagOpen 类比为大模型畛域的Linux。   


    但有一种说法广为流传,即开源虽好,能让失掉更好的迭代和更新,但 开源的打不外关闭的。   
    对这个问题,黄铁军做出了回应。他称Linux的胜利,不是由于把其它操作零碎都打败了,而是在全部市场竞争中占领了次要份额。  
    开源凋谢应该是一个大趋向,大部份状况下,以开源方式或以开源方式为根底的产品会占领较大的份额。
      与此同时,在某一特定标的目的上,有一个闭源产品做得更好其实不奇怪。这不等于谁打败了谁,而是大家在知足用户需要时做出了不同选择。
        开源凋谢应该是一个大趋向,大部份状况下,以开源方式或以开源方式为根底的产品会占领较大的份额。  
    与此同时,在某一特定标的目的上,有一个闭源产品做得更好其实不奇怪。这不等于谁打败了谁,而是大家在知足用户需要时做出了不同选择。   
    开源是FlagOpen的选择,来一同看看这个选择现阶段的效果——  
    登陆GitHub能够看到FlagOpen体系里各个名目的标星, 星至多的是FlagAI,尚不外千,至少的标星量只要几十。此外还能够视察发现,开源体系中只波及推理方面,没有涵盖训练部份。   


    林咏华表现这是智源的战略,即不是等做到完善再开源,而是 把种子点做了之后就开源,以此便利各个企业之间 在 没有商业协作协定的状况下就可以相互协作。  
    选择当初发布FlagOpen开源体系的另外一个缘故,是当初大模型火上了天,有得多没有接触过大模型的初创团队也开始尝试本人训模型。  
    工欲善其事,必先利其器,“既然有这么多人想做这件事,咱们在这个时分开源出来,是想给予咱们的教训,让他们更为顺利往前走。”  
    —   
    「中国AIGC产业峰会」启动  
    邀您共襄盛举  
    「中国AIGC产业峰会」行将在往年3月举行,峰会将约请AIGC产业相干畛域的专家学者,独特讨论生成新世界的过来、当初和将来。   
    峰会上还将公布 《中国AIGC产业全景讲演暨AIGC 50》,片面平面描画我国以后AIGC产业的竞争力求谱。点击链接或下方图片查看大会详情:   
    寻觅中国版ChatGPT,量子位邀你独特参预中国AIGC产业峰会   
    点这里 ?关注我,记得标星哦~   
    一键三连「分享」、「点赞」和「在看」  
    科技前沿停顿日日相见 ~

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题25

    帖子26

    积分111

    图文推荐