华人澳洲中文论坛

热图推荐

    清华大模型人材遭哄抢!清点5大学术重镇10大产业玩家

    [复制链接]

    2023-2-24 21:50:11 15 0

    原标题:清华大模型人材遭哄抢!清点5大学术重镇10大产业玩家  
    衡宇 发自 凹非寺   
    量子位 | 大众号 QbitAI   
    做类ChatGPT产品,组中国版OpenaAI恐怕是先当下最最人尽皆知的创投野心。  
    有人官宣标榜放话,也有VC开始把视角投向产学研转换的大模型名目——也许能更有根底一些,其中, 清华大学显然处于身负众望的头一梯队。   
    量子位独家得悉,背靠清华的大模型钻研团队,计算机系传授 唐杰牵头的守业公司 智谱AI,身价水长船高,在几近哄抢的形态中接近实现一轮新融资,估值已超 30亿元。   
    唐杰的先生一样有市无价。其麾下出名弟子 杨植麟的NLP守业公司 循环智能,也被寄与厚望,所有往大模型标的目的走,国际最头部的VC,孵化式提供反对。   
    唐杰师徒,清华NLP气力冰山一角   
    唐杰,清华计算机系传授。他刚刚入选2023 AAAI Fellow,也是ACM/IEEE Fellow。钻研标的目的包罗人工智能、数据挖掘、社交网络、机器学习和常识图谱等,曾获ACM SIGKDD Test-of-Time Award (十年最好论文)。   


         唐杰   
    这次风闻中被多家VC哄抢的智谱AI,在2019年由他和同为清华传授的 李涓子创建,由清华大学计算机系常识工程试验室的技术效果转化而来。   
    经唐杰手的大模型,都是这几年里大家的“老敌人”:超大范围预训练大模型 “悟道”(悟道2.0参数范围达到1.75万亿);2021年与阿里达摩院联结公布的中文多模态预训练大模型 M6;曾经开源的中英文预训练言语大模型*GLM-130B。   
    相反参数范围下,M6训练能耗仅是GPT-3的1%;ChatgGPT需求8张A100能力跑起来,而GLM-130B仅用4张3090就可以驱动。在大模型赛道上的既有产品和机能实绩,让唐杰团队被VC追赶、哄抢屡见不鲜。  
    VC手中的金橄榄枝,还抛给了唐杰的自得门生杨植麟。  
    杨植麟是谁?以年级第一的成就从清华本科结业后,他在NLP钻研寰球排名第一的卡内基梅隆大学言语技术钻研所 (LTI)就读,师从苹果AI钻研担任人Ruslan Salakhutdinov和谷歌首席迷信家William Cohen,4年即拿下博士学位。   


    杨植麟   
    博士期间,杨植麟和图灵奖得主Yoshua Bengio协作公布数据集HotpotQA,又前后以一作身份颁发效果 Transformer-XLXLNet——这两篇分别是ACL 2019和NeurIPS 2019最高引论文之一。当初,他的谷歌学术援用次数冲破16000次。   
    这位90后守业者不只学术履历优秀,在产业界的表示也可圈可点。  
    2016年,杨植麟创建循环智能,公司次要业务是应用NLP、语音、多模态、大模型等人工智能技术打造“销售科技”计划。与此同时,智谱AI和清华钻研团队的多个AI名目由他主导,华为的 “盘古”大模型也是杨植麟团队和华为云联结推出的。   
    ChatGPT引爆狂潮,唐杨师徒二人成为了VC眼中的香饽饽,但清华大模型NLP标的目的上的人材贫矿不止他二人。  
    孙茂松、刘知远团队算其中一股中坚气力,两人都来自清华天然言语处置与社会人文计算试验室 (THUNLP)。THUNLP成立于上世纪70年代的试验室,牵头人是国际NLP钻研畛域的泰斗黄昌宁,孙茂松是黄的先生,刘知远则是孙的先生。   


    孙茂松   
    2021年底,孙茂松团队公布了机器中文言语才能评测基准“智源指数” (CUGE),以评测和推进中文NLP的开展。其余效果未几赘述,但此处不能不提的有三个。一个是AI写诗模型 “九歌”,训练过程当中学习了80万首中国新诗;另外一个是言语表征模型 ERNIE(和百度文心大模型同名),可与过后工作最优的BERT媲美;还有以中文为中心的预训练大模型 清源CPM,这是智源“悟道·文源”的前身。   
    另外一支大名鼎鼎的清华系NLP队伍,是交互式人工智能 (CoAI)课题组传授 朱小燕和其先生黄民烈团队,他们前后提出过 SentiLAREStoryGPT等预训练模型。   
    黄民烈自己不只参预了“悟道”大模型的开发,还基于大模型和对话零碎的学术配景,在前年兴办努力于打造“超拟人大模型”的聆心智能。去年十二月,聆心智能推出首个产品AI乌托邦,用户可经过其与定制AI角色对话;在去年年底实现数千万元天使+轮融资后(投资方包罗智谱AI),不到一周前,聆心智能又宣告实现Pre-A轮融资。  


    黄民烈   
    至于不久前从京东离任,回归学术界负责清华电子工程系传授的 周伯文(旗下还有一家公司衔远科技),也在NLP、人机对话打磨了多年的钻研和业界教训。   
    国际大模型气力百花怒放:5大学术重镇,10大产业巨头   
    清华不是这轮浪潮中独一的宠儿。跟着AIGC和类ChatGPT产品相干话题日趋低落的热度,国际大模型人材市场好不热烈。  
    为此,量子位梳理了百花怒放的国际产学研界大模型重镇,代表性机构和代表性人物,总计 5支学术界团队和10大产业界气力,排名不分前后。固然极有可能挂一漏万,欢送在评论区中增补。   
    首先是5支学术界团队:  
    01:复旦邱锡鹏传授团队   
    不鸣则已,复旦大学传授 邱锡鹏率领的NLP团队没有涓滴预报,猛然在中国激发类ChatGPT产品第一朵浪花。   
    产品称号MOSS,致敬《漂泊地球2》里具有自我认识的AI,参数量比ChatGPT小了一个数量级,在训练形式上,间接选择和其余AI模型进行对话。MOSS行将面向大众进行内测,还要在3月再接再励开源代码。  


    据地下材料,邱锡鹏是复旦大学理学学士和博士,钻研标的目的为中文NLP、开源NLP零碎、可托NLP技术、对话零碎等,共颁发CCF-A/B类论文70余篇,并掌管开发了开源NLP工具FudanNLP 、FastNLP。他与中国计算机学会天然言语处置专委会副主任、传授 黄萱菁都来自复旦大学NLP试验室,二人均在复旦大学取得学士和博士学位。   
    黄萱菁的钻研畛域为NLP、文本检索、云计算,复旦博士结业后留校任教。2008年先后,她以拜候学者身份返回MIT,当初是复旦大学AI、NLP学科标的目的带头人。曾入选入选“人工智能寰球女性”“AI 2000人工智能寰球最具影响力提名学者”及“福布斯中国2020科技女性榜”。  
    02:哈尔滨工业大学智能技术与NLP钻研室   
    哈工大智能技术与天然言语处置钻研室 (ITNLP Lab)自上世纪80年代初,就开始从事NLP钻研,代表性效果是提出了汉字语句输出的思想,并完成了国际外第一个语句级汉字键盘输出零碎。周明、王海峰、张民、荀恩东都出自哈工大NLP一脉。   
    传授 王晓龙是试验室担任人。王晓龙硕士期间就读于天津大学,并在哈工大拿到计算机运用博士学位,名为insun的拼音输出法就是他的钻研效果。试验室老师还包罗博士刘秉权、博士刘远超 、博士孙承杰等传授。   
    刘秉权,本硕博均就读于哈工大计算机专业,现为智能技术与天然言语处置钻研室副主任,中国计算机学会初级会员、CCF中文信息技术专委会委员,作为次要研制人加入了“微软拼音输出法” (与微软协作)和“手机操作零碎汉字智能输出” (与日本富士通协作)名目。   
    刘远超次要钻研兴致在智能信息处置、天然言语处置与了解、数据挖掘等畛域,屡次负责ACL、EMNLP、COLING、NIPS等CCF人工智能顶级会议及等学术刊物的审稿专家。   
    孙承杰在哈工大前后取得硕博钻研生学位后,2009年起在留校任教,次要钻研标的目的为NLP、信息抽取、信息保举、文本挖掘和机器学习,承当和加入多项国度天然迷信基金名目和国度“863”名目。   
    03:清华AIR   
    清华AIR,全称清华大学智能产业钻研院,于2020年由多媒体及AI畛域的世界级迷信家 张亚勤创立,张亚勤自己现负责清华AIR院长,同时也是清华大学智能迷信讲席传授,中国工程院院士。   
    张亚勤本硕结业于中国迷信技术大学,在华盛顿大学取得博士学位,后被选美国艺术与迷信院院士,澳州国度工程院院士,IEEE院士。他曾在微软公司任务16年,1999年和李开复博士等独特创建微软中国钻研院 (微软亚洲钻研院前身)并负责第二任院长。又于2014年9月加盟百度公司负责总裁。   


    张亚勤   
    清华AIR还会萃了 刘洋马维英聂再清刘菁菁等NLP标的目的的AI大牛。   
    刘洋是AIR履行院长,次要钻研标的目的是NLP。武汉大学本科结业后,刘洋在中国迷信院计算技术钻研所获博士学位,曾负责ACL亚太分会开创执委兼秘书长、Computational Linguistics编委。2010年,他在NLP顶会计算言语学上颁发国际第一篇长文,并在ACL上成为国际第一个做tutorial学者。   
    马维英,IEEE Fellow,博士结业于美国加州大学圣芭芭拉分校,AIR惠妍讲席传授、首席迷信家,他的钻研标的目的包罗人工智能的几个中心畛域,如大数据挖掘、ML、天然言语了解与生成、CV等。他具有160多项技术专利,此前曾任微软亚洲钻研院常务副院长、字节跳动副总裁兼AI Lab主任。   
    另外一位AIR首席钻研员 聂再清本硕结业于清华大学计算机迷信与技术系,博士时代在美国亚利桑那州立大学师从美国人工智能学会前主席Subbarao Kambhampati。2004年起,在微软亚洲钻研院历任副钻研员/主管/初级钻研员、首席钻研员;2017年至2020年,在阿里负责天猫精灵首席迷信家、达摩院AI Labs北京研发核心担任人。   
    刘菁菁一样是AIR首席钻研员,具有MIT计算机迷信博士、剑桥大学MBA学位,曾任美国微软资深首席钻研部门经理,率领科研团队在视觉加言语多模态机器学习,天然言语处置等人工智能畛域发展迷信钻研。   


    04:西湖大学NLP试验室   
    西湖大学NLP试验室团队中心成员有博士 张岳蓝振忠等人。   
    张岳本科结业于清华大学计算机专业,硕士、博士期间均就读于牛津大学,2010年3月-20十二年6月在剑桥大学计算机迷信专业从事博士后钻研,现为西湖大学长聘副传授,受邀编写了剑桥大学的NLP教材。按照统计,20十二年-2020年期间,张岳在NLP畛域的顶会颁发数量是 寰球第三。   


    张岳NLP课程可在B站观看   
    蓝振忠是中山东大学学校友,博士结业于卡内基梅隆大学 (CMU)计算机学院,屡次负责ACM Multimedia, CVPR, ECCV, ICCV 等国内顶会的论文评审专家。参加西湖大学前,他在谷歌AI任务;加盟西湖大学后,蓝振忠组建了一支30多人的团队,正在尝试整合多种AI技术,构建虚构心思征询师。   
    05:IDEA钻研院   
    IDEA钻研院,全称粤港澳大湾区数字经济钻研院,创建人 沈向洋。沈向洋是视频检索畛域的创始者,也是ACM和IEEE院士。他博士结业于卡内基梅隆大学,是图灵奖得主Raj Reddy的先生,与李开复、洪小文同门参预创立微软亚洲钻研院 (MSRA),曾负责微软公司寰球履行副总裁。   
    IDEA钻研院下大模型担任人 张家兴一样出身MSRA。在获取北大博士学位后,张家兴前后就职于百度、微软、阿里巴巴,曾任微软亚洲钻研院钻研员、360数科首席迷信家,2021年6月参加IDEA。去年,张家兴率领团队推出了国际第一个以中文为主的AI绘画模型 “太乙”,被称为中文版Stable Diffusio。据透露,“太乙”训练数据量超过了1亿中文图文对。   


    太乙按照提醒次“小桥流水人家,水彩”生成的画作   
    接上去聊聊10家极具代表性的产业界气力:  
    01:百度   
    提起百度的NLP技术,最被人熟知的是文心大模型。百度日前曾经官宣要在3月把 “文心·一言”(ERNIE Bot)向大众凋谢,它就是基于文心大模型技术推出的生成式对话产品。   


    2022年,DALLE-2、Stable Diffusion引领的AI绘画狂潮中,百度趁势推出同以文心大模型为底座的AI艺术和创意辅佐平台 “文心 · 一格”。   
    百度这方面坐镇和带队的,天然是NLP畛域华人第一人—— 王海峰。百度CTO王海峰结业于哈尔滨工业大学,博士学历,博士结业后王海峰参加微软亚洲钻研院,进行天然言语处置标的目的的钻研,之后历任isilk.com钻研迷信家,东芝(中国)钻研开发核心副所长兼钻研部部长等职位。2010年1月参加百度,从NLP运用开始打造了百度NLP中心团队。   
    中心团队成员之一有2006年浙大结业后参加,现任百度团体副总裁、深度学习技术及运用国度工程钻研核心副主任 吴甜,她总体担任百度AI技术平台和智能云AI产品,百度产业级深度学习开源凋谢平台飞桨恰是她担任。   
    吴华,中科院自动化钻研所博士结业,现任百度技术委员会主席,担任百度翻译名目。她曾负责天然言语处置畛域国内会议ACL 2014年的顺序委员会主席,是中国外乡企业首位ACL顺序委员会主席。   
    马艳军,山大、清华大学校友,博士结业于爱尔兰都柏林城市大学,百度深度学习技术平台初级总监。曾任《Machine Translation》杂志编委,并屡次负责顶级国内会议的 AreaChair等职务,颁发论文20余篇。小度机器人恰是马艳军基于深度问答技术在2013年孵化。   


    02:阿里达摩院   
    阿里达摩院机器智能技术试验室上司的言语技术试验室,是阿里巴巴担任NLP技术研发的中心团队。  
    现任言语技术试验室担任人 黄非,从ACM出色迷信家 司罗手中接太重担。参加达摩院以前,他在卡内基梅隆大学攻读博士,之后NLP钻研任务在IBM Watson和Facebook发展,在NLP和AI的顶会及期刊上颁发文章40多篇;另外一位团队担任人 邴立东和司罗、黄非同为卡内基梅隆大学校友,曾屡次负责ACL、EMNLP等会议的畛域主席。   
    前文提到的M6是阿里达摩院推出的大模型之一,一样为人所熟知的还有基于一致学习范式OFA等底层技术打造的 阿里通义大模型,之所认为“通义”,是因它具备搞定多种工作的“大一统”才能。   
    至于达摩院被曝要推出的类ChatGPT产品,就是在阿里通义大模型体系的根底上融会降级。  


    阿里内测中的达摩院版ChatGPT提前暴光 03:字节跳动   
    字节跳动AI Lab成立于2016年,旨在为字节跳动内容平台提供算法和技术反对,钻研畛域次要波及NLP、数据挖掘、ML、语音与音频等,推出的NLP相干产品无为字节跳动一切产品提供翻译办事的 Byte Translator,以及涉猎体育、金融、时势的旧事写作机器人 Xiaomingbot。   
    字节跳动AI Lab团队总监之一 李航,同时被选三大国内顶会 (ACL,IEEE,ACM)Fellow。他师出日本,硕士结业于日本京都大学电气工程系,后在东京大学取得计算机迷信博士学位,次要钻研标的目的包罗信息检索、NLP等,曾在微软、华为前后任职。   


    本月初,字节跳动AI试验室被曝有发展类ChatGPT产品和AIGC相干研发。最新动静爆料, 字节跳动正在规划大模型,在言语和图象两种模态上发力。其中,言语大模型团队由字节搜寻部门领导,目前范围在十数人摆布;图片大模型团队由智能创作团队牵头。   
    04:小冰   
    2020年,小冰公司从微软总部拆分,独立经营。其具有的小冰框架以NLP为根底,是目前是寰球承载交互量最大的齐备AI框架之一。  
    本周,小冰公司的 “小冰链”凋谢了小规模公测,不同于ChatGPT,小冰链将其思考进程残缺、通明地呈当初用户背后,并且还能通过思考实行 (某种)行为。   


    小冰链的文字写作才能   
    公司CEO 李笛结业于清华大学,前微软(亚洲)互联网工程院副院长,微软时代创建了微软AI情感计算框架,当初他领导寰球团队,担任人工智能小冰框架零碎的技术研发、产品改造及商业落地   
    05:华为   
    2021年,华为云公布 “盘古”大模型,这是业界首个千亿参数中文言语预训练模型,预训练阶段学习了40TB中文文本数据,接近人类中文了解才能。   
    华为这方面的中心人物,当属国内欧亚迷信院院士、IEEE Fellow、华为云人工智能畛域首席迷信家 田奇。田奇本科结业于清华大学电子工程系,硕士结业于美国德雷塞尔大学,后赴美国伊利诺伊大学香槟分校学习获博士学位。田奇钻研标的目的本为CV,但近几年也转向NLP畛域。   


    田奇 06:腾讯   
    腾讯麾下有 “混元”AI大模型(HunYuan)。去年年底,腾讯HunYuan进一步推出国际首个低本钱、可落地的NLP万亿大模型,并再次登顶天然言语了解工作榜单CLUE。   
    HunYuan是业界首个可在工业界海量业务场景间接落地运用的万亿NLP大模型,最快用256张卡,1天内就可以训练实现,本钱间接降至原来的1/8。  


    混元AI大模型反对的对话运用案例   
    07:京东   
    本月初,京东云宣告,旗下 言犀人工智能运用平台将整合过往产业理论和技术积攒,推生产业版ChatGPT智强人机对话平台,预计参数量达千亿级。   


    08:科大讯飞   
    科大讯飞是国际NLP行业龙头。ChatGPT爆火后,科大讯飞在投资者互动平台表现,在ChatGPT次要波及的NLP相干技术和标的目的上,公司具备长时间深挚的积攒。  
    科大讯飞地下材料披露,2022年十二月,科大讯飞曾经进一步启动生成式预训练大模型工作攻关,类ChatGPT技术将在 往年5月落地公司AI学习机产品中。   


    现任科大讯飞AI钻研院副院长 刘权,博士结业于中国迷信技术大学电子工程与信息迷信系、语音及言语信息处置国度工程试验室,次要钻研畛域是NLP,2020年至2021年,刘权率领团队获取NLP畛域5个国内权威评测冠军,曾任国内知识常识推理会议Co妹妹onsense 2017学术委员会委员。   
    09:澜舟科技   
    澜舟科技开创人 周明是闻名世界的NLP专家,前后就读于重庆大学、哈尔滨工业大学和清华大学,并在清华大学负责过副传授。守业前,周明长时间在微软亚洲钻研院负责NLP组的担任人、微软亚研副院长。周明在NLP畛域颁发的文章数量居世界前列,20十二年至2020年期间,周明在NLP畛域顶会颁发的论文数量居寰球第一。   
    澜舟科技给予Transformer的“孟子”大模型,走轻量化线路,仅包孕10亿参数量,可处置多言语、多模态数据,同时反对多种文本了解和文本生成工作。  


    孟子大模型对图片内容的形容   
    上周,澜舟刚刚宣告与中文在线协作,要基于公用大模型开发一套预训练模型技术的文学创作辅佐算法。  
    10:浪潮信息   
    去年年中,浪潮信息推出了4个技巧大模型 (SkillModel),分别为对话模型“源晓问”、问答模型“源晓搜”、翻译模型“源晓译”、古文模型“源晓文”,它们4个都基于 “源1.0”大模型生成。“源1.0”是浪潮信息在2021年公布的巨量中文言语模型,参数量高达2457亿。   
    浪潮“源”生成的旧事文本   
    浪潮信息在互动平台表现,公司在AIGC已从算力、算法和运用三个方面进行规划和长时间研发投入。浪潮人工智能钻研院首席钻研员是 吴韶华,他同时负责浪潮信息AI软件研发总监。他率领的团队除了推出“源1.0”,还研发了深度学习框架Caffe-MPI、人工智能开发办事平台AI Station。   
    ChatGPT珠玉在前,复旦MOSS一声不吭的泛起,在国际掀起了更高一浪。  
    产学研三方都擦拳磨掌、蓄力待搏,在技术这块基石之上,可以垒起坚硬高墙的人材成了另外一个必争之地,能够说,伴有着类ChatGPT产品在国际的推动,对于大模型人材的抢夺和竞争游戏,才刚刚开始。  
    分割作者—   
    —   
    《中国AIGC产业全景讲演暨AIGC 50》调研启动  
    谁会是中国的“ChatGPT”?最有竞争力和后劲的AIGC气力位于何方?  
    量子位《中国AIGC产业全景报暨AIGC 50》正式启动对外征集,期待有更多优秀的机构、产品、案例与技术可以被公众看到。   
    点这里 ?关注我,记得标星哦~   
    一键三连「分享」、「点赞」和「在看」  
    科技前沿停顿日日相见 ~

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题28

    帖子34

    积分162

    图文推荐