清华大模型人材遭哄抢！清点5大学术重镇10大产业玩家

武汉夜未眠

原标题：清华大模型人材遭哄抢！清点5大学术重镇10大产业玩家
衡宇发自凹非寺
量子位 | 大众号 QbitAI
做类ChatGPT产品，组中国版OpenaAI恐怕是先当下最最人尽皆知的创投野心。
有人官宣标榜放话，也有VC开始把视角投向产学研转换的大模型名目——也许能更有根底一些，其中， 清华大学显然处于身负众望的头一梯队。
量子位独家得悉，背靠清华的大模型钻研团队，计算机系传授唐杰牵头的守业公司 智谱AI，身价水长船高，在几近哄抢的形态中接近实现一轮新融资，估值已超 30亿元。
唐杰的先生一样有市无价。其麾下出名弟子 杨植麟的NLP守业公司 循环智能，也被寄与厚望，所有往大模型标的目的走，国际最头部的VC，孵化式提供反对。
唐杰师徒，清华NLP气力冰山一角
唐杰，清华计算机系传授。他刚刚入选2023 AAAI Fellow，也是ACM/IEEE Fellow。钻研标的目的包罗人工智能、数据挖掘、社交网络、机器学习和常识图谱等，曾获ACM SIGKDD Test-of-Time Award （十年最好论文）。

   △唐杰
这次风闻中被多家VC哄抢的智谱AI，在2019年由他和同为清华传授的 李涓子创建，由清华大学计算机系常识工程试验室的技术效果转化而来。
经唐杰手的大模型，都是这几年里大家的“老敌人”：超大范围预训练大模型 “悟道”（悟道2.0参数范围达到1.75万亿）；2021年与阿里达摩院联结公布的中文多模态预训练大模型 M6；曾经开源的中英文预训练言语大模型*GLM-130B。
相反参数范围下，M6训练能耗仅是GPT-3的1%；ChatgGPT需求8张A100能力跑起来，而GLM-130B仅用4张3090就可以驱动。在大模型赛道上的既有产品和机能实绩，让唐杰团队被VC追赶、哄抢屡见不鲜。
VC手中的金橄榄枝，还抛给了唐杰的自得门生杨植麟。
杨植麟是谁？以年级第一的成就从清华本科结业后，他在NLP钻研寰球排名第一的卡内基梅隆大学言语技术钻研所（LTI）就读，师从苹果AI钻研担任人Ruslan Salakhutdinov和谷歌首席迷信家William Cohen，4年即拿下博士学位。

△杨植麟
博士期间，杨植麟和图灵奖得主Yoshua Bengio协作公布数据集HotpotQA，又前后以一作身份颁发效果 Transformer-XL和 XLNet——这两篇分别是ACL 2019和NeurIPS 2019最高引论文之一。当初，他的谷歌学术援用次数冲破16000次。
这位90后守业者不只学术履历优秀，在产业界的表示也可圈可点。
2016年，杨植麟创建循环智能，公司次要业务是应用NLP、语音、多模态、大模型等人工智能技术打造“销售科技”计划。与此同时，智谱AI和清华钻研团队的多个AI名目由他主导，华为的 “盘古”大模型也是杨植麟团队和华为云联结推出的。
ChatGPT引爆狂潮，唐杨师徒二人成为了VC眼中的香饽饽，但清华大模型NLP标的目的上的人材贫矿不止他二人。
孙茂松、刘知远团队算其中一股中坚气力，两人都来自清华天然言语处置与社会人文计算试验室（THUNLP）。THUNLP成立于上世纪70年代的试验室，牵头人是国际NLP钻研畛域的泰斗黄昌宁，孙茂松是黄的先生，刘知远则是孙的先生。

△孙茂松
2021年底，孙茂松团队公布了机器中文言语才能评测基准“智源指数” （CUGE），以评测和推进中文NLP的开展。其余效果未几赘述，但此处不能不提的有三个。一个是AI写诗模型 “九歌”，训练过程当中学习了80万首中国新诗；另外一个是言语表征模型 ERNIE（和百度文心大模型同名），可与过后工作最优的BERT媲美；还有以中文为中心的预训练大模型 清源CPM，这是智源“悟道·文源”的前身。
另外一支大名鼎鼎的清华系NLP队伍，是交互式人工智能（CoAI）课题组传授 朱小燕和其先生黄民烈团队，他们前后提出过 SentiLARE、 StoryGPT等预训练模型。
黄民烈自己不只参预了“悟道”大模型的开发，还基于大模型和对话零碎的学术配景，在前年兴办努力于打造“超拟人大模型”的聆心智能。去年十二月，聆心智能推出首个产品AI乌托邦，用户可经过其与定制AI角色对话；在去年年底实现数千万元天使+轮融资后（投资方包罗智谱AI），不到一周前，聆心智能又宣告实现Pre-A轮融资。

△黄民烈
至于不久前从京东离任，回归学术界负责清华电子工程系传授的 周伯文（旗下还有一家公司衔远科技），也在NLP、人机对话打磨了多年的钻研和业界教训。
国际大模型气力百花怒放：5大学术重镇，10大产业巨头
清华不是这轮浪潮中独一的宠儿。跟着AIGC和类ChatGPT产品相干话题日趋低落的热度，国际大模型人材市场好不热烈。
为此，量子位梳理了百花怒放的国际产学研界大模型重镇，代表性机构和代表性人物，总计 5支学术界团队和10大产业界气力，排名不分前后。固然极有可能挂一漏万，欢送在评论区中增补。
首先是5支学术界团队：
01：复旦邱锡鹏传授团队
不鸣则已，复旦大学传授 邱锡鹏率领的NLP团队没有涓滴预报，猛然在中国激发类ChatGPT产品第一朵浪花。
产品称号MOSS，致敬《漂泊地球2》里具有自我认识的AI，参数量比ChatGPT小了一个数量级，在训练形式上，间接选择和其余AI模型进行对话。MOSS行将面向大众进行内测，还要在3月再接再励开源代码。

据地下材料，邱锡鹏是复旦大学理学学士和博士，钻研标的目的为中文NLP、开源NLP零碎、可托NLP技术、对话零碎等，共颁发CCF-A/B类论文70余篇，并掌管开发了开源NLP工具FudanNLP 、FastNLP。他与中国计算机学会天然言语处置专委会副主任、传授 黄萱菁都来自复旦大学NLP试验室，二人均在复旦大学取得学士和博士学位。
黄萱菁的钻研畛域为NLP、文本检索、云计算，复旦博士结业后留校任教。2008年先后，她以拜候学者身份返回MIT，当初是复旦大学AI、NLP学科标的目的带头人。曾入选入选“人工智能寰球女性”“AI 2000人工智能寰球最具影响力提名学者”及“福布斯中国2020科技女性榜”。
02：哈尔滨工业大学智能技术与NLP钻研室
哈工大智能技术与天然言语处置钻研室（ITNLP Lab）自上世纪80年代初，就开始从事NLP钻研，代表性效果是提出了汉字语句输出的思想，并完成了国际外第一个语句级汉字键盘输出零碎。周明、王海峰、张民、荀恩东都出自哈工大NLP一脉。
传授 王晓龙是试验室担任人。王晓龙硕士期间就读于天津大学，并在哈工大拿到计算机运用博士学位，名为insun的拼音输出法就是他的钻研效果。试验室老师还包罗博士刘秉权、博士刘远超、博士孙承杰等传授。
刘秉权，本硕博均就读于哈工大计算机专业，现为智能技术与天然言语处置钻研室副主任，中国计算机学会初级会员、CCF中文信息技术专委会委员，作为次要研制人加入了“微软拼音输出法” （与微软协作）和“手机操作零碎汉字智能输出” （与日本富士通协作）名目。
刘远超次要钻研兴致在智能信息处置、天然言语处置与了解、数据挖掘等畛域，屡次负责ACL、EMNLP、COLING、NIPS等CCF人工智能顶级会议及等学术刊物的审稿专家。
孙承杰在哈工大前后取得硕博钻研生学位后，2009年起在留校任教，次要钻研标的目的为NLP、信息抽取、信息保举、文本挖掘和机器学习，承当和加入多项国度天然迷信基金名目和国度“863”名目。
03：清华AIR
清华AIR，全称清华大学智能产业钻研院，于2020年由多媒体及AI畛域的世界级迷信家 张亚勤创立，张亚勤自己现负责清华AIR院长，同时也是清华大学智能迷信讲席传授，中国工程院院士。
张亚勤本硕结业于中国迷信技术大学，在华盛顿大学取得博士学位，后被选美国艺术与迷信院院士，澳州国度工程院院士，IEEE院士。他曾在微软公司任务16年，1999年和李开复博士等独特创建微软中国钻研院（微软亚洲钻研院前身）并负责第二任院长。又于2014年9月加盟百度公司负责总裁。

△张亚勤
清华AIR还会萃了刘洋、 马维英、 聂再清、 刘菁菁等NLP标的目的的AI大牛。
刘洋是AIR履行院长，次要钻研标的目的是NLP。武汉大学本科结业后，刘洋在中国迷信院计算技术钻研所获博士学位，曾负责ACL亚太分会开创执委兼秘书长、Computational Linguistics编委。2010年，他在NLP顶会计算言语学上颁发国际第一篇长文，并在ACL上成为国际第一个做tutorial学者。
马维英，IEEE Fellow，博士结业于美国加州大学圣芭芭拉分校，AIR惠妍讲席传授、首席迷信家，他的钻研标的目的包罗人工智能的几个中心畛域，如大数据挖掘、ML、天然言语了解与生成、CV等。他具有160多项技术专利，此前曾任微软亚洲钻研院常务副院长、字节跳动副总裁兼AI Lab主任。
另外一位AIR首席钻研员 聂再清本硕结业于清华大学计算机迷信与技术系，博士时代在美国亚利桑那州立大学师从美国人工智能学会前主席Subbarao Kambhampati。2004年起，在微软亚洲钻研院历任副钻研员/主管/初级钻研员、首席钻研员；2017年至2020年，在阿里负责天猫精灵首席迷信家、达摩院AI Labs北京研发核心担任人。
刘菁菁一样是AIR首席钻研员，具有MIT计算机迷信博士、剑桥大学MBA学位，曾任美国微软资深首席钻研部门经理，率领科研团队在视觉加言语多模态机器学习，天然言语处置等人工智能畛域发展迷信钻研。

04：西湖大学NLP试验室
西湖大学NLP试验室团队中心成员有博士张岳、 蓝振忠等人。
张岳本科结业于清华大学计算机专业，硕士、博士期间均就读于牛津大学，2010年3月-20十二年6月在剑桥大学计算机迷信专业从事博士后钻研，现为西湖大学长聘副传授，受邀编写了剑桥大学的NLP教材。按照统计，20十二年-2020年期间，张岳在NLP畛域的顶会颁发数量是 寰球第三。

△张岳NLP课程可在B站观看
蓝振忠是中山东大学学校友，博士结业于卡内基梅隆大学（CMU）计算机学院，屡次负责ACM Multimedia, CVPR, ECCV, ICCV 等国内顶会的论文评审专家。参加西湖大学前，他在谷歌AI任务；加盟西湖大学后，蓝振忠组建了一支30多人的团队，正在尝试整合多种AI技术，构建虚构心思征询师。
05：IDEA钻研院
IDEA钻研院，全称粤港澳大湾区数字经济钻研院，创建人 沈向洋。沈向洋是视频检索畛域的创始者，也是ACM和IEEE院士。他博士结业于卡内基梅隆大学，是图灵奖得主Raj Reddy的先生，与李开复、洪小文同门参预创立微软亚洲钻研院（MSRA），曾负责微软公司寰球履行副总裁。
IDEA钻研院下大模型担任人 张家兴一样出身MSRA。在获取北大博士学位后，张家兴前后就职于百度、微软、阿里巴巴，曾任微软亚洲钻研院钻研员、360数科首席迷信家，2021年6月参加IDEA。去年，张家兴率领团队推出了国际第一个以中文为主的AI绘画模型 “太乙”，被称为中文版Stable Diffusio。据透露，“太乙”训练数据量超过了1亿中文图文对。

△太乙按照提醒次“小桥流水人家，水彩”生成的画作
接上去聊聊10家极具代表性的产业界气力：
01：百度
提起百度的NLP技术，最被人熟知的是文心大模型。百度日前曾经官宣要在3月把 “文心·一言”（ERNIE Bot）向大众凋谢，它就是基于文心大模型技术推出的生成式对话产品。

2022年，DALLE-2、Stable Diffusion引领的AI绘画狂潮中，百度趁势推出同以文心大模型为底座的AI艺术和创意辅佐平台 “文心 · 一格”。
百度这方面坐镇和带队的，天然是NLP畛域华人第一人—— 王海峰。百度CTO王海峰结业于哈尔滨工业大学，博士学历，博士结业后王海峰参加微软亚洲钻研院，进行天然言语处置标的目的的钻研，之后历任isilk.com钻研迷信家，东芝（中国）钻研开发核心副所长兼钻研部部长等职位。2010年1月参加百度，从NLP运用开始打造了百度NLP中心团队。
中心团队成员之一有2006年浙大结业后参加，现任百度团体副总裁、深度学习技术及运用国度工程钻研核心副主任吴甜，她总体担任百度AI技术平台和智能云AI产品，百度产业级深度学习开源凋谢平台飞桨恰是她担任。
吴华，中科院自动化钻研所博士结业，现任百度技术委员会主席，担任百度翻译名目。她曾负责天然言语处置畛域国内会议ACL 2014年的顺序委员会主席，是中国外乡企业首位ACL顺序委员会主席。
马艳军，山大、清华大学校友，博士结业于爱尔兰都柏林城市大学，百度深度学习技术平台初级总监。曾任《Machine Translation》杂志编委，并屡次负责顶级国内会议的 AreaChair等职务，颁发论文20余篇。小度机器人恰是马艳军基于深度问答技术在2013年孵化。

02：阿里达摩院
阿里达摩院机器智能技术试验室上司的言语技术试验室，是阿里巴巴担任NLP技术研发的中心团队。
现任言语技术试验室担任人黄非，从ACM出色迷信家司罗手中接太重担。参加达摩院以前，他在卡内基梅隆大学攻读博士，之后NLP钻研任务在IBM Watson和Facebook发展，在NLP和AI的顶会及期刊上颁发文章40多篇；另外一位团队担任人 邴立东和司罗、黄非同为卡内基梅隆大学校友，曾屡次负责ACL、EMNLP等会议的畛域主席。
前文提到的M6是阿里达摩院推出的大模型之一，一样为人所熟知的还有基于一致学习范式OFA等底层技术打造的 阿里通义大模型，之所认为“通义”，是因它具备搞定多种工作的“大一统”才能。
至于达摩院被曝要推出的类ChatGPT产品，就是在阿里通义大模型体系的根底上融会降级。

△阿里内测中的达摩院版ChatGPT提前暴光 03：字节跳动
字节跳动AI Lab成立于2016年，旨在为字节跳动内容平台提供算法和技术反对，钻研畛域次要波及NLP、数据挖掘、ML、语音与音频等，推出的NLP相干产品无为字节跳动一切产品提供翻译办事的 Byte Translator，以及涉猎体育、金融、时势的旧事写作机器人 Xiaomingbot。
字节跳动AI Lab团队总监之一李航，同时被选三大国内顶会（ACL，IEEE，ACM）Fellow。他师出日本，硕士结业于日本京都大学电气工程系，后在东京大学取得计算机迷信博士学位，次要钻研标的目的包罗信息检索、NLP等，曾在微软、华为前后任职。

本月初，字节跳动AI试验室被曝有发展类ChatGPT产品和AIGC相干研发。最新动静爆料，字节跳动正在规划大模型，在言语和图象两种模态上发力。其中，言语大模型团队由字节搜寻部门领导，目前范围在十数人摆布；图片大模型团队由智能创作团队牵头。
04：小冰
2020年，小冰公司从微软总部拆分，独立经营。其具有的小冰框架以NLP为根底，是目前是寰球承载交互量最大的齐备AI框架之一。
本周，小冰公司的 “小冰链”凋谢了小规模公测，不同于ChatGPT，小冰链将其思考进程残缺、通明地呈当初用户背后，并且还能通过思考实行（某种）行为。

△小冰链的文字写作才能
公司CEO 李笛结业于清华大学，前微软（亚洲）互联网工程院副院长，微软时代创建了微软AI情感计算框架，当初他领导寰球团队，担任人工智能小冰框架零碎的技术研发、产品改造及商业落地
05：华为
2021年，华为云公布 “盘古”大模型，这是业界首个千亿参数中文言语预训练模型，预训练阶段学习了40TB中文文本数据，接近人类中文了解才能。
华为这方面的中心人物，当属国内欧亚迷信院院士、IEEE Fellow、华为云人工智能畛域首席迷信家田奇。田奇本科结业于清华大学电子工程系，硕士结业于美国德雷塞尔大学，后赴美国伊利诺伊大学香槟分校学习获博士学位。田奇钻研标的目的本为CV，但近几年也转向NLP畛域。

△田奇 06：腾讯
腾讯麾下有 “混元”AI大模型（HunYuan）。去年年底，腾讯HunYuan进一步推出国际首个低本钱、可落地的NLP万亿大模型，并再次登顶天然言语了解工作榜单CLUE。
HunYuan是业界首个可在工业界海量业务场景间接落地运用的万亿NLP大模型，最快用256张卡，1天内就可以训练实现，本钱间接降至原来的1/8。

△混元AI大模型反对的对话运用案例
07：京东
本月初，京东云宣告，旗下言犀人工智能运用平台将整合过往产业理论和技术积攒，推生产业版ChatGPT智强人机对话平台，预计参数量达千亿级。

08：科大讯飞
科大讯飞是国际NLP行业龙头。ChatGPT爆火后，科大讯飞在投资者互动平台表现，在ChatGPT次要波及的NLP相干技术和标的目的上，公司具备长时间深挚的积攒。
科大讯飞地下材料披露，2022年十二月，科大讯飞曾经进一步启动生成式预训练大模型工作攻关，类ChatGPT技术将在 往年5月落地公司AI学习机产品中。

现任科大讯飞AI钻研院副院长刘权，博士结业于中国迷信技术大学电子工程与信息迷信系、语音及言语信息处置国度工程试验室，次要钻研畛域是NLP，2020年至2021年，刘权率领团队获取NLP畛域5个国内权威评测冠军，曾任国内知识常识推理会议Co妹妹onsense 2017学术委员会委员。
09：澜舟科技
澜舟科技开创人周明是闻名世界的NLP专家，前后就读于重庆大学、哈尔滨工业大学和清华大学，并在清华大学负责过副传授。守业前，周明长时间在微软亚洲钻研院负责NLP组的担任人、微软亚研副院长。周明在NLP畛域颁发的文章数量居世界前列，20十二年至2020年期间，周明在NLP畛域顶会颁发的论文数量居寰球第一。
澜舟科技给予Transformer的“孟子”大模型，走轻量化线路，仅包孕10亿参数量，可处置多言语、多模态数据，同时反对多种文本了解和文本生成工作。

△孟子大模型对图片内容的形容
上周，澜舟刚刚宣告与中文在线协作，要基于公用大模型开发一套预训练模型技术的文学创作辅佐算法。
10：浪潮信息
去年年中，浪潮信息推出了4个技巧大模型（SkillModel），分别为对话模型“源晓问”、问答模型“源晓搜”、翻译模型“源晓译”、古文模型“源晓文”，它们4个都基于 “源1.0”大模型生成。“源1.0”是浪潮信息在2021年公布的巨量中文言语模型，参数量高达2457亿。
△浪潮“源”生成的旧事文本
浪潮信息在互动平台表现，公司在AIGC已从算力、算法和运用三个方面进行规划和长时间研发投入。浪潮人工智能钻研院首席钻研员是 吴韶华，他同时负责浪潮信息AI软件研发总监。他率领的团队除了推出“源1.0”，还研发了深度学习框架Caffe-MPI、人工智能开发办事平台AI Station。
ChatGPT珠玉在前，复旦MOSS一声不吭的泛起，在国际掀起了更高一浪。
产学研三方都擦拳磨掌、蓄力待搏，在技术这块基石之上，可以垒起坚硬高墙的人材成了另外一个必争之地，能够说，伴有着类ChatGPT产品在国际的推动，对于大模型人材的抢夺和竞争游戏，才刚刚开始。
— 分割作者—
— 完—
《中国AIGC产业全景讲演暨AIGC 50》调研启动
谁会是中国的“ChatGPT”？最有竞争力和后劲的AIGC气力位于何方？
量子位《中国AIGC产业全景报暨AIGC 50》正式启动对外征集，期待有更多优秀的机构、产品、案例与技术可以被公众看到。
点这里 ?关注我，记得标星哦～
一键三连「分享」、「点赞」和「在看」
科技前沿停顿日日相见 ~

华人澳洲中文论坛

热图推荐

清华大模型人材遭哄抢！清点5大学术重镇10大产业玩家

发表回复

浏览过的版块

武汉夜未眠
关注TA

图文推荐

华人澳洲中文论坛

热图推荐

清华大模型人材遭哄抢！清点5大学术重镇10大产业玩家

发表回复

浏览过的版块

武汉夜未眠 关注TA

图文推荐

武汉夜未眠
关注TA