华人澳洲中文论坛

热图推荐

    谷歌AI绘画4大牛携手守业,天使估值7个亿

    [复制链接]

    2023-3-4 07:19:13 20 0

    原标题:谷歌AI绘画4大牛携手守业,天使估值7个亿  
    衡宇 发自 凹非寺   
    量子位 | 大众号 QbitAI   
    比来的谷歌像个大漏勺,这不,又有AIGC中心成员联手跑路咯!  
    量子位独家得悉,这回跟谷歌say byebye的,是文生图中心团队——AI绘画模型 Imagen论文的四位中心作者,出奔目的是要搞本人的AI公司。虽然公司称号暂未对外发布,但新公司将一以贯之的线路是很分明的:   
    以Imagen为根底,沿着原来的名目做上来, 不只持续做文生图,还要做视频标的目的。   
    中心人材守业,天然少不了VC塞钱——曾经按 1亿美元的惊人天使估值实现了首轮融资,并且更多VC想给钱而赶不上、投不进。   


    这也算是文生图、文生视频、AIGC赛道上,最出名的钻研团队之一了。  
    文生图主干成员共创AIGC新公司   
         新公司联创四人,Chitwan Saharia、William Chan、Jonathan Ho以及Moha妹妹ad Norouzi,都出自谷歌。  
    他们以前精神重点放在AIGC的 文生图板块,是谷歌用来反抗DALLE-2的大杀器Imagen的论文独特作者,地位都挺首要的那种。   


    先来引见一下 Chitwan Saharia,也是Imagen的独特一作。   


    Chitwan本科结业于孟买理工学院计算机迷信与工程专业,在孟买理工学院和蒙特利尔大学都当进程序和算法方面的钻研助理。2019年参加谷歌,base多伦多,花了3年时间从二级软件工程师做到 初级钻研迷信家,去年十二月从谷歌到职。   
    第二位 William Chan,也是Imagen论文独特一作。他一样出身计算机工程,前后就读于加拿大滑铁卢大学、卡内基梅隆大学,两头在新加坡国立大学当过1年替换生。   


    在卡内基梅隆大学拿下博士学位后,William还在加拿大最大的社区学院之一乔治布朗学院,主攻烘焙和烹饪 (?),学了3年。   
    Willian从20十二年起参加谷歌,于2016年成为谷歌大脑的一分子,去年5月到职时,他曾经是谷歌大脑多伦多的钻研迷信家了。  
    而后要引见的是 Jonathan Ho,UC伯克利博士结业。   
    他不只是Imagen论文的core contribution,仍是 Diffusion Model奠基之作《Denoising Diffusion Probabilistic Models》 的一作。   


    博士结业于UC伯克利计算机迷信专业的Jonathan,以前在OpenAI当过1年的钻研迷信家,起初在2019年参加谷歌,共任务了2年零8个月,去年十一月以钻研迷信家的身份从谷歌到职。  
    新公司的最初一名联创叫 Moha妹妹ad Norouzi,也是Imagen论文的独特一作。   


      
    Moha妹妹ad Norouzi   
    他在多伦多大学计算机迷信博士就读期间,拿到了谷歌ML博士奖学金。结业后他参加谷歌大脑,在那儿任务了7年,在谷歌的最初title是初级钻研迷信家,任务重点是生成模型。  
    同时,Moha妹妹ad也是谷歌神经机器翻译团队的原始成员,SimCLR的联结创造人。他在GitHub主页上小小地透露了本人的比来静态:  
    目前,我在一家初创公司任务,公司使命是推动人工智能的开展程度,帮忙人类进步发明力。
      咱们正在招聘!
        目前,我在一家初创公司任务,公司使命是推动人工智能的开展程度,帮忙人类进步发明力。   
    咱们正在招聘!   
    这句话之外,对于新公司的更多信息,四人在任何社交平台都没有更具体的透露。  
    这曾经是谷歌比来漏出去的第n波人了。  
    就拿刚刚过来的2个月来讲,先是包罗顾世翔 (Shane Gu,‘让咱们一步一步地思考’钻研者)在内的 最少4名谷歌大脑成员参加OpenAI;情人节时,Hyung Won Chung和CoT最先的一作Jason Wei携手 组团潜逃OpenAI。   
    本周三, 您猜怎么着?嘿,又跑了一个:   


    OpenAI狂喜,只要谷歌大漏勺本勺受伤的世界降生了。  
    Imagen是甚么?   
    理解完谷歌漏走的这四集体,回头来讲说为他们职业生涯博得掌声的Imagen名目。  
    Imagen是谷歌公布的 文生图模型,公布时间在DALL-E 2陈腐出炉一个月当前。   
    本文结尾放的熊猫震惊心情包,就是朝Imagen输出“一只十分高兴的毛茸熊猫装扮成为了在厨房里做面团的厨师的高比较度画像,他身后的墙上还有一幅画了鲜花的画”后,得出的一张因素齐备的AI生成画作。  
    (欠好意思,请自行断句)  


    在Imagen泛起以前,文生图都共用一个套路,那就是CLIP担任从文本特点映照到图象特点,而后指点一个GAN或Diffusion Model生成图象。  
    Imagen不走寻常路, 开拓了text-to-image新范式:   
    纯言语模型只担任编码文本特点,详细text-to-image的任务,被Imagen丢给了图象生成模型。  
    详细来说,Imagen包孕一个解冻的言语模型T5-XXL (谷歌自家出品),当做文本编码器。T5-XXL的C4训练集包孕 800GB的纯文本语料,在文本了解才能上比CLIP强不少,由于后者只用无限图文对训练。   
    图象生成部份则用了一系列分散模型,学生成低分辨率图象,再逐级超采样。  


    依赖于新的采样技术,Imagen允许使用大的疏导权重,所以不会像原有任务同样使样实质量降落。这么一 来,图象拥有更高的保真度,而且能更好地实现图象-文本对齐。  
    概念说起来简略,但Imagen的成果仍是使人大为震撼的。  
    生成的狗子飙车技术一流:  


    比起爆火的DALLE-2,Imagen能更精确地舆解同时泛起两个色彩要求的状况:  


    一边绘画一边写字这类要求,Imagen同样成功实现,不只写得对,还能加光影魔术手般的烟花殊效 (不是)。   


    以及对起初钻研更有帮忙的是,谷歌经过Imagen的钻研,优化了分散模型。  
    首先,减少无分类器疏导 (classifier-free guidance)的权重能够改良图文对齐,同时却会侵害图象保真度。   
    为理解决这个bug,在每一个步采样时引入 静态阈值(dynamic thresholding)这个新的新的分散采样技术,来避免过饱和。   


    第二,使用高疏导权重的同时在低分辨率图象上减少噪声,能够 改良分散模型多样性缺乏的问题。   
    第三,对分散模型的经典构造U-Net做了改进,变为了 Efficient U-Net。后者改良了内存使用效力、收敛速度和推理时间。   
    起初在Imagen上微调,谷歌还推出了能“指哪打哪”版本的文生图模型 DreamBooth。只需上传3-5张 指定物体的照片,再用文字形容想要生成的配景、举措或心情,就可以让指定物体“闪现”到你想要的场景中。   
    好比酱婶儿的:  
    又或者酱婶儿的:  
    大略是Imagen成果太过杰出,劈柴哥起初亲身宣发的谷歌AI生成视频选手大将,就叫做“ Imagen Video”,能生成十二80*768分辨率、每秒24帧的视频片断。   
    啊,等等,谷歌有Imagen Vedio,这和四人的新公司不是撞标的目的了吗?  
    子细看了下论文,无论是Imagen仍是Imagen Video,各自都有大篇幅波及危险、社会影响力的内容。  
    出于平安、AI伦理和偏心性等方面斟酌,Imagen和Imagen Vedio都 没有间接开源或凋谢API,乃至连demo都没有。   


    哪怕市面上泛起开源复刻版本,也不是最正宗的滋味。  
    此前就曝出过在谷歌每一年的外部员工考察“Googlegeist”中,员工表现对 谷歌履行才能欠安的质疑。或许,这四人出奔,持续做Imagen,并做Imagen的视频版,说不定就是为了想把名目放到一个更凋谢的AI环境。   
    并且这类出奔守业,也是热钱大钱向AIGC汹涌的后果。  
    所以既然AIGC的创投热潮曾经在太平洋那头开启,那应该在太平洋这头也不会悄无声息。  
    也许你曾经据说了一些一样的大厂出奔守业,欢送爆料说说~~  
    分割作者—   
    —   
    「中国AIGC产业峰会」启动  
    邀您共襄盛举  
    「中国AIGC产业峰会」行将在往年3月举行,峰会将约请AIGC产业相干畛域的专家学者,独特讨论生成新世界的过来、当初和将来。   
    峰会上还将公布 《中国AIGC产业全景讲演暨AIGC 50》,片面平面描画我国以后AIGC产业的竞争力求谱。点击链接或下方图片查看大会详情:   
    寻觅中国版ChatGPT,量子位邀你独特参预中国AIGC产业峰会   
    点这里 ?关注我,记得标星哦~   
    一键三连「分享」、「点赞」和「在看」  
    科技前沿停顿日日相见 ~

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题29

    帖子38

    积分167

    图文推荐