华人澳洲中文论坛

热图推荐

    逼人去学挖掘机:朱俊彦团队新AI模型公布,设计圈看了心慌慌

    [复制链接]

    2023-2-21 07:14:55 23 0

    原标题:逼人去学挖掘机:朱俊彦团队新AI模型公布,设计圈看了心慌慌  
    明敏 发自 凹非寺   
    量子位 | 大众号 QbitAI   
    CV大佬 朱俊彦的新论文,让设计师们觉得危了。   
    事件是这样的:  
    量子位在微博上搬运了朱俊彦团队的新效果,一个能将 2D草图一键变为3D模型的新算法,却不测诱发设计圈盆友们的热闹转发探讨。   
    配文全是“沃日”、“???”……  


    简略来讲,这个模型能让十分粗拙的简笔划, 一键变为传神3D模型。   


    还反对实时编纂,不满意之处擦掉重画,立马生成一个新的:  


         要知道以前的“图转图”模型,根本都是停留在2D层面,这回间接变3D真是一个冲破。  
    也的确是出产力利器。  
    但没想到,是设计圈先感到了危机。有圈内博主就感觉又要被AI抢饭碗了,随后也有得多人跟转了这一条。  


    所以论文效果究竟说了啥?一同来看。  
    可从恣意角度实时编纂   
    当初有得多图-图的转换模型,但根本上都是2D-2D。  
    这是由于从2D到3D,在训练和测试过程当中都有很大应战。  
    训练方面,想要把2D输出图象和3D输入图象配对,需求宏大数据集,本钱会很高。  
    测试方面,为了失掉不同角度的3D模型,需求输出图象的多个视角,然而两者之间可能存在纷歧致的状况,致使生功效果欠好。  
    为理解决这些问题,朱俊彦团队提出了使用 3D神经场景表现(3D neural scene representations)的前提生成模型。   


    它只需求给定一个2D标签图(如语义联系图和勾线图),能为 每个3D点婚配标签、色彩和密度等。完成在渲染图象的同时,像素对齐标签图象。   


    经过构建一个交互式零碎,用户能在 任何视角修正标签图,并生成与之相对于的输入。   
    为了完成跨视图编纂,需求将额定的语音信息编码为3D的,而后经过图象重建和反抗损失(adversarial losses)的2D监视,来学习上述3D表现。  
    重建损失能够确保2D用户输出和相应的3D内容对齐,像素对齐前提辨别器( pixel-alignedconditional discriminator)也进一步促使外观和标签对应公道,并在新视角时也放弃像素对齐。  
    最初,办法还提出了跨视图统一性损失,强迫潜码在不同视点放弃统一。  


    和不同模型比较显示,pix2pix-3D能在放弃多视角统一的状况下,生成高品质后果。  
    融化试验后果一样显示,该办法的生成后果能更好和输出图象对齐。  


    不外钻研团队也提出了办法的一些局限性。  
    第一,目前它还只能针关于 单个对象;   
    第二,模型在训练过程当中,需求与每个训练图象关联相机姿势(camera pose),推理时不需求。假如能不依赖于相机姿势,能够进一步扩张模型的使用规模。  
    朱俊彦团队出品   
    该论文效果来自 朱俊彦团队。   


    朱俊彦,现任CMU计算机迷信学院助理传授,是AI畛域出名的青年学者。  
    2008年,朱俊彦进入清华大学计算机迷信系,学习计算机迷信专业。在同专业140人中,朱俊彦排名第2。  
    20十二年清华本科结业后,朱俊彦奔赴美国,在CMU和UC伯克利通过5年学习,获取了UC伯克利电气工程与计算机迷信系的博士学位,师从Alexei Efros。  
    其博士结业结业论文Learning to Generate Images,获取了计算机图形学顶会ACM SIGGRAPH 2018“ 出色博士论文奖”。   
    博士结业后,朱俊彦来到MIT计算机与人工智能试验室(CSAIL),成为一位博士后钻研员。2020年秋天,他回到已经的母校CMU(卡内基梅隆大学),负责助理传授一职。  
    曾提出CycleGAN、GauGAN等明星模型。  


      
    GauGAN反对涂鸦变景色画   


      
    vid2vid反对从语义图生成实在场景   
    论文一作为 Kangle Deng。他当初是卡耐基梅隆大学机器人学院的一位在读博士。   
    2020年从北大本科结业。他以第一作者身份颁发的论文,曾被CVPR 2022、ICLR 2021接纳。  


    论文地址:   
    http://arxiv.org/abs/2302.08509  
    —   
    《中国AIGC产业全景讲演暨AIGC 50》调研启动  
    谁会是中国的“ChatGPT”?最有竞争力和后劲的AIGC气力位于何方?  
    量子位《中国AIGC产业全景报暨AIGC 50》正式启动对外征集,期待有更多优秀的机构、产品、案例与技术可以被公众看到。   
    点这里 ?关注我,记得标星哦~   
    一键三连「分享」、「点赞」和「在看」  
    科技前沿停顿日日相见 ~

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题30

    帖子37

    积分176

    图文推荐