|
原标题:DALL·E这波超进化,画质艺术感双飞升,还学会了无痕P图
鱼羊 发自 凹非寺
量子位 | 大众号 QbitAI
把椅子上的萌犬P成猫猫,需求几步?
第一步,圈出狗狗。第二步,告知AI你的需要。鼠标一点,齐活。
这位AI P图巨匠,实际上是位老敌人——OpenAI风行寰球的那位 DALL·E。
当初,它刚刚实现了“2.0超进化”。不只新学了一手入迷入化的P图绝技,创作品质也有了奔腾式的晋升。
话未几说,间接看做品感触一下~
这是DALL·E 2在“星云爆炸状柯基头”这一提醒下的创作出来的画作:
这幅萨尔瓦多·达利的画像,是否有点萨尔瓦多·达利内味儿了?
跟初代DALL·E比起来,着实是画质与艺术感双双飞升了。
△“日出时候安坐在原野里的狐狸,莫奈格调”
所以,钻研人员详细如何点亮了DALL·E的新技巧点?
CLIP+分散模型
DALL·E此番进化,简略来讲就是分辨率更高了,提早更低了。
另外,还有更新2大新功用:
首先,在更细粒度上完成文本→图象功用。
也就是说,DALL·E 2能够按照天然言语提醒进行P图。在P图的过程当中,还会斟酌暗影、反射、纹理等元素的变动。
好比在左图标“2”的地位P一个火烈鸟泳圈,DALL-E 2会把水面倒影这类细节也处置到位。
其次,是能够在保存原作中心元素的根底之上,赋与原作船新的格调。
而且生成画面的画质是DALL·E 1的 4倍,即从256×256晋升到了1024×1024。
详细的完成办法,用OpenAI民间的话来讲,就是结合了CLIP和分散模型两种技术的优点。
CLIP是原版DALL·E功用完成的根底,是一个担任给图象重排序的模型,其零样本学习才能曾经在各种视觉和言语工作上大放异彩。
而分散模型的特征在于,在就义多样性的条件下,能大大晋升生成图象的传神度。
因而,OpenAI的钻研人员设计了这样一种计划:
在这个名为 unCLIP的架构中,CLIP文本嵌入首先会被喂给自回归或分散先验,以发生一个图象嵌入。
然后,这个嵌入会被用来调理分散编码器,以生成终究的图象。
OpenAI解释称,DALL·E可以get图象和用于形容画面的文本之间的瓜葛。其图象的生成是在“分散”过程当中实现的,能够了解为是从“一堆点”登程,用愈来愈多的细节去把图象填充残缺。
钻研人员将DALL·E 2与DALL·E、GLIDE等模型进行了比较。
试验后果显示,DALL·E 2的图象生成品质与GLIDE至关,但DALL·E的生成后果更具多样性。
目前,DALL·E 2并未对大众凋谢,不外假如你感兴致,能够在线注册请求一发~
名目地址:
http://openai.com/dall-e-2/#demos
— 完—
「人工智能」、「智能汽车」微信社群邀你参加!
欢送关注人工智能、智能汽车的小火伴们参加咱们,与AI从业者交流、切磋,不错过最新行业开展&技术停顿。
ps.加好友请务必备注您的姓名-公司-职位哦~
点这里 ?关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿停顿日日相见~ |
|