DALL·E这波超进化，画质艺术感双飞升，还学会了无痕P图

飘蓝谷

原标题：DALL·E这波超进化，画质艺术感双飞升，还学会了无痕P图
鱼羊发自凹非寺
量子位 | 大众号 QbitAI
把椅子上的萌犬P成猫猫，需求几步？
第一步，圈出狗狗。第二步，告知AI你的需要。鼠标一点，齐活。

这位AI P图巨匠，实际上是位老敌人——OpenAI风行寰球的那位 DALL·E。
当初，它刚刚实现了“2.0超进化”。不只新学了一手入迷入化的P图绝技，创作品质也有了奔腾式的晋升。
话未几说，间接看做品感触一下~
这是DALL·E 2在“星云爆炸状柯基头”这一提醒下的创作出来的画作：

这幅萨尔瓦多·达利的画像，是否有点萨尔瓦多·达利内味儿了？

跟初代DALL·E比起来，着实是画质与艺术感双双飞升了。

△“日出时候安坐在原野里的狐狸，莫奈格调”
所以，钻研人员详细如何点亮了DALL·E的新技巧点？
CLIP+分散模型
DALL·E此番进化，简略来讲就是分辨率更高了，提早更低了。
另外，还有更新2大新功用：
首先，在更细粒度上完成文本→图象功用。
也就是说，DALL·E 2能够按照天然言语提醒进行P图。在P图的过程当中，还会斟酌暗影、反射、纹理等元素的变动。
好比在左图标“2”的地位P一个火烈鸟泳圈，DALL-E 2会把水面倒影这类细节也处置到位。

其次，是能够在保存原作中心元素的根底之上，赋与原作船新的格调。
而且生成画面的画质是DALL·E 1的 4倍，即从256×256晋升到了1024×1024。

详细的完成办法，用OpenAI民间的话来讲，就是结合了CLIP和分散模型两种技术的优点。
CLIP是原版DALL·E功用完成的根底，是一个担任给图象重排序的模型，其零样本学习才能曾经在各种视觉和言语工作上大放异彩。
而分散模型的特征在于，在就义多样性的条件下，能大大晋升生成图象的传神度。
因而，OpenAI的钻研人员设计了这样一种计划：

在这个名为 unCLIP的架构中，CLIP文本嵌入首先会被喂给自回归或分散先验，以发生一个图象嵌入。
然后，这个嵌入会被用来调理分散编码器，以生成终究的图象。
OpenAI解释称，DALL·E可以get图象和用于形容画面的文本之间的瓜葛。其图象的生成是在“分散”过程当中实现的，能够了解为是从“一堆点”登程，用愈来愈多的细节去把图象填充残缺。

钻研人员将DALL·E 2与DALL·E、GLIDE等模型进行了比较。

试验后果显示，DALL·E 2的图象生成品质与GLIDE至关，但DALL·E的生成后果更具多样性。

目前，DALL·E 2并未对大众凋谢，不外假如你感兴致，能够在线注册请求一发~

名目地址：
http://openai.com/dall-e-2/#demos
— 完—
「人工智能」、「智能汽车」微信社群邀你参加！
欢送关注人工智能、智能汽车的小火伴们参加咱们，与AI从业者交流、切磋，不错过最新行业开展&技术停顿。
ps.加好友请务必备注您的姓名-公司-职位哦~
点这里 ?关注我，记得标星哦～
一键三连「分享」、「点赞」和「在看」
科技前沿停顿日日相见~

华人澳洲中文论坛

热图推荐

DALL·E这波超进化，画质艺术感双飞升，还学会了无痕P图

发表回复

浏览过的版块

飘蓝谷
关注TA

图文推荐

华人澳洲中文论坛

热图推荐

DALL·E这波超进化，画质艺术感双飞升，还学会了无痕P图

发表回复

浏览过的版块

飘蓝谷 关注TA

图文推荐

飘蓝谷
关注TA