华人澳洲中文论坛

热图推荐

    用了 TikTok 这个神器,我马上把 PS 卸载了

    [复制链接]

    2022-8-20 09:43:36 32 0



    图象变文字,这在明天曾经再也不是问题了。各式各样的 OCR 功用让你能够从图片中提取文字变得更为容易,一幅图让 AI 来解释也不是甚么大困难。
    但画图关于明天的 AI 来讲仍是有难度的,辨认图片提守信息关于 AI 来讲是处置信息。但作图就多了一层,不只要处置信息,还需求实现创作。前者是选择题,后者则是命题作文。
    只是选择题答得好之后,下一步就是要答好自在发扬的客观题。只是没人想到,第一个在自家 app 上答出这道题的是 TikTok。


    用 TikTok 生成 Facebook、马云
    比较 Google、OpenAI 这种在 AI 行业投入颇多、浸淫已久的巨头,TikTok 可能只是一个「插班生」。但插班生绕过巨头先做出了困难,这怎么不让人感到诧异?虽然插班生也使了一些巧劲,但最少做出来仍是很使人感慨。
    TikTok 做出来的文字转图片功用被叫作「AI 绿幕(AI Greenscreen)」,取代了原先单调的白底,由 AI 来为你生成视频的配景。这些视频的配景未必每一个个都能契合创作者的需要,但毕竟这是为你定制的、并世无双的绿幕配景,运气好的话也许和视频内容的主题也会更配。


    ▲ 发视频时点击殊效便可体验此功用. 图片来自硅星人
    咱们就用这个新功用做了一些测试,看看 TikTok 画出来的图究竟是怎么样的。在这些随机测试的词语中,有的画作呈现让人摸不着脑子,但也有的被评估为「很好地描画出了诡异感」。
    大受好评的就是输出「Facebook」呈现的画作,你模糊可以认出 Facebook 的蓝色图标,图片中单个的眼睛和一只耳朵营建了一种共同的惊悚感。结合一下 Facebook 近期的旧事,不能不说这幅画很好地描画出了 Facebook 这个词的觉得。


    图象描画精确的还有苹果、中国这样的词。前者可以轻松看出是一个苹果,后者也能看出中国风的修建,同时也防止了国旗这种在二创畛域较为敏感的图案。只是你要想要呈现的是苹果公司的图就很难了,哪怕是苹果 + 苹果 CEO 库克的症结词呈现的也是苹果和菜肴相干的图案。


    不外有关的也有不少,好比咱们尝试了阿里巴巴、腾讯、字节跳动,生成的也不克不及板上钉钉地说和这些品牌有关。但不论怎么说也很难一眼认出,多少有些笼统。


    输出人物姓名绘出的丹青也有不少无意思的。在海内出名度不低的手工博主李子柒名字生成的就是一幅让人舒心的景色画;著名的英超前主教练温格生成的丹青也能让人一眼认出,属于经典照片从新解构的格调;马云的格调也有点诡异,和 Facebook 统一的眼睛有种窥视感。
    至于马斯克,咱们用 TikTok 生成为了四个图片没有一个能认出来的。


    固然除了经过人物词胜利、笼统丹青,也有被以为表白得恰如其分,能够让人联想起来的 Switch、广州。
    塞尔达式格调的画作,外面有的人物能够让粉丝认出「这多是马里奥」。一样广州标记性修建和缤纷的颜色也能让人轻松辨认。


    每张配景图生成的时间不到 5 秒,假如主题相近,那末这些图用来做视频的配景图是十分适合的。生成的时间短,人人可用,这都是 TikTok 的劣势所在,所以这样一个文字转图象的产品泛起在一个日活上亿的运用上也能够算是一个标记性事情。
    只是 TikTok 仍是走了捷径。
    目前发生的图片简直都属于画作格调,得多乃至属于笼统派、印象派,和生成写实的图象比拟,这个难度就低了不少。毕竟就算不像也能靠脑补,了解你输出词的 AI 和去美术馆看画展的你面对的都是同样的问题——假如类似不敷,那就了解来凑。
    这也是一种省本钱的办法,难度低一点,需求耗损的算力也低,本钱也就更低了。


    ▲ 即使是内容略有血腥文字呈现的图片也不会太过惊悚
    文字变图,连 Google 都尚无即时生成的产品
    从成果下去看,TikTok 的 AI 绿幕呈现成果其实不能打上超高分。但作为一项门坎颇高的技术,可以在几秒内被用户无门坎地使用到就曾经算提高了。
    虽然受限于生成图片目前还不敷「日常」,不敷写实不会诱发技术滥用和图片造假的耽忧,但写实的图片其实曾经能够做到了,只是还不到 AI 绿幕这类人人可用的水平而已。
    Google 也曾公布过一个 Imagen AI 工具,能够把简略的句子变为一张真正的图片——像拍出来的照片同样真。但很遗憾,即使是在 AI 这方面投入微小的 Google 也没能做出即时生成的产品。换句话说,输出要求让 AI 给你画图的选项在 Imagen AI 尚无。


    ▲ Imagen AI 能够点击不同选项作出不同图片
    目前官网目前还只要一些预设的选项,就算每一个个都点一遍也不外几十种搭配,但有写实格调和油画格调能够选择。感兴致的读者,仍是能够本人去点点玩玩看。
    Google 属于名望大,一举一动都会备受关注的类型。而人工智能钻研试验室 OpenAI 则是靠作品,它们推出了最原始、最受欢送的人工智能文本到图象生成器 Dall-E。


    ▲ Dall-E
    Dall-E 能够从文字内容中对现有图象进行传神的再编纂,它能够为你添加和删除元素,在进行这些操作的同时还会斟酌暗影,反射和纹理的呈现成果——PS 技术能够秒杀你。从已有的画作中剖析模仿进行交换更是十分简略,灵感格调来源于原作,就是换了配角。
    作为一个钻研名目,Dall-E 还处于关闭测试阶段,而在名单中「无限数量的可托用户」在社交媒体上早就公布了一张又一张的照片。每个参预测试的用户最后能够获取 50 个收费积分,尔后每个月 15 分,1 分能够用一个文本内容生成 4 张图片,还能够选择三种画风。
    目前 Dall-E 还有很少的变现形式针对内测用户——每个月 15 积分用完后还想要体验办事,能够花 15 美元购买 十一5 个积分。好在生成的图片也能够被商业化,一旦你经过 Dall-E 创作了它,就能把它们用于插图、封面、T 恤设计等方方面面。


    ▲ 用户能够在设定好的地位添加元素,添加进照片的元素在暗影等方面也会自动增补
    视频导演 Karen X. Cheng 就对彭博社表现:
    我一连好几个小时都在体验生成图片,乃至迷失了标的目的……这觉得更像是你在和一个活生生的、会呼吸的人协作,和你协作的曾经不是 Photoshop 那样的工具了。固然 Dall-E 目前也并不是完善的,想要发明出彻底传神的人脸对它来讲仍旧有点难,需求专业医学常识摄取能力够精确的人类骨骼呈现它做的也不是很好。钻研员 Aditya Ramesh 表现 DALL-E 只知道如何浏览文本继而生成图片,所以它实际上是在致力发明一些视觉成果类似的内容。


    ▲Dall-E 生成的奇幻图片
    这项技术固然是颇有前景的,你能够想象它为内容创作者升高图片寻觅的门坎,也能够想象画像师在它的帮忙下能够晋升效力。但正如每一个个技术的泛起均可能被滥用同样,AI 帮忙文字生成图片的技术也有这样的危险——那些 Deepfake 上曾泛起过的负面运用场景都会一一重现。
    好在这次技术提供者早就延迟做好了筹备想要把 AI 关在笼子里了。
    TikTok 的笼统图片自身就是一重维护,由于它不写实。另外,即使你在 TikTok 中输出一些充溢暗示的内容(暴力、裸露)呈现出来的画作仍然不如预想中的那样,笼统的格调其实不明晰也规避了审核需求付出的微小本钱。


    ▲ Dall-E 官网的限度阐明
    Dall-E 也限度了 AI 生成暴力、成人、冤仇内容,在算法中就尽可能增加了 Dall-E 对此类概念的接触。同时,平台也有先进的技术避免使用真正的人的脸部生成图象(名人松了一口吻),自动化和人工监控零碎亦能避免 Dall-E 的滥用。
    只是一切新技术的泛起也不克不及只看坏的那一面,它所带来的高效前景就很值得期待。最少,爱范儿就很期待哪天推送的文章末尾写着「文章题图由 Dall-E 生成」。

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题30

    帖子41

    积分183

    图文推荐