华人澳洲中文论坛

热图推荐

    恐惧的 GPT-4

    [复制链接]

    2023-3-17 09:11:04 32 0



    作者:万连山
    来源:格隆(ID:guru-lama)
    NB!对不起,真实没忍住说出这两个字。
    ChatGPT(GPT-3.5)引爆科技圈后,一切人都在探讨,AI下一步会往哪一个标的目的开展。
    上一次有这类觉得,仍是初代iPhone公布的时分。
    咱们并无等过久。
    隔夜,OpenAI正式推出新品GPT-4,再次扑灭了大家的想象力。
    老板Sam Altman间接单刀直入地引见:
    这是咱们迄今为止功用最弱小的模型!
    有多强?
    就像不少人感慨的:假如GPT-3.5尚属意料之中,GPT-4则让我自惭形秽。
    这一波,真是科幻照进理想了。


    01
    伟大改革的前奏
    怎么证实一集体比另外一集体程度高?
    理想社会中,次要伎俩是考试、拿证。
    所以,想让大部份人直观地感触到,新AI模型比旧的牛逼,一样是考试。
    OpenAI用GPT-4加入了多项美国通用考试,成就很惊艳:
    在SAT数学和浏览考试中,GPT-4比GPT-3.5高150分;
    它还能经过律师摹拟考试,得分排在应试者前10%,而震撼寰球的GPT-3.5只能排在倒数10%……
    随后,在YouTube上进行的Live Demo中,OpenAI展现了GPT-4的真正实力:总结文章、写代码、报税、写诗……GPT-3.5做不到的,GPT-4轻松拿下。
    并且,还不单单是这样。


    按照OpenAI官网形容,相较于GPT3.5,GPT-4最大的进化在于:“多模态”和长内容生成。
    其中的症结,就是多模态这个词,望文生义,就是不同类型数据的融会。
    目前GPT-4最大的冲破,就是具有了“读图才能”。
    用户能够间接用图片发问,它可以在读懂图片内容的根底上,给出有逻辑的回答。
    有个形象的例子。
    上面这集体用笔在簿本上画了个网站的草图,而后用手机拍上去,发送给GPT-4。
    10秒钟后,它不只辨认出图片的含意,还生成为了要建设这个网站的代码。
    “您好,您的网站建好了。”






    这个事情中,最中心的点其实不在于编程、计算和剖析才能,而是它能精确了解图片的含意,并给出解答,乃至是图片解答。
    这就比GPT-3.5高出一个世代了。
    二者的表示力基本不是一个级别的。咱们能够了解为,在纯文字的年代,照像机的泛起,对信息交流发生了多大的增进作用。
    这就是AI进化史上相似的事情。
    乃至,这也只是表象。更让我震惊加一点恐怖的,是GPT-4具备的的初步逻辑思惟才能。
    正如OpenAI在明天的博文中所说:
    咱们创立了GPT-4,这是 OpenAI 致力扩展深度学习的最新里程碑。虽然在许多理想世界场景中的才能不如人类,但在各种专业和学术基准上表示出人类程度。
    在OpenAI提供的一个示例中,GPT-4精确地回答了几个网络meme为何搞笑的问题,虽然解释得其实不可笑。


    GPT-4还学会简略的逻辑推理了。好比你问,图片里的绳子剪断会产生甚么。它答,气球会飞走。
    它乃至能够讲出一些品质不咋地、模式化的冷笑话。虽然其实不可笑,但最少,它曾经开始了解“风趣”这一人类特质。
    这两件大事看起来挺弱智的,却是AI向人类思惟缓缓进化的标记。
    就像古猿人第一次学会直立行走,石器时期的原始人第一次思考人与天然的瓜葛。
    宏观角度看,这没甚么大不了的。但拉长期线,当前人的目光看,这或许恰是伟大改革的前奏曲。
    就像咱们钻研原始人走路同样。


    固然,GPT-4仍然有局限性。
    首先,它的常识范畴也存在时间限度,截止于 2021 年 9 月。
    其次,AI毕竟是AI,OpenAI也表现目前GPT-4其实不完善,它在得多场景下的才能都不如人类。
    据称,该模型依然存在“幻觉”或假造事实的问题,而且在事实方面也纷歧定老是牢靠的,“它偏向于坚持以为它是正确的,即便它错了”。
    OpenAI表现,GPT-4正在致力解决其局限性,例如社会成见、幻觉和反抗性提醒。
    但只管如斯,没人能否定,GPT十分有后劲。
    世界上任何事,最难的永久不是做不到,而是想不到。
    只有有个雏形,哪怕很low、很粗陋,间隔做好就不会很远了。
    OpenAI做出ChatGPT,最大的意义是是向大家证实,这类运用是存在的,这类技术是可行的。这件事,不是干不可的。
    就好像多年前,大家都在空口说概念的时分,只要特斯拉先做出了成品。
    02
    胜利绝非偶尔
    一个恐惧的事实:GPT-4早在去年8月就训练实现了。
    之所以当初才面市,是OpenAI需求花6个月时间,让它变得更平安。
    这就不能不让人浮想连翩。
    会不会曾经有GPT-5、GPT-6了,它们究竟是甚么模样?是不是曾经生长为无奈掌控的巨兽?
    OpenAI的外部技术,究竟当先外界多少年?
    微小的压力给到全世界。


    自ChatGPT公布以来,国际外泛滥科技公司对AIGC技术的追捧已达到旷古绝伦的热度了。
    Chat GPT刚刚公布,百度便当即官宣了大模型新名目“文心一言”(ERNIE Bot),将在今天和大家见面。
    在尔后很短的一段时间内,阿里、京东、腾讯、字节跳动、360等多家互联网及IT企业纷纭表现对AIGC技术开展的关注和跟进,并同步提出了一些相干方案。
    种种迹象标明,从科技巨头到行业龙头,中国企业已纷纭进入AIGC赛道竞逐。
    然而,这块蛋糕,其实不好吃。
    GPT-4是人工智能生成内容——AIGC技术最新停顿的代表。
    所谓AIGC,是继专业生成内容(PGC)、职业生成内容(OGC)、用户生成内容(UGC)后,互联网内容生成的第四个阶段——神经网络深度学习。
    这确实是人类科技史上天翻地覆的反动。
    GPT-3.5和GPT-4,之所以能生成文字、代码、语音、图片、视频,实现言语翻译、案牍撰写、脚本编程,是由于OpenAI对数据、算力、算法等症结因素进行了几个世代的降级。
    先说数据。
    仅GPT-3.5的训练参数,就达到1750亿个以上。
    想要把如斯海量的数据被重复投喂给AI模型,单次训练本钱就高达460万美元。
    假如不是先有马斯克、后有微软的反对,OpenAI是不成能耗损得起的。
    再说算力。
    20十二-2018年,寰球AI算力需要增长约为30万倍,这个数字曾经很恐惧了。
    但从2018年起,跟着Google Duplex、Open AI Five以及新华社寰球第一个“AI分解主播”上岗,人工智能技术开始减速落地。尤为是往年,称得上是发作之年。
    根据当初的进度,按照预测,AI所需算力每100天将翻一倍。
    也就是说,到2030年,AI所需算力是当初的3200万倍。(2的25次方)
    显然,假如不在软件办事、硬件撑持、芯片技术等方面协同翻新,咱们的算力程度不成能完成指数级别的增长。
    GPT-4的训练是在微软云上进行的。而在寰球云计算市场,微软云排名第二,再加之芯片技术的高速开展,这些都为ChatGPT的横空出生奠定了松软的算力根底。


    最初说算法。
    比拟传统的AI算法,GPT的劣势在于,经过海量参数,进一步晋升模型的准确度。
    初代GPT模型的参数是1.17亿个;GPT-2事15亿个,减少了10倍;GPT-3达到1750亿,是GPT-2的 100 倍;而GPT-4的实在参数在1750亿-2800亿之间,并无比GPT-3高出太多,其重点在数据处置优化上。
    这类大模型算法的完成,必需有高效力的算法框架来撑持,由于参数量下来之后,需求把模型和数据扩散放到多个GPU卡上,卡之间如何通讯、调度,如何进行高效的反向传布,都需求少量高程度技术人材来推动和实行。
    GPT之所以共同,就是在目前世界上最弱小的LLM(大言语模型)为根底的同时,引入了基于人类反馈的强化学习办法,从而进步了对话的品质,而降级到多模态预训练大模型GPT-4版本后,其对话品质变得更为弱小、完善。
    同时也能看到,GPT-4之所以比GPT3.5强得无限,可能就是算法的效力达到瓶颈了。
    GPT-5,可能没有咱们想象的那末快到来。
    综上,能够看出,ChatGPT是靠弱小算力和高本钱,用大范围的数据“喂”出来的AI模型,它的出圈看似是偶尔的,但其胜利却绝非偶尔。
    其余公司想要复制一款ChatGPT,绝非随意设计个对话模型就完事。
    事实上,国际AI畛域真正不足的是技术积攒,包罗数据的荡涤和标注、模型的构造设计,以及怎么训练、推理等,这些技术得多都需求教训和积攒,需求少量的科研人材和普通技术人员一步一个足迹走出来。
    这方面,目前大公司更有劣势。
    好比百度,之所以能尽快推出“文心一言”,就是由于其十年多来累计投入了超过1000亿元的技术研发经费。
    而小公司,不只承当不起昂扬的本钱,也没有后期的技术研发积淀。跟风入局,虽然在股市里有一时的风光,利历时间差赚一些块钱。
    但久远来看,最终会被市场淘汰。
    固然,并非说小公司彻底没无机会,若能真正好高鹜远做好AIGC相干的一个细分板块,仍然无机会跑出来。
    愿国际科技公司在追逐世界前沿科技的同时,少一些娇娆炒作,少一些深谋远虑,多一些翻新实干,多一些厚积薄发。
    03
    序幕
    明天有个热搜挺无意思的。
    说是《校花的贴身高手》水了一万多章,十多年还没结束,被读者举报了。
    看得人一脸懵逼,这不是刚上高中时躲被窝里看的么。作者鱼人二代,当年还挺火的,《极品修真强少》、《很纯很暗昧》都是青春期难忘的回想。
    印象中,这部小说早就被翻拍成电视剧,下认识便认为完本了。
    其实想一想也正常,追了一万多章的书,校花都成姨妈了,男主仍是个雏儿,读者固然朝气……
    还有另外一种说法。
    平台和签约作者有协定,只有小说不停更,每月就有几万元固定支出。所以本该完本的小说,作者又找了个代笔,磨磨唧唧水了近十年。
    这波啊,是反向薅资同族羊毛,可谓吾辈楷模。
    平台被薅得受不了了,因而本人找人偷偷举报。


    联想一下。
    当ChatGPT、“文心一言”在国际遍及后,假如过气的老牌作者人手一个,每天水字数,能白嫖多少稿费?
    想一想就流口水啊。
    对曾经功成名就的部份网文作者而言,AI的遍及,大略率是件坏事。
    但对其余人,纷歧定如斯了。
    按照上文,总的来讲,GPT-4 的曾经证实了,它有才能在得多畛域,呈现出超出人类的表示。
    乃至有传言称,GPT-4经过了“图灵测试”,在逻辑才能上与绝大部份人类曾经无异。
    当初独一的门坎,就是本钱问题了。
    一旦算力、算法、数据失掉冲破性停顿,本钱降上去了,就真的会对一些产业造成冲击。
    说不定吃着火锅唱着歌,忽然就被 AI 把命给革了。
    固然,我仍是阿谁观念:快点学,快点用。
    AI毕竟是工具,是被人奴役的对象。
    即便未来淘汰一部份人,也是先淘汰那些不会使用先进工具的人。
    我爱这个魔幻的世界。
    THE END

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    中级会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题39

    帖子47

    积分215

    图文推荐