华人澳洲中文论坛

热图推荐

    中国版ChatGPT重磅发布!百度破釜沉舟交卷,网友:看来还不必提早退休(组图)

    [复制链接]

    2023-3-17 13:15:51 38 0

    GPT-4公布一天之后,压力整个给到百度这边。
    就在刚刚,百度交卷。
    文心一言,百度全新一代常识加强大言语模型,正式在百度总部“挥手点江山”会议室里公布。
    在一片静寂的气氛里,李彦宏小步退场,语气里带着点紧张:
    大家的冀望值,是咱们对标ChatGPT,对标GPT-4,这个门坎有点高(笑)。
    十月怀胎,咱们就带大家来看看这个AI大模型文心一言长甚么样。

    此前,有人狂转meme图把百度比作GPT-4旁边的箱子。

    也有人宣传百度是全村的但愿。
    而在公布会进行的同时,百度港股市值先是上涨,相干话题还冲上了微博热搜,不外在会后又回调了一波。

    但直播弹幕中也有网友点赞:

    那末这个中国版ChatGPT究竟实力如何?
    我们就用百度公布调演示的预录制Demo,比较一下簇新出炉的GPT-4,先凭实力谈话。

    和GPT-4同样,文心一言是一个多模态大模型。
    李彦宏收场就展现了文心一言具备的5种才能,包罗文学创作、商业案牍创作、数理逻辑推算、中文了解、多模态生成。
    文心一言乃至还现场秀了一口接地气的四川话,现场网友收回一片笑声:
    其余才能如何?咱们详细展开来看。
    文学创作:
    在文学创作上,李彦宏一收场就搬出了《三体》作者刘慈欣坐镇。
    先让文心一言引见一下大刘,“毕竟我也是刘慈欣老乡嘛”:

    看起来没甚么问题。一样的问题问问GPT-4呢?

    嗯???间接把刘慈欣的老家挪到了湖北省洪湖市。湖北人狂喜


    随后,李彦宏又展现了从哲学的角度对这段文章进行续写的demo:

    看起来中规中矩,对比感性。老模样,咱们也来与GPT-4进行一波比较:

    这波你是想看GPT-4续写的《三体》,仍是文心一言的?
    再来看看《三体》电视剧中表演史强和汪淼的老搭档,于和伟和张鲁一,有甚么独特点?

    也没甚么问题。
    就是看起来展现的速度有点快,比李彦宏的语速还要快上那末一点点(手动狗头)。

    商业案牍创作:
    接上去,李彦宏又展现了一下文心一言在商业案牍创作上的才能。
    好比给新公司起个名字。

    而且这个名字它还不是瞎起的:

    再来看看GPT-4起名的成果?

    看起来,GPT-4对中文的掌控才能比拟之下仍是少了一点精华。
    至于写个公司成立的旧事稿?对文心一言来讲似乎也不可问题:

    数理逻辑推算:
    数学才能,是考验生成式大模型的一大困难。ChatGPT刚上线时,也翻了不少车。
    不外在现场,文心一言处置的数学识题不算繁杂,是小学数学比赛常见的鸡兔同笼问题。

    彩蛋是,李彦宏现场展现的第一题,引得文心一言说出了《狂飙》里高启盛的经典台词:这题出得不合错误。

    修正一下标题问题,OK,再扔给文心一言试试:

    看起来,谜底还算是有理有据,一步步逻辑推理出来的那种。
    李彦宏表现,这些题“不敢说百分之一百能做对,但最少体现了文心一言的思考历程”。
    中文了解:
    接上去,李彦宏侧重展现了一下文心一言对中文的了解才能,并特地强调:
    文心一言对中国文明的理解,理当超越任何一个预训练大模型。
    一下去就是一个成语,“洛阳纸贵。究竟有多贵?”

    这是文心一言的成果展现:

    还解释了一下这个成语面前的经济学原理:

    那末,将这个问题抛给GPT-4呢?首先问问它,知不知道洛阳纸贵是甚么意思:

    接上去,再问问他对应的经济学实践是甚么:

    这波看起来,GPT-4的中文了解似乎也不输文心一言啊。
    那末,再来看看两者写藏头诗的才能?
    首先是文心一言的成果展现:

    接上去,咱们再看看GPT-4怎么说:

    诶,看起来反而是GPT-4没有真歪理解“藏头诗”的含意。
    这波文明了解上,失实是文心一言“小胜一筹”了。
    不外在英文上,李彦宏也抵赖,虽然文心一言也能处置,但才能是明显不如中文的。
    这也和百度目前能用到的训练数据相关。
    多模态生成:
    最初,李彦宏还简略展现了一下文心一言多模态生成的才能。
    首先来看看,为行将到来的2023世界智能交通大会创作海报——

    而除了前文展现过的文字转四川话才能,文心一言还能文字转视频。
    李彦宏一句指令“将以上内容生成视频”,很快啊,不到几秒钟,文心一言就把字幕和视频做好了:

    有些遗憾的是,在ChatGPT被频频称誉的编程方面,文心一言并无现场展现相干才能。
    但王海峰透露,文心一言的训练数据中一样包罗代码。

    正如ChatGPT脱胎于OpenAI的GPT系列,百度这次推出的文心一言(ERNIE Bot),面前也恰是基于文心大模型技术打造。
    据王海峰引见,文心一言次要脱胎于两大模型:
    百度ERNIE系列常识加强千亿大模型,以及百度大范围凋谢域对话模型PLATO。
    在此根底上,次要采取了六项中心技术。
    其中三个是广为人知的大模型技术,包罗有监视精调、人类反馈强化学习(RLHF)和提醒构建。
    p.s. 人类反馈强化学习也是ChatGPT的症结技术。
    此外三个,则是“百度对比有特色”的技术,包罗常识加强、检索加强和对话加强技术。

    首先来看与ChatGPT相似的技术:有监视精调、RLHF和提醒构建。
    有监视精调,尤为指中文方面的数据精调。百度基于对中国言语文明和中国运用场景的了解,筛选了特定的数据来训练模型。

    至于人类反馈的强化学习(RLHF)和提醒构建,操作上也与ChatGPT大差不差。

    随后是百度提出的、用于进一步改良模型成果的技术。
    常识加强,包罗常识内化和常识外用两个部份。其中,常识内化行将常识“浸透”进模型参数中;常识外用指的是模型能够间接使用内部的常识。

    检索加强,则与百度搜寻引擎积攒的检索技术无关。
    百度将把检索技术和生成技术结合起来,先对内容进行检索后,将对比有用的部份用于生成,再整合输入后果:

    最初是对话加强部份,包罗以前百度积攒的记忆机制、上下文了解和对话布局等技术:

    概括来看,文心一言表示出的才能,被李彦宏称为“智能涌现”:
    当参数达到千亿量级,训练语料达到足够多的状况下,这类景象就会产生。
    目前,百度具有的AI技术能够分为四个部份,芯片(昆仑芯)、框架(飞桨)、模型(文心)和运用。
    之所以软硬件都要规划,百度称,是为了升高本钱:
    生成式AI需要的算力十分高,费用至关低廉。
    因此,假如在四层架构之间互相进行协同优化,就可以让它的效力比他人更高,从而明显升高本钱。
    李彦宏以为,这也恰是百度的劣势所在:
    四层都有当先产品的公司,绝无仅有。

    这次文心大模型面前的硬件算力,也是经过百度智能云提供办事。
    目前,文心一言曾经接入百度搜寻,目的在于晋升搜寻资源效力。
    同时,包罗小度和自动驾驶Apollo等产品,以及爱奇艺等公司也曾经接入百度的文心一言模型。



    截至发稿,百度港股股价在一波显著上涨之后,有所回弹。

    公布会完结,网友反映至多的是“提前录制有点败好感”:


    关于这一点,李彦宏的解释是,给出的问题都对比长,为了勤俭现场时间,所以才用了提前录制的方式。
    还有不少网友对文心一言展现出的才能不太满意。有人调侃,看完之后觉得“提前退休的日子看起来还能够缓一缓”:

    离GPT-4还差了20个老胡。

    还有网友觉得,文心一言的公布会像极了结业辩论的本人(doge):

    不外也有网友表现,但愿能给国产产品一点时间一点耐烦。

    公布会末尾,王海峰宣告,文心一言将从明天开始对外进行测试,包罗集体用户和企业用户。
    是骡子是马,置信接上去,会失掉更多验证。

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题5

    帖子37

    积分155

    图文推荐