中国版ChatGPT重磅发布！百度破釜沉舟交卷，网友：看来还不必提早退休（组图）

FUN4川衣服

GPT-4公布一天之后，压力整个给到百度这边。
就在刚刚，百度交卷。
文心一言，百度全新一代常识加强大言语模型，正式在百度总部“挥手点江山”会议室里公布。
在一片静寂的气氛里，李彦宏小步退场，语气里带着点紧张：
大家的冀望值，是咱们对标ChatGPT，对标GPT-4，这个门坎有点高（笑）。
十月怀胎，咱们就带大家来看看这个AI大模型文心一言长甚么样。

此前，有人狂转meme图把百度比作GPT-4旁边的箱子。

也有人宣传百度是全村的但愿。
而在公布会进行的同时，百度港股市值先是上涨，相干话题还冲上了微博热搜，不外在会后又回调了一波。

但直播弹幕中也有网友点赞：

那末这个中国版ChatGPT究竟实力如何？
我们就用百度公布调演示的预录制Demo，比较一下簇新出炉的GPT-4，先凭实力谈话。

和GPT-4同样，文心一言是一个多模态大模型。
李彦宏收场就展现了文心一言具备的5种才能，包罗文学创作、商业案牍创作、数理逻辑推算、中文了解、多模态生成。
文心一言乃至还现场秀了一口接地气的四川话，现场网友收回一片笑声：
其余才能如何？咱们详细展开来看。
文学创作：
在文学创作上，李彦宏一收场就搬出了《三体》作者刘慈欣坐镇。
先让文心一言引见一下大刘，“毕竟我也是刘慈欣老乡嘛”：

看起来没甚么问题。一样的问题问问GPT-4呢？

嗯？？？间接把刘慈欣的老家挪到了湖北省洪湖市。湖北人狂喜

。
随后，李彦宏又展现了从哲学的角度对这段文章进行续写的demo：

看起来中规中矩，对比感性。老模样，咱们也来与GPT-4进行一波比较：

这波你是想看GPT-4续写的《三体》，仍是文心一言的？
再来看看《三体》电视剧中表演史强和汪淼的老搭档，于和伟和张鲁一，有甚么独特点？

也没甚么问题。
就是看起来展现的速度有点快，比李彦宏的语速还要快上那末一点点（手动狗头）。

商业案牍创作：
接上去，李彦宏又展现了一下文心一言在商业案牍创作上的才能。
好比给新公司起个名字。

而且这个名字它还不是瞎起的：

再来看看GPT-4起名的成果？

看起来，GPT-4对中文的掌控才能比拟之下仍是少了一点精华。
至于写个公司成立的旧事稿？对文心一言来讲似乎也不可问题：

数理逻辑推算：
数学才能，是考验生成式大模型的一大困难。ChatGPT刚上线时，也翻了不少车。
不外在现场，文心一言处置的数学识题不算繁杂，是小学数学比赛常见的鸡兔同笼问题。

彩蛋是，李彦宏现场展现的第一题，引得文心一言说出了《狂飙》里高启盛的经典台词：这题出得不合错误。

修正一下标题问题，OK，再扔给文心一言试试：

看起来，谜底还算是有理有据，一步步逻辑推理出来的那种。
李彦宏表现，这些题“不敢说百分之一百能做对，但最少体现了文心一言的思考历程”。
中文了解：
接上去，李彦宏侧重展现了一下文心一言对中文的了解才能，并特地强调：
文心一言对中国文明的理解，理当超越任何一个预训练大模型。
一下去就是一个成语，“洛阳纸贵。究竟有多贵？”

这是文心一言的成果展现：

还解释了一下这个成语面前的经济学原理：

那末，将这个问题抛给GPT-4呢？首先问问它，知不知道洛阳纸贵是甚么意思：

接上去，再问问他对应的经济学实践是甚么：

这波看起来，GPT-4的中文了解似乎也不输文心一言啊。
那末，再来看看两者写藏头诗的才能？
首先是文心一言的成果展现：

接上去，咱们再看看GPT-4怎么说：

诶，看起来反而是GPT-4没有真歪理解“藏头诗”的含意。
这波文明了解上，失实是文心一言“小胜一筹”了。
不外在英文上，李彦宏也抵赖，虽然文心一言也能处置，但才能是明显不如中文的。
这也和百度目前能用到的训练数据相关。
多模态生成：
最初，李彦宏还简略展现了一下文心一言多模态生成的才能。
首先来看看，为行将到来的2023世界智能交通大会创作海报——

而除了前文展现过的文字转四川话才能，文心一言还能文字转视频。
李彦宏一句指令“将以上内容生成视频”，很快啊，不到几秒钟，文心一言就把字幕和视频做好了：

有些遗憾的是，在ChatGPT被频频称誉的编程方面，文心一言并无现场展现相干才能。
但王海峰透露，文心一言的训练数据中一样包罗代码。

正如ChatGPT脱胎于OpenAI的GPT系列，百度这次推出的文心一言（ERNIE Bot），面前也恰是基于文心大模型技术打造。
据王海峰引见，文心一言次要脱胎于两大模型：
百度ERNIE系列常识加强千亿大模型，以及百度大范围凋谢域对话模型PLATO。
在此根底上，次要采取了六项中心技术。
其中三个是广为人知的大模型技术，包罗有监视精调、人类反馈强化学习（RLHF）和提醒构建。
p.s. 人类反馈强化学习也是ChatGPT的症结技术。
此外三个，则是“百度对比有特色”的技术，包罗常识加强、检索加强和对话加强技术。

首先来看与ChatGPT相似的技术：有监视精调、RLHF和提醒构建。
有监视精调，尤为指中文方面的数据精调。百度基于对中国言语文明和中国运用场景的了解，筛选了特定的数据来训练模型。

至于人类反馈的强化学习（RLHF）和提醒构建，操作上也与ChatGPT大差不差。

随后是百度提出的、用于进一步改良模型成果的技术。
常识加强，包罗常识内化和常识外用两个部份。其中，常识内化行将常识“浸透”进模型参数中；常识外用指的是模型能够间接使用内部的常识。

检索加强，则与百度搜寻引擎积攒的检索技术无关。
百度将把检索技术和生成技术结合起来，先对内容进行检索后，将对比有用的部份用于生成，再整合输入后果：

最初是对话加强部份，包罗以前百度积攒的记忆机制、上下文了解和对话布局等技术：

概括来看，文心一言表示出的才能，被李彦宏称为“智能涌现”：
当参数达到千亿量级，训练语料达到足够多的状况下，这类景象就会产生。
目前，百度具有的AI技术能够分为四个部份，芯片（昆仑芯）、框架（飞桨）、模型（文心）和运用。
之所以软硬件都要规划，百度称，是为了升高本钱：
生成式AI需要的算力十分高，费用至关低廉。
因此，假如在四层架构之间互相进行协同优化，就可以让它的效力比他人更高，从而明显升高本钱。
李彦宏以为，这也恰是百度的劣势所在：
四层都有当先产品的公司，绝无仅有。

这次文心大模型面前的硬件算力，也是经过百度智能云提供办事。
目前，文心一言曾经接入百度搜寻，目的在于晋升搜寻资源效力。
同时，包罗小度和自动驾驶Apollo等产品，以及爱奇艺等公司也曾经接入百度的文心一言模型。

截至发稿，百度港股股价在一波显著上涨之后，有所回弹。

公布会完结，网友反映至多的是“提前录制有点败好感”：

关于这一点，李彦宏的解释是，给出的问题都对比长，为了勤俭现场时间，所以才用了提前录制的方式。
还有不少网友对文心一言展现出的才能不太满意。有人调侃，看完之后觉得“提前退休的日子看起来还能够缓一缓”：

离GPT-4还差了20个老胡。

还有网友觉得，文心一言的公布会像极了结业辩论的本人（doge）：

不外也有网友表现，但愿能给国产产品一点时间一点耐烦。

公布会末尾，王海峰宣告，文心一言将从明天开始对外进行测试，包罗集体用户和企业用户。
是骡子是马，置信接上去，会失掉更多验证。

华人澳洲中文论坛

热图推荐

中国版ChatGPT重磅发布！百度破釜沉舟交卷，网友：看来还不必提早退休（组图）

发表回复

浏览过的版块

FUN4川衣服
关注TA

图文推荐

撞穿学校栅栏害死十一岁男孩的司机不必坐牢

全科医生正告花粉症时节正在好转

新西兰总理：出世在新西兰的新纳粹Thomas S

新州护士和助产士承受暂时加薪3%的前提

新纳粹份子如何利用“普通父母”的掩护在反

华人澳洲中文论坛

热图推荐

中国版ChatGPT重磅发布！百度破釜沉舟交卷，网友：看来还不必提早退休（组图）

发表回复

浏览过的版块

FUN4川衣服 关注TA

图文推荐

撞穿学校栅栏害死十一岁男孩的司机不必坐牢

全科医生正告花粉症时节正在好转

新西兰总理：出世在新西兰的新纳粹Thomas S

新州护士和助产士承受暂时加薪3%的前提

新纳粹份子如何利用“普通父母”的掩护在反

FUN4川衣服
关注TA