华人澳洲中文论坛

中国版ChatGPT重磅发布!百度破釜沉舟交卷,网友:看来还不必提早退休(组图)

[复制链接]

2023-3-17 13:15:51 73 0

GPT-4公布一天之后,压力整个给到百度这边。
就在刚刚,百度交卷。
文心一言,百度全新一代常识加强大言语模型,正式在百度总部“挥手点江山”会议室里公布。
在一片静寂的气氛里,李彦宏小步退场,语气里带着点紧张:
大家的冀望值,是咱们对标ChatGPT,对标GPT-4,这个门坎有点高(笑)。
十月怀胎,咱们就带大家来看看这个AI大模型文心一言长甚么样。

此前,有人狂转meme图把百度比作GPT-4旁边的箱子。

也有人宣传百度是全村的但愿。
而在公布会进行的同时,百度港股市值先是上涨,相干话题还冲上了微博热搜,不外在会后又回调了一波。

但直播弹幕中也有网友点赞:

那末这个中国版ChatGPT究竟实力如何?
我们就用百度公布调演示的预录制Demo,比较一下簇新出炉的GPT-4,先凭实力谈话。

和GPT-4同样,文心一言是一个多模态大模型。
李彦宏收场就展现了文心一言具备的5种才能,包罗文学创作、商业案牍创作、数理逻辑推算、中文了解、多模态生成。
文心一言乃至还现场秀了一口接地气的四川话,现场网友收回一片笑声:
其余才能如何?咱们详细展开来看。
文学创作:
在文学创作上,李彦宏一收场就搬出了《三体》作者刘慈欣坐镇。
先让文心一言引见一下大刘,“毕竟我也是刘慈欣老乡嘛”:

看起来没甚么问题。一样的问题问问GPT-4呢?

嗯???间接把刘慈欣的老家挪到了湖北省洪湖市。湖北人狂喜


随后,李彦宏又展现了从哲学的角度对这段文章进行续写的demo:

看起来中规中矩,对比感性。老模样,咱们也来与GPT-4进行一波比较:

这波你是想看GPT-4续写的《三体》,仍是文心一言的?
再来看看《三体》电视剧中表演史强和汪淼的老搭档,于和伟和张鲁一,有甚么独特点?

也没甚么问题。
就是看起来展现的速度有点快,比李彦宏的语速还要快上那末一点点(手动狗头)。

商业案牍创作:
接上去,李彦宏又展现了一下文心一言在商业案牍创作上的才能。
好比给新公司起个名字。

而且这个名字它还不是瞎起的:

再来看看GPT-4起名的成果?

看起来,GPT-4对中文的掌控才能比拟之下仍是少了一点精华。
至于写个公司成立的旧事稿?对文心一言来讲似乎也不可问题:

数理逻辑推算:
数学才能,是考验生成式大模型的一大困难。ChatGPT刚上线时,也翻了不少车。
不外在现场,文心一言处置的数学识题不算繁杂,是小学数学比赛常见的鸡兔同笼问题。

彩蛋是,李彦宏现场展现的第一题,引得文心一言说出了《狂飙》里高启盛的经典台词:这题出得不合错误。

修正一下标题问题,OK,再扔给文心一言试试:

看起来,谜底还算是有理有据,一步步逻辑推理出来的那种。
李彦宏表现,这些题“不敢说百分之一百能做对,但最少体现了文心一言的思考历程”。
中文了解:
接上去,李彦宏侧重展现了一下文心一言对中文的了解才能,并特地强调:
文心一言对中国文明的理解,理当超越任何一个预训练大模型。
一下去就是一个成语,“洛阳纸贵。究竟有多贵?”

这是文心一言的成果展现:

还解释了一下这个成语面前的经济学原理:

那末,将这个问题抛给GPT-4呢?首先问问它,知不知道洛阳纸贵是甚么意思:

接上去,再问问他对应的经济学实践是甚么:

这波看起来,GPT-4的中文了解似乎也不输文心一言啊。
那末,再来看看两者写藏头诗的才能?
首先是文心一言的成果展现:

接上去,咱们再看看GPT-4怎么说:

诶,看起来反而是GPT-4没有真歪理解“藏头诗”的含意。
这波文明了解上,失实是文心一言“小胜一筹”了。
不外在英文上,李彦宏也抵赖,虽然文心一言也能处置,但才能是明显不如中文的。
这也和百度目前能用到的训练数据相关。
多模态生成:
最初,李彦宏还简略展现了一下文心一言多模态生成的才能。
首先来看看,为行将到来的2023世界智能交通大会创作海报——

而除了前文展现过的文字转四川话才能,文心一言还能文字转视频。
李彦宏一句指令“将以上内容生成视频”,很快啊,不到几秒钟,文心一言就把字幕和视频做好了:

有些遗憾的是,在ChatGPT被频频称誉的编程方面,文心一言并无现场展现相干才能。
但王海峰透露,文心一言的训练数据中一样包罗代码。

正如ChatGPT脱胎于OpenAI的GPT系列,百度这次推出的文心一言(ERNIE Bot),面前也恰是基于文心大模型技术打造。
据王海峰引见,文心一言次要脱胎于两大模型:
百度ERNIE系列常识加强千亿大模型,以及百度大范围凋谢域对话模型PLATO。
在此根底上,次要采取了六项中心技术。
其中三个是广为人知的大模型技术,包罗有监视精调、人类反馈强化学习(RLHF)和提醒构建。
p.s. 人类反馈强化学习也是ChatGPT的症结技术。
此外三个,则是“百度对比有特色”的技术,包罗常识加强、检索加强和对话加强技术。

首先来看与ChatGPT相似的技术:有监视精调、RLHF和提醒构建。
有监视精调,尤为指中文方面的数据精调。百度基于对中国言语文明和中国运用场景的了解,筛选了特定的数据来训练模型。

至于人类反馈的强化学习(RLHF)和提醒构建,操作上也与ChatGPT大差不差。

随后是百度提出的、用于进一步改良模型成果的技术。
常识加强,包罗常识内化和常识外用两个部份。其中,常识内化行将常识“浸透”进模型参数中;常识外用指的是模型能够间接使用内部的常识。

检索加强,则与百度搜寻引擎积攒的检索技术无关。
百度将把检索技术和生成技术结合起来,先对内容进行检索后,将对比有用的部份用于生成,再整合输入后果:

最初是对话加强部份,包罗以前百度积攒的记忆机制、上下文了解和对话布局等技术:

概括来看,文心一言表示出的才能,被李彦宏称为“智能涌现”:
当参数达到千亿量级,训练语料达到足够多的状况下,这类景象就会产生。
目前,百度具有的AI技术能够分为四个部份,芯片(昆仑芯)、框架(飞桨)、模型(文心)和运用。
之所以软硬件都要规划,百度称,是为了升高本钱:
生成式AI需要的算力十分高,费用至关低廉。
因此,假如在四层架构之间互相进行协同优化,就可以让它的效力比他人更高,从而明显升高本钱。
李彦宏以为,这也恰是百度的劣势所在:
四层都有当先产品的公司,绝无仅有。

这次文心大模型面前的硬件算力,也是经过百度智能云提供办事。
目前,文心一言曾经接入百度搜寻,目的在于晋升搜寻资源效力。
同时,包罗小度和自动驾驶Apollo等产品,以及爱奇艺等公司也曾经接入百度的文心一言模型。



截至发稿,百度港股股价在一波显著上涨之后,有所回弹。

公布会完结,网友反映至多的是“提前录制有点败好感”:


关于这一点,李彦宏的解释是,给出的问题都对比长,为了勤俭现场时间,所以才用了提前录制的方式。
还有不少网友对文心一言展现出的才能不太满意。有人调侃,看完之后觉得“提前退休的日子看起来还能够缓一缓”:

离GPT-4还差了20个老胡。

还有网友觉得,文心一言的公布会像极了结业辩论的本人(doge):

不外也有网友表现,但愿能给国产产品一点时间一点耐烦。

公布会末尾,王海峰宣告,文心一言将从明天开始对外进行测试,包罗集体用户和企业用户。
是骡子是马,置信接上去,会失掉更多验证。

发表回复

您需要登录后才可以回帖 登录 | 立即注册

返回列表 本版积分规则

:
注册会员
:
论坛短信
:
未填写
:
未填写
:
未填写

主题5

帖子39

积分168

图文推荐

  • 撞穿学校栅栏害死十一岁男孩的司机不必坐牢

    一位女司机撞穿学校栅栏、害死了11岁男孩,被罚20

  • 全科医生正告花粉症时节正在好转

    全国各地的全科医生正告春季的开端标记着花粉症时

  • 新西兰总理:出世在新西兰的新纳粹Thomas S

    新西兰总理拉克森称新纳粹Thomas Sewell是坏人,

  • 新州护士和助产士承受暂时加薪3%的前提

    新州护士和助产士投票承受政府提出的暂时加薪3%以

  • 新纳粹份子如何利用“普通父母”的掩护在反

    星期天,新纳粹份子在反移民集会开端前大约一个小