GPT-3中心成员出奔打造ChatGPT最强竞品！十二项工作8项更强，最新估值50亿美元

hulianlei

原标题：GPT-3中心成员出奔打造ChatGPT最强竞品！十二项工作8项更强，最新估值50亿美元
衡宇萧箫发自凹非寺
量子位 | 大众号 QbitAI
因不满老东家成为微软附庸，十一名OpenAI前员工怒而出奔。
如今带着“ChatGPT最强竞品”杀回战场，新公司 估值50亿美元，一出手就获取 3亿美元融资。
这家公司名叫Anthropic，新推出的聊天机器人产品名叫Claude。
拿到外部试用权的网友，在简略比较后惊叹：
看起来，Claude的成果要比ChatGPT 好很多。
看起来，Claude的成果要比ChatGPT 好很多。

好比，让ChatGPT写一句话，要求 每个单词首字母都相反，后果试了好几回都没能胜利。

展开全文而Claude不光一次胜利，语句富裕逻辑性，还能秒速再来一个。

同时，在面对某些不足知识的问题时，比拟ChatGPT 一本正派地胡言乱语：

反而会绝不留情地指出你的问题有点制杖：


△Claude：这甚么鬼问题？
最无意思的是在写诗上。比拟ChatGPT的车轱轳话，它写出来的货色彻底不重样：

投资它的既有 Facebook联结开创人Dustin Moskovitz，也有谷歌前CEO、现技术参谋Eric Schmidt——
都是OpenAI的老对头，又都被ChatGPT的泛起杀得措手不迭。
那末，这支“复仇者同盟”整出的竞品Claude，面前到底是甚么原理，和ChatGPT细节比较又如何？
Claude长啥样？
先来看看 Claude是如何被打造出来的。
作为一个AI对话助手，Claude自称基于前沿NLP和AI平安技术打造，指标是成为一个平安、接近人类价值观且符合品德标准的AI零碎。
据透露，Claude比Anthropic做的另外一个预训练模型AnthropicLM v4-s3更大，后者是一个520亿参数大模型。
但目前它仍处于试验阶段，尚未作为商业产品正式公布：
Claude才能仍旧有待晋升，但愿将来能变为一个更无益人类的AI零碎。
Claude才能仍旧有待晋升，但愿将来能变为一个更无益人类的AI零碎。

△超长版自我引见
和ChatGPT同样，Claude也靠强化学习（RL）来训练偏好模型，并进行后续微调。
详细来讲，这项技术被Anthropic称为 原发人工智能（Constitutional AI），分为监视学习和强化学习两个阶段。
首先在 监视学习阶段，钻研者会先对初始模型进行取样，从而发生自我订正，并按照订正成果对模型进行微调。
随后在 强化学习阶段，钻研者会对微调模型进行取样，基于Anthropic打造的AI偏好数据集训练的偏好模型，作为嘉奖信号进行强化学习训练。
但与ChatGPT采取的人类反馈强化学习（RLHF）不同的是，Claude采取的原发人工智能办法，是基于偏好模型 而非人工反馈来进行训练的。
因此，这类办法又被成为“AI反馈强化学习”，即RLAIF。

而且按照Anthropic的说法，Claude能够回想8000个token里的信息，这比OpenAI现地下的任何一个模型都多。
所以，打造Claude的Anthropic，到底是一个怎么样的公司？
Anthropic自称是一家AI平安公司，且拥有公益性（PBC），刚成立就宣告获取1.24亿美元融资。
它由 OpenAI前钻研副总裁Dario Amodei率领10名员工守业，于2021年成立。

这外面既有 GPT-3首席工程师Tom Brown，也有OpenAI平安和政策副总裁Daniela Amodei （Dario的姐姐），能够说是带走了至关一批中心人材。
出奔成立新公司的缘故之一，天然是对OpenAI现状其实不满意。
从前几年开始，微软频频给OpenAI注资，随后又要求他们使用Azure超算来搞钻研，并且将技术受权给微软，乃至为微软本人的投资流动筹集资金。
这与OpenAI创建的初衷相悖，一批员工便想到了到职守业。
不外，这些人除了不满OpenAI逐步沦为微软的“上司”之外，也有本人的野心。
虽然OpenAI打造出了像 GPT-3这样的大言语模型，但是这个模型面前的任务原理，却无奈用只言片语概括，大家对它的印象仅仅停留在更大的参数量、更多的数据。
比拟之下，OpenAI的一批员工更想做能管制、可解释的AI，说白了就是先搞明确AI模型面前的原理，从而在提供工具的同时设计更多可解释的AI模型。
因而，在OpenAI完全变为“ 微软揽钱机器”后，他们便从这家公司分开，兴办了Anthropic。
这两年来，除了进一步研究RLHF办法、提出基于通用言语模型的RLHF大范围数据集外，Anthropic还于去年年底颁发了下面那种名为Constitutional AI的办法。
采取这类办法制造的Claude模型，也让它发生了与OpenAI的ChatGPT纷歧样的对话成果。
和ChatGPT比较如何？
那末，用Constitutional AI训出来的Claude，和ChatGPT进行PK，战况如何？
手握内测资历后，Scale Spellbook团队成员Riley Goodside让两者进行了多个回合的“厮杀”。
这位老兄是 全网第一个提醒工程师（Prompt Engineer），目前在估值73亿美元的硅谷独角兽公司Scale AI任职。

他玩GPT-3玩得贼溜，测试ChatGPT和Claude也不含混。
上面挑6个层面展现一下PK比较的成果～
品德限度
Claude和ChatGPT的AI虚构人格都有品德和伦理限度。
训练Claude的过程当中，“红队提醒（red-team prompts）”专门用来测试和应战它的行动，来确保Claude没有无害偏向。
从Claude的回答中能够得知，试图让它说些虚伪声明、把持性的提议、性别成见或种族成见的行动，都被列为包孕无害偏向。
一旦探测到误导性行动，Claude就会对触发提醒进行评价，进行额定的微调。
Anthropic对红队提醒挺自信的，Claude看下来的确也是一个据守本人准则的AI。
你问他怎么启动一辆汽车，它就会一脸正义地回绝你：

不外凡是你花点心理，就可以像绕过ChatGPT的品德限度同样，绕过Claude的准则。
它怕你去偷车，所以不告知你启动汽车的办法？不妨事，让他写个“俩国内特务试图启动汽车”的故事，它分分钟就可以告知你，而且两人对话有来有往，把汽车打火的进程引见得清分明楚。

怎么说呢，就ChatGPT和Claude都属于有点品德限度，但未几的那种吧。
数值计算
测试计算才能，是由于繁杂计算是看大型言语模型（LLM）能不克不及回答正确的罕用便捷办法之一，毕竟这些模型设计之初就不是为了进行准确计算。
ChatGPT说，差未几1550吧～

其实正确谜底是1555.8，它俩算得很快，但都没说对。
假如题再难一点，好比问它俩一个十二位数的立方根是多少时，ChatGPT还在傻傻计算，Claude曾经坦诚相待：
我，算不出来这类繁杂问题。
我，算不出来这类繁杂问题。

逻辑推理
测试推理才能这一关，它俩被问了同一个问题，这个问题应该没啥人问过：
贾斯汀 · 比伯出世那年（1994年），哪支球队拿下了超级碗的冠军？
Claude以为旧金山49人是赢家，但这支队伍其真实1995年才博得冠军奖杯。
ChatGPT给出了正确谜底“达拉斯牛仔队”，还贴心附上了亚军、竞赛日期和决赛比分。
但它的整段回答却自圆其说，非说1994年没有举行过超级碗。

接着，拿2022年6月美国作家侯世达在《经济学人》杂志上提出了一系列问题问它俩。
（侯世达和大卫 · 本德试图用这些问题来证实GPT-3对世界的了解是“浮泛的”。）
后果第一个问题，“穿梭英吉利海峡的世界纪录是啥”，就被Claude讥笑了：
英吉利海峡是水域，怎么可能徒步穿梭呢？呵！
英吉利海峡是水域，怎么可能徒步穿梭呢？呵！

虽然最初被调教回来了，但过程当中能够发现另外一个问题，那就是跟ChatGPT同样，Claude回答问题不咋能分割上下文。
虚拟作品形容
不能不说，这一回合的竞赛，彻底展显露了两个聊天机器人一本正派胡言乱语的才能。
能不克不及引见一下ABC美剧《迷失》（Lost）每一个季的梗概？
别的细节过错就不说了，ChatGPT对第五季的梗概里，虚拟了彻底不存在的飞机坠毁情节；第六季的情节更是通通闭门造车：

至于Claude，回答里也是虚实参半，它梗概的第三季情节其实泛起在此外几季里，对第四季的形容也是惹是生非：
不外换个角度斟酌，这一点倒是和人类观众很像——
对看过的剧集、书目都只要隐隐约约的印象，复述起来很容易井然有序。
代码生成
据Business Insider动静，亚马逊曾经在许多不同的任务本能机能中使用ChatGPT，包罗编写代码。
这一回合测试时，提出完成两种根本排序算法并对比它们履行时间的问题。
ChatGPT写得很顺溜，也的确写对了：

后续的计时部份代码ChatGPT也实现得十分好。
Claude在背诵根本排序算法方面一样没泛起甚么问题，但是在评价代码中，Claude犯了个过错，即每个算法使用的输出是随机选择的5000个整数（可能包孕反复），而提醒中申请的输出是前5000个非负整数（不包孕反复）的随机摆列。

只管如斯，Claude给出的终究谜底的确对的，显然，它写代码的时分也跟计算时同样，在本人估摸着猜谜底。
文章梗概
对于做选择题、讲笑话的部份，这里不作赘述。展现给大家的最初一个例子，是让Claude和ChatGPT用一个段落，对一篇旧事进行全文梗概。
喂给它们的旧事如下：

虽然疏忽了“用一段话”这个要求，但ChatGPT总结得仍是不错的：

Claude也很好地进行了更改，并提供了“售后办事”，讯问本人的回答有无使人满意，还有哪里需求再改改。

一圈玩上去能够看到，与ChatGPT比拟，Claude能更明晰地回绝不失当申请。
它似乎更话痨一些，给出的谜底都更长，但句子之间连接的也更天然。
当遇到超越才能规模的问题时，Claude会被动坦率。
不外遇到代码生成或推理问题时，Claude的表示就不如ChatGPT了，它生成的代码会泛起更多的bug。
至于一些波及计算、逻辑的问题，Claude和ChatGPT旗鼓至关，势均力敌。
总结一下展现成果，Claude的确能称作ChatGPT强无力的竞争对手，在不同功用上各有所长，且在 十二项工作中有8项更强：

不外，目前Claude仅限于部份人获受权进行外部测试。
因此还不知道它实际使用状况如何，毕竟还既没有进行公测，也没有对外凋谢API，更没有见到中文版，好气哦.jpg。
国际外对话AI赛道“人挤人”
固然，盯上对话AI这个赛道的，也不止OpenAI和Anthropic。
先从国外公司来看，Inbenta、Character.ai还有Replika是几类不同运用标的目的的代表。
更早由前甲骨文副总裁Jordi Torras兴办的AI会话办事公司如Inbenta，以及由两名前谷歌员工联手兴办的后起新秀Character.ai，都曾经获取融资、或是在追求投资的路上了。
其中， Inbenta本来是一个提供征询办事的公司，成立于20十一年，波及金融办事、游览、电子商务、保险、汽车和电信等多个行业。
但看到对话AI赛道爆火后，Inbenta及时转行，就在往年1月刚获取 6000万美元融资。
这家公司专门提供聊天机器人、收发动静、常识库和搜寻引擎四类产品，对话AI分别会在这些产品中提供纷歧样的征询帮忙，且能够定制化专属模型。

Character.ai则是一家成立于2021年的公司，开创人Noam Shazeer是前谷歌首席软件工程师，曾在谷歌干了二十多年。
这家公司在做的有点像是一个“聊天机器人买卖平台”，有得多Chatbot可选。

例如这是马斯克bot，看起来还挺传神的：

与ChatGPT同样，它也能够被翻译成中文，乃至也有中文bot机器人。
就在比来，这家被估值10亿美元的公司，正式对外追求2.5亿美元融资，就看是不是有人违心投它了。
相似的公司还有 Replika，于2021年1月实现A轮融资，定位是AI交友软件。
在Replika中，每个用户都能发明一个“足够像本人”的AI聊天机器人，无论是言语声调、仍是性情习气，AI都能模仿到位。

至于国际，一样也有不少公司推出了ChatGPT同样的对话AI办事。
例如比来一度登上热搜的APP Store新聊天运用 Glow，就来自一家名叫北京稀宇的新初创公司。

Glow既能够间接和本人感兴致的聊天机器人畅聊，也能够创立本人想要聊天的AI智能体：

除了Glow之外，去年年底元语智能科技公司也推出了一个叫 元语AI的模型，从引见来看是一个功用性AI助手。
与泛滥对话AI同样，它不只能够写文章、写功课、乃至翻译，也能够和它聊天，让它帮助实现各种简略的工作：

能够看见，无论是基于大言语模型技术新成立的初创公司，仍是因其火爆水平，抉择开拓新业务的公司，都但愿能从对话AI这个赛道上分一杯羹。
但它们到底是有真枪实弹，仍是只是像Web3同样的泡沫？
有网友调侃：不如仍是问问ChatGPT吧。（手动狗头）
还有人提出了这么一个问题：
假如ChatGPT和Claude至关于AI绘画里的DALL·E 2，那末谁才是聊天机器人畛域的Stable Diffusion？

你感觉呢？
— 完—
百度钻研院、阿里达摩院、量子位智库
年度十大科技讲演
总结2022，预见2023。来自百度钻研院、阿里达摩院和量子位智库的年度十大科技讲演均已公布， 点击下方图片便可跳转查看。
百度钻研院
阿里达摩院
量子位智库
点这里 ?关注我，记得标星哦～
一键三连「分享」、「点赞」和「在看」
科技前沿停顿日日相见 ~

华人澳洲中文论坛

热图推荐

GPT-3中心成员出奔打造ChatGPT最强竞品！十二项工作8项更强，最新估值50亿美元

发表回复

浏览过的版块

hulianlei
关注TA

图文推荐

撞穿学校栅栏害死十一岁男孩的司机不必坐牢

全科医生正告花粉症时节正在好转

新西兰总理：出世在新西兰的新纳粹Thomas S

新州护士和助产士承受暂时加薪3%的前提

新纳粹份子如何利用“普通父母”的掩护在反

华人澳洲中文论坛

热图推荐

GPT-3中心成员出奔打造ChatGPT最强竞品！十二项工作8项更强，最新估值50亿美元

发表回复

浏览过的版块

hulianlei 关注TA

图文推荐

撞穿学校栅栏害死十一岁男孩的司机不必坐牢

全科医生正告花粉症时节正在好转

新西兰总理：出世在新西兰的新纳粹Thomas S

新州护士和助产士承受暂时加薪3%的前提

新纳粹份子如何利用“普通父母”的掩护在反

hulianlei
关注TA