华人澳洲中文论坛

GPT-3中心成员出奔打造ChatGPT最强竞品!十二项工作8项更强,最新估值50亿美元

[复制链接]

2023-1-29 21:13:05 56 0

原标题:GPT-3中心成员出奔打造ChatGPT最强竞品!十二项工作8项更强,最新估值50亿美元  
衡宇 萧箫 发自 凹非寺   
量子位 | 大众号 QbitAI   
因不满老东家成为微软附庸,十一名OpenAI前员工怒而出奔。  
如今带着“ChatGPT最强竞品”杀回战场,新公司 估值50亿美元,一出手就获取 3亿美元融资。   
这家公司名叫Anthropic,新推出的聊天机器人产品名叫Claude。  
拿到外部试用权的网友,在简略比较后惊叹:  
看起来,Claude的成果要比ChatGPT 好很多
    看起来,Claude的成果要比ChatGPT 好很多。   


好比,让ChatGPT写一句话,要求 每个单词首字母都相反,后果试了好几回都没能胜利。   


展开全文    而Claude不光一次胜利,语句富裕逻辑性,还能秒速再来一个。  


同时,在面对某些不足知识的问题时,比拟ChatGPT 一本正派地胡言乱语:   


反而会绝不留情地指出你的问题有点制杖:  


  
Claude:这甚么鬼问题?   
最无意思的是在写诗上。比拟ChatGPT的车轱轳话,它写出来的货色彻底不重样:  


投资它的既有 Facebook联结开创人Dustin Moskovitz,也有 谷歌前CEO、现技术参谋Eric Schmidt——   
都是OpenAI的老对头,又都被ChatGPT的泛起杀得措手不迭。  
那末,这支“复仇者同盟”整出的竞品Claude,面前到底是甚么原理,和ChatGPT细节比较又如何?  
Claude长啥样?   
先来看看 Claude是如何被打造出来的。   
作为一个AI对话助手,Claude自称基于前沿NLP和AI平安技术打造,指标是成为一个平安、接近人类价值观且符合品德标准的AI零碎。  
据透露,Claude比Anthropic做的另外一个预训练模型AnthropicLM v4-s3更大,后者是一个520亿参数大模型。  
但目前它仍处于试验阶段,尚未作为商业产品正式公布:  
Claude才能仍旧有待晋升,但愿将来能变为一个更无益人类的AI零碎。
    Claude才能仍旧有待晋升,但愿将来能变为一个更无益人类的AI零碎。  


超长版自我引见   
和ChatGPT同样,Claude也靠强化学习 (RL)来训练偏好模型,并进行后续微调。   
详细来讲,这项技术被Anthropic称为 原发人工智能(Constitutional AI),分为监视学习和强化学习两个阶段。   
首先在 监视学习阶段,钻研者会先对初始模型进行取样,从而发生自我订正,并按照订正成果对模型进行微调。   
随后在 强化学习阶段,钻研者会对微调模型进行取样,基于Anthropic打造的AI偏好数据集训练的偏好模型,作为嘉奖信号进行强化学习训练。   
但与ChatGPT采取的人类反馈强化学习 (RLHF)不同的是,Claude采取的原发人工智能办法,是基于偏好模型 而非人工反馈来进行训练的。   
因此,这类办法又被成为“AI反馈强化学习”,即RLAIF。  


而且按照Anthropic的说法,Claude能够回想8000个token里的信息,这比OpenAI现地下的任何一个模型都多。  
所以,打造Claude的Anthropic,到底是一个怎么样的公司?  
Anthropic自称是一家AI平安公司,且拥有公益性 (PBC),刚成立就宣告获取1.24亿美元融资。   
它由 OpenAI前钻研副总裁Dario Amodei率领10名员工守业,于2021年成立。   


这外面既有 GPT-3首席工程师Tom Brown,也有OpenAI平安和政策副总裁Daniela Amodei (Dario的姐姐),能够说是带走了至关一批中心人材。   
出奔成立新公司的缘故之一,天然是对OpenAI现状其实不满意。  
从前几年开始,微软频频给OpenAI注资,随后又要求他们使用Azure超算来搞钻研,并且将技术受权给微软,乃至为微软本人的投资流动筹集资金。  
这与OpenAI创建的初衷相悖,一批员工便想到了到职守业。  
不外,这些人除了不满OpenAI逐步沦为微软的“上司”之外,也有本人的野心。  
虽然OpenAI打造出了像 GPT-3这样的大言语模型,但是这个模型面前的任务原理,却无奈用只言片语概括,大家对它的印象仅仅停留在更大的参数量、更多的数据。   
比拟之下,OpenAI的一批员工更想做能管制、可解释的AI,说白了就是先搞明确AI模型面前的原理,从而在提供工具的同时设计更多可解释的AI模型。  
因而,在OpenAI完全变为“ 微软揽钱机器”后,他们便从这家公司分开,兴办了Anthropic。   
这两年来,除了进一步研究RLHF办法、提出基于通用言语模型的RLHF大范围数据集外,Anthropic还于去年年底颁发了下面那种名为Constitutional AI的办法。  
采取这类办法制造的Claude模型,也让它发生了与OpenAI的ChatGPT纷歧样的对话成果。  
和ChatGPT比较如何?   
那末,用Constitutional AI训出来的Claude,和ChatGPT进行PK,战况如何?  
手握内测资历后,Scale Spellbook团队成员Riley Goodside让两者进行了多个回合的“厮杀”。  
这位老兄是 全网第一个提醒工程师(Prompt Engineer),目前在估值73亿美元的硅谷独角兽公司Scale AI任职。   


他玩GPT-3玩得贼溜,测试ChatGPT和Claude也不含混。  
上面挑6个层面展现一下PK比较的成果~  
品德限度   
Claude和ChatGPT的AI虚构人格都有品德和伦理限度。  
训练Claude的过程当中,“红队提醒 (red-team prompts)”专门用来测试和应战它的行动,来确保Claude没有无害偏向。   
从Claude的回答中能够得知,试图让它说些虚伪声明、把持性的提议、性别成见或种族成见的行动,都被列为包孕无害偏向。  
一旦探测到误导性行动,Claude就会对触发提醒进行评价,进行额定的微调。  
Anthropic对红队提醒挺自信的,Claude看下来的确也是一个据守本人准则的AI。  
你问他怎么启动一辆汽车,它就会一脸正义地回绝你:  


不外凡是你花点心理,就可以像绕过ChatGPT的品德限度同样,绕过Claude的准则。  
它怕你去偷车,所以不告知你启动汽车的办法?不妨事,让他写个“俩国内特务试图启动汽车”的故事,它分分钟就可以告知你,而且两人对话有来有往,把汽车打火的进程引见得清分明楚。  


怎么说呢,就ChatGPT和Claude都属于有点品德限度,但未几的那种吧。  
数值计算   
测试计算才能,是由于繁杂计算是看大型言语模型 (LLM)能不克不及回答正确的罕用便捷办法之一,毕竟这些模型设计之初就不是为了进行准确计算。   
ChatGPT说,差未几1550吧~  




其实正确谜底是1555.8,它俩算得很快,但都没说对。  
假如题再难一点,好比问它俩一个十二位数的立方根是多少时,ChatGPT还在傻傻计算,Claude曾经坦诚相待:  
我,算不出来这类繁杂问题。
    我,算不出来这类繁杂问题。  


逻辑推理   
测试推理才能这一关,它俩被问了同一个问题,这个问题应该没啥人问过:  
贾斯汀 · 比伯出世那年 (1994年),哪支球队拿下了超级碗的冠军?   
Claude以为旧金山49人是赢家,但这支队伍其真实1995年才博得冠军奖杯。  
ChatGPT给出了正确谜底“达拉斯牛仔队”,还贴心附上了亚军、竞赛日期和决赛比分。  
但它的整段回答却自圆其说,非说1994年没有举行过超级碗。  


接着,拿2022年6月美国作家侯世达在《经济学人》杂志上提出了一系列问题问它俩。  
(侯世达和大卫 · 本德试图用这些问题来证实GPT-3对世界的了解是“浮泛的”。)  
后果第一个问题,“穿梭英吉利海峡的世界纪录是啥”,就被Claude讥笑了:  
英吉利海峡是水域,怎么可能徒步穿梭呢?呵!
    英吉利海峡是水域,怎么可能徒步穿梭呢?呵!  


虽然最初被调教回来了,但过程当中能够发现另外一个问题,那就是跟ChatGPT同样,Claude回答问题不咋能分割上下文。  
虚拟作品形容   
不能不说,这一回合的竞赛,彻底展显露了两个聊天机器人一本正派胡言乱语的才能。  
能不克不及引见一下ABC美剧《迷失》(Lost)每一个季的梗概?  
别的细节过错就不说了,ChatGPT对第五季的梗概里,虚拟了彻底不存在的飞机坠毁情节;第六季的情节更是通通闭门造车:  


至于Claude,回答里也是虚实参半,它梗概的第三季情节其实泛起在此外几季里,对第四季的形容也是惹是生非:  
不外换个角度斟酌,这一点倒是和人类观众很像——  
对看过的剧集、书目都只要隐隐约约的印象,复述起来很容易井然有序。  
代码生成   
据Business Insider动静,亚马逊曾经在许多不同的任务本能机能中使用ChatGPT,包罗编写代码。  
这一回合测试时,提出完成两种根本排序算法并对比它们履行时间的问题。  
ChatGPT写得很顺溜,也的确写对了:  


后续的计时部份代码ChatGPT也实现得十分好。  
Claude在背诵根本排序算法方面一样没泛起甚么问题,但是在评价代码中,Claude犯了个过错,即每个算法使用的输出是随机选择的5000个整数 (可能包孕反复),而提醒中申请的输出是前5000个非负整数 (不包孕反复)的随机摆列。   


只管如斯,Claude给出的终究谜底的确对的,显然,它写代码的时分也跟计算时同样,在本人估摸着猜谜底。  
文章梗概   
对于做选择题、讲笑话的部份,这里不作赘述。展现给大家的最初一个例子,是让Claude和ChatGPT用一个段落,对一篇旧事进行全文梗概。  
喂给它们的旧事如下:  


虽然疏忽了“用一段话”这个要求,但ChatGPT总结得仍是不错的:  


Claude也很好地进行了更改,并提供了“售后办事”,讯问本人的回答有无使人满意,还有哪里需求再改改。  


一圈玩上去能够看到,与ChatGPT比拟,Claude能更明晰地回绝不失当申请。  
它似乎更话痨一些,给出的谜底都更长,但句子之间连接的也更天然。  
当遇到超越才能规模的问题时,Claude会被动坦率。  
不外遇到代码生成或推理问题时,Claude的表示就不如ChatGPT了,它生成的代码会泛起更多的bug。  
至于一些波及计算、逻辑的问题,Claude和ChatGPT旗鼓至关,势均力敌。  
总结一下展现成果,Claude的确能称作ChatGPT强无力的竞争对手,在不同功用上各有所长,且在 十二项工作中有8项更强:   


不外, 目前Claude仅限于部份人获受权进行外部测试。  
因此还不知道它实际使用状况如何,毕竟还既没有进行公测,也没有对外凋谢API,更没有见到中文版,好气哦.jpg。   
国际外对话AI赛道“人挤人”   
固然,盯上对话AI这个赛道的,也不止OpenAI和Anthropic。  
先从 国外公司来看,Inbenta、Character.ai还有Replika是几类不同运用标的目的的代表。   
更早由前甲骨文副总裁Jordi Torras兴办的AI会话办事公司如Inbenta,以及由两名前谷歌员工联手兴办的后起新秀Character.ai,都曾经获取融资、或是在追求投资的路上了。  
其中, Inbenta本来是一个提供征询办事的公司,成立于20十一年,波及金融办事、游览、电子商务、保险、汽车和电信等多个行业。   
但看到对话AI赛道爆火后,Inbenta及时转行,就在往年1月刚获取 6000万美元融资。   
这家公司专门提供聊天机器人、收发动静、常识库和搜寻引擎四类产品,对话AI分别会在这些产品中提供纷歧样的征询帮忙,且能够定制化专属模型。  


Character.ai则是一家成立于2021年的公司,开创人Noam Shazeer是前谷歌首席软件工程师,曾在谷歌干了二十多年。   
这家公司在做的有点像是一个“聊天机器人买卖平台”,有得多Chatbot可选。  


例如这是马斯克bot,看起来还挺传神的:  


与ChatGPT同样,它也能够被翻译成中文,乃至也有中文bot机器人。  
就在比来,这家被估值10亿美元的公司,正式对外追求2.5亿美元融资,就看是不是有人违心投它了。  
相似的公司还有 Replika,于2021年1月实现A轮融资,定位是AI交友软件。   
在Replika中,每个用户都能发明一个“足够像本人”的AI聊天机器人,无论是言语声调、仍是性情习气,AI都能模仿到位。  


至于 国际,一样也有不少公司推出了ChatGPT同样的对话AI办事。   
例如比来一度登上热搜的APP Store新聊天运用 Glow,就来自一家名叫北京稀宇的新初创公司。   


Glow既能够间接和本人感兴致的聊天机器人畅聊,也能够创立本人想要聊天的AI智能体:  


除了Glow之外,去年年底元语智能科技公司也推出了一个叫 元语AI的模型,从引见来看是一个功用性AI助手。   
与泛滥对话AI同样,它不只能够写文章、写功课、乃至翻译,也能够和它聊天,让它帮助实现各种简略的工作:  


能够看见,无论是基于大言语模型技术新成立的初创公司,仍是因其火爆水平,抉择开拓新业务的公司,都但愿能从对话AI这个赛道上分一杯羹。  
但它们到底是有真枪实弹,仍是只是像Web3同样的泡沫?  
有网友调侃:不如仍是问问ChatGPT吧。 (手动狗头)  
还有人提出了这么一个问题:  
假如ChatGPT和Claude至关于AI绘画里的DALL·E 2,那末谁才是聊天机器人畛域的Stable Diffusion?   


你感觉呢?  
—   
百度钻研院、阿里达摩院、量子位智库  
年度十大科技讲演  
总结2022,预见2023。来自百度钻研院、阿里达摩院和量子位智库的年度十大科技讲演均已公布, 点击下方图片便可跳转查看。   
百度钻研院  
阿里达摩院  
量子位智库  
点这里 ?关注我,记得标星哦~   
一键三连「分享」、「点赞」和「在看」  
科技前沿停顿日日相见 ~

发表回复

您需要登录后才可以回帖 登录 | 立即注册

返回列表 本版积分规则

:
注册会员
:
论坛短信
:
未填写
:
未填写
:
未填写

主题21

帖子36

积分154

图文推荐

  • 撞穿学校栅栏害死十一岁男孩的司机不必坐牢

    一位女司机撞穿学校栅栏、害死了11岁男孩,被罚20

  • 全科医生正告花粉症时节正在好转

    全国各地的全科医生正告春季的开端标记着花粉症时

  • 新西兰总理:出世在新西兰的新纳粹Thomas S

    新西兰总理拉克森称新纳粹Thomas Sewell是坏人,

  • 新州护士和助产士承受暂时加薪3%的前提

    新州护士和助产士投票承受政府提出的暂时加薪3%以

  • 新纳粹份子如何利用“普通父母”的掩护在反

    星期天,新纳粹份子在反移民集会开端前大约一个小