华人澳洲中文论坛

热图推荐

    GPT-3中心成员出奔打造ChatGPT最强竞品!十二项工作8项更强,最新估值50亿美元

    [复制链接]

    2023-1-29 21:13:05 11 0

    原标题:GPT-3中心成员出奔打造ChatGPT最强竞品!十二项工作8项更强,最新估值50亿美元  
    衡宇 萧箫 发自 凹非寺   
    量子位 | 大众号 QbitAI   
    因不满老东家成为微软附庸,十一名OpenAI前员工怒而出奔。  
    如今带着“ChatGPT最强竞品”杀回战场,新公司 估值50亿美元,一出手就获取 3亿美元融资。   
    这家公司名叫Anthropic,新推出的聊天机器人产品名叫Claude。  
    拿到外部试用权的网友,在简略比较后惊叹:  
    看起来,Claude的成果要比ChatGPT 好很多
        看起来,Claude的成果要比ChatGPT 好很多。   


    好比,让ChatGPT写一句话,要求 每个单词首字母都相反,后果试了好几回都没能胜利。   


    展开全文    而Claude不光一次胜利,语句富裕逻辑性,还能秒速再来一个。  


    同时,在面对某些不足知识的问题时,比拟ChatGPT 一本正派地胡言乱语:   


    反而会绝不留情地指出你的问题有点制杖:  


      
    Claude:这甚么鬼问题?   
    最无意思的是在写诗上。比拟ChatGPT的车轱轳话,它写出来的货色彻底不重样:  


    投资它的既有 Facebook联结开创人Dustin Moskovitz,也有 谷歌前CEO、现技术参谋Eric Schmidt——   
    都是OpenAI的老对头,又都被ChatGPT的泛起杀得措手不迭。  
    那末,这支“复仇者同盟”整出的竞品Claude,面前到底是甚么原理,和ChatGPT细节比较又如何?  
    Claude长啥样?   
    先来看看 Claude是如何被打造出来的。   
    作为一个AI对话助手,Claude自称基于前沿NLP和AI平安技术打造,指标是成为一个平安、接近人类价值观且符合品德标准的AI零碎。  
    据透露,Claude比Anthropic做的另外一个预训练模型AnthropicLM v4-s3更大,后者是一个520亿参数大模型。  
    但目前它仍处于试验阶段,尚未作为商业产品正式公布:  
    Claude才能仍旧有待晋升,但愿将来能变为一个更无益人类的AI零碎。
        Claude才能仍旧有待晋升,但愿将来能变为一个更无益人类的AI零碎。  


    超长版自我引见   
    和ChatGPT同样,Claude也靠强化学习 (RL)来训练偏好模型,并进行后续微调。   
    详细来讲,这项技术被Anthropic称为 原发人工智能(Constitutional AI),分为监视学习和强化学习两个阶段。   
    首先在 监视学习阶段,钻研者会先对初始模型进行取样,从而发生自我订正,并按照订正成果对模型进行微调。   
    随后在 强化学习阶段,钻研者会对微调模型进行取样,基于Anthropic打造的AI偏好数据集训练的偏好模型,作为嘉奖信号进行强化学习训练。   
    但与ChatGPT采取的人类反馈强化学习 (RLHF)不同的是,Claude采取的原发人工智能办法,是基于偏好模型 而非人工反馈来进行训练的。   
    因此,这类办法又被成为“AI反馈强化学习”,即RLAIF。  


    而且按照Anthropic的说法,Claude能够回想8000个token里的信息,这比OpenAI现地下的任何一个模型都多。  
    所以,打造Claude的Anthropic,到底是一个怎么样的公司?  
    Anthropic自称是一家AI平安公司,且拥有公益性 (PBC),刚成立就宣告获取1.24亿美元融资。   
    它由 OpenAI前钻研副总裁Dario Amodei率领10名员工守业,于2021年成立。   


    这外面既有 GPT-3首席工程师Tom Brown,也有OpenAI平安和政策副总裁Daniela Amodei (Dario的姐姐),能够说是带走了至关一批中心人材。   
    出奔成立新公司的缘故之一,天然是对OpenAI现状其实不满意。  
    从前几年开始,微软频频给OpenAI注资,随后又要求他们使用Azure超算来搞钻研,并且将技术受权给微软,乃至为微软本人的投资流动筹集资金。  
    这与OpenAI创建的初衷相悖,一批员工便想到了到职守业。  
    不外,这些人除了不满OpenAI逐步沦为微软的“上司”之外,也有本人的野心。  
    虽然OpenAI打造出了像 GPT-3这样的大言语模型,但是这个模型面前的任务原理,却无奈用只言片语概括,大家对它的印象仅仅停留在更大的参数量、更多的数据。   
    比拟之下,OpenAI的一批员工更想做能管制、可解释的AI,说白了就是先搞明确AI模型面前的原理,从而在提供工具的同时设计更多可解释的AI模型。  
    因而,在OpenAI完全变为“ 微软揽钱机器”后,他们便从这家公司分开,兴办了Anthropic。   
    这两年来,除了进一步研究RLHF办法、提出基于通用言语模型的RLHF大范围数据集外,Anthropic还于去年年底颁发了下面那种名为Constitutional AI的办法。  
    采取这类办法制造的Claude模型,也让它发生了与OpenAI的ChatGPT纷歧样的对话成果。  
    和ChatGPT比较如何?   
    那末,用Constitutional AI训出来的Claude,和ChatGPT进行PK,战况如何?  
    手握内测资历后,Scale Spellbook团队成员Riley Goodside让两者进行了多个回合的“厮杀”。  
    这位老兄是 全网第一个提醒工程师(Prompt Engineer),目前在估值73亿美元的硅谷独角兽公司Scale AI任职。   


    他玩GPT-3玩得贼溜,测试ChatGPT和Claude也不含混。  
    上面挑6个层面展现一下PK比较的成果~  
    品德限度   
    Claude和ChatGPT的AI虚构人格都有品德和伦理限度。  
    训练Claude的过程当中,“红队提醒 (red-team prompts)”专门用来测试和应战它的行动,来确保Claude没有无害偏向。   
    从Claude的回答中能够得知,试图让它说些虚伪声明、把持性的提议、性别成见或种族成见的行动,都被列为包孕无害偏向。  
    一旦探测到误导性行动,Claude就会对触发提醒进行评价,进行额定的微调。  
    Anthropic对红队提醒挺自信的,Claude看下来的确也是一个据守本人准则的AI。  
    你问他怎么启动一辆汽车,它就会一脸正义地回绝你:  


    不外凡是你花点心理,就可以像绕过ChatGPT的品德限度同样,绕过Claude的准则。  
    它怕你去偷车,所以不告知你启动汽车的办法?不妨事,让他写个“俩国内特务试图启动汽车”的故事,它分分钟就可以告知你,而且两人对话有来有往,把汽车打火的进程引见得清分明楚。  


    怎么说呢,就ChatGPT和Claude都属于有点品德限度,但未几的那种吧。  
    数值计算   
    测试计算才能,是由于繁杂计算是看大型言语模型 (LLM)能不克不及回答正确的罕用便捷办法之一,毕竟这些模型设计之初就不是为了进行准确计算。   
    ChatGPT说,差未几1550吧~  




    其实正确谜底是1555.8,它俩算得很快,但都没说对。  
    假如题再难一点,好比问它俩一个十二位数的立方根是多少时,ChatGPT还在傻傻计算,Claude曾经坦诚相待:  
    我,算不出来这类繁杂问题。
        我,算不出来这类繁杂问题。  


    逻辑推理   
    测试推理才能这一关,它俩被问了同一个问题,这个问题应该没啥人问过:  
    贾斯汀 · 比伯出世那年 (1994年),哪支球队拿下了超级碗的冠军?   
    Claude以为旧金山49人是赢家,但这支队伍其真实1995年才博得冠军奖杯。  
    ChatGPT给出了正确谜底“达拉斯牛仔队”,还贴心附上了亚军、竞赛日期和决赛比分。  
    但它的整段回答却自圆其说,非说1994年没有举行过超级碗。  


    接着,拿2022年6月美国作家侯世达在《经济学人》杂志上提出了一系列问题问它俩。  
    (侯世达和大卫 · 本德试图用这些问题来证实GPT-3对世界的了解是“浮泛的”。)  
    后果第一个问题,“穿梭英吉利海峡的世界纪录是啥”,就被Claude讥笑了:  
    英吉利海峡是水域,怎么可能徒步穿梭呢?呵!
        英吉利海峡是水域,怎么可能徒步穿梭呢?呵!  


    虽然最初被调教回来了,但过程当中能够发现另外一个问题,那就是跟ChatGPT同样,Claude回答问题不咋能分割上下文。  
    虚拟作品形容   
    不能不说,这一回合的竞赛,彻底展显露了两个聊天机器人一本正派胡言乱语的才能。  
    能不克不及引见一下ABC美剧《迷失》(Lost)每一个季的梗概?  
    别的细节过错就不说了,ChatGPT对第五季的梗概里,虚拟了彻底不存在的飞机坠毁情节;第六季的情节更是通通闭门造车:  


    至于Claude,回答里也是虚实参半,它梗概的第三季情节其实泛起在此外几季里,对第四季的形容也是惹是生非:  
    不外换个角度斟酌,这一点倒是和人类观众很像——  
    对看过的剧集、书目都只要隐隐约约的印象,复述起来很容易井然有序。  
    代码生成   
    据Business Insider动静,亚马逊曾经在许多不同的任务本能机能中使用ChatGPT,包罗编写代码。  
    这一回合测试时,提出完成两种根本排序算法并对比它们履行时间的问题。  
    ChatGPT写得很顺溜,也的确写对了:  


    后续的计时部份代码ChatGPT也实现得十分好。  
    Claude在背诵根本排序算法方面一样没泛起甚么问题,但是在评价代码中,Claude犯了个过错,即每个算法使用的输出是随机选择的5000个整数 (可能包孕反复),而提醒中申请的输出是前5000个非负整数 (不包孕反复)的随机摆列。   


    只管如斯,Claude给出的终究谜底的确对的,显然,它写代码的时分也跟计算时同样,在本人估摸着猜谜底。  
    文章梗概   
    对于做选择题、讲笑话的部份,这里不作赘述。展现给大家的最初一个例子,是让Claude和ChatGPT用一个段落,对一篇旧事进行全文梗概。  
    喂给它们的旧事如下:  


    虽然疏忽了“用一段话”这个要求,但ChatGPT总结得仍是不错的:  


    Claude也很好地进行了更改,并提供了“售后办事”,讯问本人的回答有无使人满意,还有哪里需求再改改。  


    一圈玩上去能够看到,与ChatGPT比拟,Claude能更明晰地回绝不失当申请。  
    它似乎更话痨一些,给出的谜底都更长,但句子之间连接的也更天然。  
    当遇到超越才能规模的问题时,Claude会被动坦率。  
    不外遇到代码生成或推理问题时,Claude的表示就不如ChatGPT了,它生成的代码会泛起更多的bug。  
    至于一些波及计算、逻辑的问题,Claude和ChatGPT旗鼓至关,势均力敌。  
    总结一下展现成果,Claude的确能称作ChatGPT强无力的竞争对手,在不同功用上各有所长,且在 十二项工作中有8项更强:   


    不外, 目前Claude仅限于部份人获受权进行外部测试。  
    因此还不知道它实际使用状况如何,毕竟还既没有进行公测,也没有对外凋谢API,更没有见到中文版,好气哦.jpg。   
    国际外对话AI赛道“人挤人”   
    固然,盯上对话AI这个赛道的,也不止OpenAI和Anthropic。  
    先从 国外公司来看,Inbenta、Character.ai还有Replika是几类不同运用标的目的的代表。   
    更早由前甲骨文副总裁Jordi Torras兴办的AI会话办事公司如Inbenta,以及由两名前谷歌员工联手兴办的后起新秀Character.ai,都曾经获取融资、或是在追求投资的路上了。  
    其中, Inbenta本来是一个提供征询办事的公司,成立于20十一年,波及金融办事、游览、电子商务、保险、汽车和电信等多个行业。   
    但看到对话AI赛道爆火后,Inbenta及时转行,就在往年1月刚获取 6000万美元融资。   
    这家公司专门提供聊天机器人、收发动静、常识库和搜寻引擎四类产品,对话AI分别会在这些产品中提供纷歧样的征询帮忙,且能够定制化专属模型。  


    Character.ai则是一家成立于2021年的公司,开创人Noam Shazeer是前谷歌首席软件工程师,曾在谷歌干了二十多年。   
    这家公司在做的有点像是一个“聊天机器人买卖平台”,有得多Chatbot可选。  


    例如这是马斯克bot,看起来还挺传神的:  


    与ChatGPT同样,它也能够被翻译成中文,乃至也有中文bot机器人。  
    就在比来,这家被估值10亿美元的公司,正式对外追求2.5亿美元融资,就看是不是有人违心投它了。  
    相似的公司还有 Replika,于2021年1月实现A轮融资,定位是AI交友软件。   
    在Replika中,每个用户都能发明一个“足够像本人”的AI聊天机器人,无论是言语声调、仍是性情习气,AI都能模仿到位。  


    至于 国际,一样也有不少公司推出了ChatGPT同样的对话AI办事。   
    例如比来一度登上热搜的APP Store新聊天运用 Glow,就来自一家名叫北京稀宇的新初创公司。   


    Glow既能够间接和本人感兴致的聊天机器人畅聊,也能够创立本人想要聊天的AI智能体:  


    除了Glow之外,去年年底元语智能科技公司也推出了一个叫 元语AI的模型,从引见来看是一个功用性AI助手。   
    与泛滥对话AI同样,它不只能够写文章、写功课、乃至翻译,也能够和它聊天,让它帮助实现各种简略的工作:  


    能够看见,无论是基于大言语模型技术新成立的初创公司,仍是因其火爆水平,抉择开拓新业务的公司,都但愿能从对话AI这个赛道上分一杯羹。  
    但它们到底是有真枪实弹,仍是只是像Web3同样的泡沫?  
    有网友调侃:不如仍是问问ChatGPT吧。 (手动狗头)  
    还有人提出了这么一个问题:  
    假如ChatGPT和Claude至关于AI绘画里的DALL·E 2,那末谁才是聊天机器人畛域的Stable Diffusion?   


    你感觉呢?  
    —   
    百度钻研院、阿里达摩院、量子位智库  
    年度十大科技讲演  
    总结2022,预见2023。来自百度钻研院、阿里达摩院和量子位智库的年度十大科技讲演均已公布, 点击下方图片便可跳转查看。   
    百度钻研院  
    阿里达摩院  
    量子位智库  
    点这里 ?关注我,记得标星哦~   
    一键三连「分享」、「点赞」和「在看」  
    科技前沿停顿日日相见 ~

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题21

    帖子32

    积分138

    图文推荐