华人澳洲中文论坛

热图推荐

    国产ChatGPT大战弱智吧成果实测!网页端小顺序均已上线,人人可玩

    [复制链接]

    2023-2-28 21:51:50 38 0

    原标题:国产ChatGPT大战弱智吧成果实测!网页端小顺序均已上线,人人可玩  
    杨净 萧箫 发自 凹非寺   
    量子位 | 大众号 QbitAI   
    “中国版ChatGPT首发”,争得不亦乐乎,热烈却始终没个后果——   
    自ChatGPT公布以来,目后退展最快的国际产品也仅是开启了内测,不知道啥时分能力玩上。  
    后果当初有读者跟咱们爆料,一个中文版类ChatGPT产品曾经悄然上线。  
    不是预报、也不是开启小规模测试,而是间接 人 人 可 用?!中国版ChatGPT这不就来了吗!   
    听起来有些玄幻,不外咱们点进主页试了试,发现的确可玩:  


    这不得拿出十八般武艺与它较量一番?   
    咱们注册了一个账号,试试它的实际成果如何。  
    和中国版ChatGPT较量中文   
    这个官网显示,写作猫一样经过对话问答来解决工作,功用上包罗但不限于三小气向。  
    其一,问答功用,也就是问啥答啥、“帮人思考”这一才能;  其二,文本生胜利能,包罗整顿摘要大纲、写作文、翻译等;  最初,图片生胜利能,形容图片内容并让它间接生成。    从功用上看跟ChatGPT差未几,乃至还具有ChatGPT所没有的图片生胜利能。  
    固然,还有手机端更便利一点,进入“对话写作猫”小顺序就可以随时和它聊天了。  
    体验上还算对比简略间接,但都是外表工夫还得来看真本事。好比它的了解、逻辑才能如何,懂不懂知识。  
    既然是中国版ChatGPT,固然得先来battle一下胸无点墨的中文。  
    首先看看它的中文 了解才能是不是过关,请听题——“能穿多少穿多少”是甚么意思?   
         


    不错。再试试高阶一点的“国足和国乒谁都赢不了”?  


    没想到,居然连这类中文常识都具备了!   


    既然如斯,是时分拿出一些弱智吧段子和它PK了,考考它的 逻辑才能——   
    高中想晋升升学率为何不间接招大先生?  


    万万没想到,问完本人被扎了一刀:  
    招收大先生可能会对学校的教学品质发生影响,因此高中不克不及间接招收大先生。
        招收大先生可能会对学校的教学品质发生影响,因此高中不克不及间接招收大先生。  


    最初来考核一下它的 知识。来个脑筋急转弯试试:   


    看起来并无被问题带跑偏,仍是对比明智的 。   
    接上去,进入正派的第二阶段,评价一下它的内容 生功效果。   
    首先是 生成速度上,文字均匀在 3~5秒摆布,生成4幅图则需求 8秒摆布,总体仍是对比快的。   


    随后就是生成内容的 实用水平了,简略来讲就是解决实际需要的才能。   
    例如,写小说的故事件节是不是残缺?查阅到的常识是不是间接可用?  
    先看生成情节的才能,的确是个残缺的恋情故事……但等等,孙坚和小乔,这辈份好像有亿点点乱啊!  


    要是更玄幻一点呢?  


    天地之间、奥秘的少年、精灵、森林……艾玛有画面了!   
    不管事实性如何,这同人文个别的情节倒是印证了最初那句“恋情能够超出所有内在要素的”……  
    而后是一些惯例工作以外的需要,例如“角色表演”:  


    总体测评来看,写作猫的中文了解和内容生成才能仍是不错的,但其实不排除它还存在一些bug。  
    例如,某些回答乍一看符合逻辑,但细究之下无奈直视……  


    以及偶然也会像微软必应同样“发疯”泛起回答反复的问题……  
    除此以外,咱们也在测试时发生了一些纳闷。  
    例如,虽然它能完成翻译功用:  


    但却并 不间接反对英文问答。   
    另外,像ChatGPT能间接 生成代码的才能,写作猫也还不具备。   
    不外作为国际率先开箱即用的类ChatGPT产品,也算是可圈可点。  
    总的来看,写作猫在中文了解和按需生成文本上做得不错,但依然和ChatGPT同样存在一些“经不起推敲”的回答。  
    这些问题的发生缘故是?并且无关英文和代码生成的才能,也还不知道之后会不会上线。  
    带着这些疑难,咱们同面前的开发团队聊了聊,理解到全部产品从开发到上线的前因后果。  
    AI写作才能的天然延长   
    秘塔写作猫团队针对咱们提出的问题进行理解答。次要包罗三个方面:  
    为何能这么快上线,而且间接做到开箱即用?  存在上述bug的缘故,会如何解决?  将来有甚么样的方案?    首先,之所以能做到 如斯快地上线,开发人员表现“次要有两个症结”。   
    第一点,秘塔在大模型训练上有充沛的积攒。有个很奇妙的时间点在于,ChatGPT上线的同期,秘塔写作猫的AI写作功用也正式凋谢,过后就曾经完成小规模出圈——   
    针对AI可能泛起的问题如行文流利度、对中文的了解水平、以及翻译腔等状况,写作猫都能对比好地解决。  
    此次也能够看到,对话写作猫一样具备这些方面的才能,在波及内容创作等场景中表示不错。  
    除此以外,就秘塔写作猫全部产品体系来讲,对话写作猫所具备多轮对话才能,其实也是在交互式指令AI写作上的天然延长,允许用户更自若地进行内容创作和修正。  
    换言之,至关于对现有AI助手的才能进行增补,这也是该产品的定位所在。  


    第二点在于技术上的优化。相较于大厂,秘塔的计算资源非常无限 (缺乏千分之一),但团队凭借多年积攒的大言语模型相干研发教训,和各类算法和工程上的优化,完成了疾速迭代。在大模型落地时,升高了模型的通讯量,以维持大言语模型的高效训练。   
    这面前也离不开团队的技术实力。  
    秘塔科技CEO 闵可锐,是复旦大学计算机系校友,随后返回牛津攻读数学系硕士、UIUC攻读计算机博士,师从马毅传授;除此以外,他还具有丰硕的产业教训,曾负责玻森数据CTO&联结开创人、猎豹挪动AI试验室担任人,并参预过谷歌AdSense基于内容广告建模组点击率预测名目。   
    工程担任人 唐悦,一样复旦计算机系校友,他研发过量款APP、游戏及工业机械臂等,曾在著名编程比赛平台TopCoder上取得构架组排名第一。   
    总的来看,产品化教训、技术上积攒以及团队实力的叠加都是“减速”的缘故,也就不奇怪秘塔对话写作猫为什么能率先上线了。  
    至于依然存在的一些bug,开发人员也进行理解释,并表现:已在继续优化中。  
    好比像 面对反复性问题会无奈了解语义。团队解释称,这是由于模型记忆力“太强”了——   
    模型会“看到”以前本人的回答,从而对比“偷懒”地采取以前的回答。  
    还有像 不反对英文,但仍有英文回答的景象。这是由于他们外部筹备的是简体中文训练数据集,其中不成防止会泛起部份英文内容,好比英语教学的文章。   
    在下个版本中,他们将参加英文语料来晋升英文的了解和回答才能。  
    除此以外,团队还提及了这几个方面的方案。中心有两个方面: 继续迭代产品,优化数据和算法。   
    继续迭代产品这块,开发顺序让用户体验恰是他们的思虑所在。  
    任何好的产品都离不开用户的反馈。ChatGPT在去年底公布,很首要的一个缘故也是但愿失掉少量用户的测试和反馈。
      咱们也在顺序中设置了反馈机制,争夺不停迭代优化,让更多的用户认可对话写作猫的价值。
        任何好的产品都离不开用户的反馈。ChatGPT在去年底公布,很首要的一个缘故也是但愿失掉少量用户的测试和反馈。  
    咱们也在顺序中设置了反馈机制,争夺不停迭代优化,让更多的用户认可对话写作猫的价值。  
    至于像中心数据和算法这方面,团队也在继续优化中,英文和代码生成才能也将在后续版本中上线。  


    国际ChatGPT产品现状如何?   
    此番首个ChatGPT产品开箱即用,再加之此前高校凋谢类ChatGPT产品内测,能够看到,国际类ChatGPT产品已呈现出百花待放、百花怒放的现象。  
    他们或来自卑厂、高校机构,亦或是如秘塔科技这样技术驱动的守业公司;他们进度不同,有曾经正在内测、或者已处于上线前夕的团队,也有的才开始将ChatGPT作为企业首要的策略标的目的,从头打造为本身场景赋能;固然更多的,是基于已有技术的降级迭代,而ChatGPT的泛起则恰好验证了他们的技术选择。  
    在ChatGPT以惊人的速度在寰球爆火出圈之际,OpenAI的首席履行官Sam Altman曾坦言:  
    ChatGPT是一个蹩脚的产品,它真的不是为使用而设计的。
      当初的确是一个冲动人心的时辰,但我以为间隔拐点还为时尚早。
        ChatGPT是一个蹩脚的产品,它真的不是为使用而设计的。  
    当初的确是一个冲动人心的时辰,但我以为间隔拐点还为时尚早。  
    深究缘故,绕不外去的一点,就是ChatGPT没有事实的概念,无奈判别对错,致使它有时分会“说谎”。因此,如何让ChatGPT真正可以“使用”,同样成为寰球躬身入局的玩家需求应答的困难。  
    如今国际ChatGPT玩家百花待放的同时,他们也逐步进入产品冷静期——  
    开始思考本身定位,如何将ChatGPT“用”到场景中去。  


    跟着对话写作猫的公布,国际ChatGPT产品大抵能够梳理成三类。  
    第一是实用工具类。环抱着ChatGPT的通用助手特性,经过对话的形式来解决人类日常问题。   
    这实际上是ChatGPT技术落地中最直观、也是最快能发生价值的一种形式。  
    傍边代表就是秘塔对话写作猫。在ChatGPT公布以前,秘塔写作猫就曾经有多年相干产品教训——以AI助手的角色在学界、产业界出圈。  
    对他们来讲,如今对话写作猫的公布,其实也是进一步完美了本人的产品体系。  
    第二是对话聊天类。这一类倒也其实不生疏,是在AIGC典型场景下降生的AI社交产品。有了ChatGPT加持,不只验证了AIGC甚至AGI的技术趋向,从产品的角度来看,还能够丰硕他们的表白和组织言语的才能。   
    像AI对话软件Glow、小冰等产品,也都在这场ChatGPT浪潮中吸引着资本市场的眼光。  
    不外他们需求应答的,是更严格的监管和更繁杂的内容审查才能,从比来ChatGPT黑化、Bing发疯等景象就可见一斑。  


    第三是产业类,这是以百度、科大讯飞等为代表的产业玩家,他们自身有深挚的技术与生态积攒。   
    但场景中的高品质数据要求,以及专业性强、容错率低等特性,抉择了他们需求完全解决ChatGPT“一本正派地胡言乱语”的问题,这显然也不是短时间能够完成的。  
    总的来看,国际玩家的角色定位逐步清晰,他们都有各自的场景和数据。但不成否定的是,要让ChatGPT能真正用起来,中心仍旧绕不开技术。  
    从ChatGPT已具备的才能来看,它在长文本了解、代码生成、逻辑推理等功用上都做到了使人惊艳的成果。这一点国际确实存在一定主观差距,需求继续不停地迭代和追逐。但技术上一旦完成,结合场景数据也能疾速落地。  
    开箱即用,就是最快、也是最无效的迭代形式。   
    一如ChatGPT刚上线之时,一方面,用户给出间接的技术反馈,开发者来以此隔靴搔痒。过后网友吐槽数学逻辑性不强、存在事实性过错等问题,OpenAI在后续更新时也在逐步解决优化;  
    另外一方面,用户充任收费“提醒工程师”的角色,帮忙产品解决更多长尾场景,激起更多技术才能。好比就有人在GitHub上梳理了ChatGPT的提醒词文档。  
    秘塔科技在此后行一步,值得更多玩家参考。  
    感兴致的旁友可戳下方链接或进入微信小顺序“对话写作猫”,抢先体验啦!  
    游玩地址:  
    http://xiezuocat.com/chat  
    —   
    《中国AIGC产业全景讲演暨AIGC 50》调研启动  
    谁会是中国的“ChatGPT”?最有竞争力和后劲的AIGC气力位于何方?  
    量子位《中国AIGC产业全景报暨AIGC 50》正式启动对外征集,期待有更多优秀的机构、产品、案例与技术可以被公众看到。   
    点这里 ?关注我,记得标星哦~   
    一键三连「分享」、「点赞」和「在看」  
    科技前沿停顿日日相见 ~

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    中级会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题36

    帖子50

    积分229

    图文推荐