华人澳洲中文论坛

热图推荐

    上手ChatGPT威力增强版后,我发现它很强,但也有点拉。。。

    [复制链接]

    2023-3-16 09:48:19 34 0

    原标题:上手ChatGPT威力增强版后,我发现它很强,但也有点拉。。。  
    明天早晨,OpenAI 公布了最新的 GPT-4。   
    按照公布会披露的内容来看,这个新一代比新近大家使用的 ChatGPT 的 GPT-3.5 内核 强悍了一大截,再次刷新了编纂部对 AI 的认知。   
    首先,十分十分首要的一点是, GPT-4 能够承受文字之外的内容输出了,目前反对文字与图象的混合输出。  
    在民间的示例中,用户给 GPT-4 上传了一张梗图,问 GPT-4 这张图为何可笑:  


    GPT-4 十分具体且精准地形容出了图片上的内容。  
    而且有思惟条理的解释了,为何这张图会让人感觉可笑。  


    这还不算完,就算是非常笼统的 Meme,它也能一本正派地给你解释笑点在哪里。   


         


    GPT-4 给出的网页以及代码   


    虽然这个示例里的网站十分简略,但 GPT-4 的了解才能和发明力仍是让人感觉不成思议:  
    首要的不是它能不克不及做得很好,而是它能做到,这是一个质的奔腾。   
    乃至,目前曾经有公司在搞这项技术的落地运用,打算把它和导盲办事结合起来。  
    这样一来,盲人只需求拍张照,GPT-4 就可以当即复述露面前物品的信息。  


    而在文字问答方面,GPT-4 也有十分大的晋升,输出字减少到了 2.5 万。  
    在专业畛域上的回答, 特别是 “ 问题繁杂度足够高的时分……GPT-4 比老版本更细、更可托、更富裕发明力 ”。  
    好比,在一致律师考试( Uniform Bar Exam )中,GPT-4 能够超过 90% 的人类考生,而老版本只能超过 10% 的人类考生,妥妥学渣学霸的区分。  
    在 GRE 数学和语文 ( 浏览与填空 )考试中 ,GPT-4 的考试成就 曾经是哈佛、麻省理工、斯坦福大先生的程度了。  


    不只本人回答问题才能变强了,GPT-4 还会人格表演。  
    好比你提出一个问题,ChatGPT 只会机械式地回答,而 GPT-4 能够按你的要求 以苏格拉底格调给你作答。  
    那这个弄法就多了呀。   
    向下滑动▼  






    不外,说了这么多,百闻不如一试。  
    即便曾经是早晨 2 点,编纂部仍旧花重金( 20 美元/月 ),连夜让美国共事帮助降级试用了一波。  
    遗憾的是,OpenAI 斟酌到用户们搞幺蛾子的才能太狠,所以目前 GPT-4 的 图片输出功用临时不合错误大众凋谢,也没有说啥时分能够用上。  


    不外,咱们仍是能够试试它聪明的小脑瓜子。  
    先是给了一个全网疯传的“ 华为、阿里入职面试题 ”,应战大获胜利。   
    而隔壁的 ChatGPT 就有点拉了。  


    作为击败了 90% 人类的大律师,GPT-4 的推理才能应该强无敌吧。  
    所以咱们又搞了道法考的经典案件,想掂量掂量 GPT-4 究竟有几斤几两。   
    问:乙去甲家吃饭,后果电动车被偷了。因而乙筹备偷辆他人的电动车,此时,喝醉的甲来帮助撬锁,帮乙胜利到手。后果考察后发现,乙偷的是甲的电动车,问甲算不算是偷盗罪?  
    虽然新旧两款论断都是正确的,然而旧版的解题进程,就有点乱来了。。  


    而在一些 更需求 “ 发明性 ” 或是 “ 思考 ” 的问题,好比:   
    对于比来一次特斯拉投资者大会上 “ 完成寰球可继续动力 ” 的方案,你感觉是可行的吗?为何可行?  
    GPT-4 的表示就更让人吃惊了。  
    虽然 GPT-4 的常识库停留在 2021 年 9月,并无掩盖半个月前的那场投资者大会, 但它却神奇地料事如神了。  


    而老版本 ChatGPT 的回答就逊色了得多,没有条理,还有一堆车轱轳话,没有建立性观念。   


    随后,咱们又问了一个行业思考相干的问题:  
    你如何对待寰球的碳排放策略,它能胜利吗?  
    老版只能浮于外表抽象地给点泛泛的概念,而 GPT-4 的回答显著 维度更宽、思考更深,洋洋洒洒列了 10 点,更为粗疏有条理,而且含有更多专业辞汇与内容,能够说简直完善地回答了这个问题。   


    下面这些,还仅仅只是咱们编纂部的实验,在一些大佬们手上,GPT-4 使人恐怖的表示就更多了。  
    好比仅仅只用了 60 秒,就做出了一款 Pong 游戏,20 秒就可以做出贪吃蛇游戏。   


    不成否定,GPT-4 比起旧版来讲,强的不是一点半点。不外咱们试出来的问题,其实也不少。  
    咱们搞了套 高中数学比赛试卷来考它,后果,一试就为难了。。 第一道选择题,新旧两个版本就都解错了。   
    莫非说,斯坦福、麻省理工还不如。。?   


    由于 GPT-4 能够反对更长的输出文本,所以咱们就又测试了它的总结概括才能。  
    这下馅露得更大了。  
    咱们甩给它的是,差评君以前发过的一篇文章的链接,其实 GPT-4 是没有联网的,正常来讲是没法总结的。  
    后果,它愣是 闭门造车了两个文章总结,并且和咱们给的文章没有任何瓜葛。   
    直到在我重复斧正两次,语气都减轻了,它才抵赖本人的过错。  


    说瞎话,这个胡编乱造的才能让咱们心里一惊,因而就又想了个测试办法。  
    前两天,小黑胖把“ 手拿把攥 ”记混成“ 手拿把蒜 ”,被编纂部讥笑了很久,因而咱们就问 GPT-4 “ 手拿把蒜甚么意思?”  
    后果牛掰了,GPT-4 无理解了一部份“ 把蒜(攥)”是描述事件轻而易举的根底上,旁征博引地胡编乱造,很有种当年我写作文时,援用的俄罗文雅学家“ 沃兹基索德 ”的滋味了。  
    要知道,假如是实在场,这个半真半假、援用权威的胡言乱语的结果将是十分重大的,可谓最初级的谣言。  


    明明连更老的 ChatGPT 也不敢这么伪造来源地胡说,更初级的 GPT-4 怎么会这样呢?  
    咱们猜测,就是由于 新版本更偏向于表示出 “ 更拥有深度思考 ”,这么一来,在回答得多问题的时分,GPT-4 会本人给本人加戏,才会泛起这些闹剧   
    虽然咱们试了这么多破绽,但总的来说,这次公布的 ChatGPT,无论是根底功用、想象空间、逻辑才能、思考才能,都比以前强了一大截。   
    明明间隔老版本 ChatGPT 推翻咱们的认知才没几个月,它们就又取出了一个船新版本,咱们只能说:  
    恐惧如此。  
    更恐惧的是,其实 GPT-4 降生时间,可能比咱们想的还要早得多,以前 OpenAI 公布基于 GPT-3.5 的 ChatGPT 时,外部员工就质疑过为啥发个这么古早的版本。  
    而咱们也早就接触过 GPT-4 了,New Bing 民间明天发了个布告,抵赖了 New Bing 其实就是 GPT-4。  


    所以这么说的话,有无种可能,GPT-5 也曾经近了呢?  
    我曾经开始期待除了文字、图片之外,视频、音频等方式的输出了。  
    撰文: 大饼 & 小陈 & 四大 & 八戒编纂:面线 & 江江封面:萱萱  
    图片、材料来源:  
    OpenAI、New Bing 官网、Twitter、Be My Eyes  
    New York Times:How ChatGPT Kicked Off an A.I. Arms Race  
    假如您感觉本文写的还不错  
    欢送关注差评孵化的商业财经类账号:知危( ID:BusinessAlert )

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题28

    帖子37

    积分174

    图文推荐