上手ChatGPT威力增强版后，我发现它很强，但也有点拉。。。

逍遥浪子

原标题：上手ChatGPT威力增强版后，我发现它很强，但也有点拉。。。
明天早晨，OpenAI 公布了最新的 GPT-4。
按照公布会披露的内容来看，这个新一代比新近大家使用的 ChatGPT 的 GPT-3.5 内核 强悍了一大截，再次刷新了编纂部对 AI 的认知。
首先，十分十分首要的一点是， GPT-4 能够承受文字之外的内容输出了，目前反对文字与图象的混合输出。
在民间的示例中，用户给 GPT-4 上传了一张梗图，问 GPT-4 这张图为何可笑：

GPT-4 十分具体且精准地形容出了图片上的内容。
而且有思惟条理的解释了，为何这张图会让人感觉可笑。

这还不算完，就算是非常笼统的 Meme，它也能一本正派地给你解释笑点在哪里。

GPT-4 给出的网页以及代码 ▼

虽然这个示例里的网站十分简略，但 GPT-4 的了解才能和发明力仍是让人感觉不成思议：
首要的不是它能不克不及做得很好，而是它能做到，这是一个质的奔腾。
乃至，目前曾经有公司在搞这项技术的落地运用，打算把它和导盲办事结合起来。
这样一来，盲人只需求拍张照，GPT-4 就可以当即复述露面前物品的信息。

而在文字问答方面，GPT-4 也有十分大的晋升，输出字减少到了 2.5 万。
在专业畛域上的回答， 特别是 “ 问题繁杂度足够高的时分……GPT-4 比老版本更细、更可托、更富裕发明力 ”。
好比，在一致律师考试（ Uniform Bar Exam ）中，GPT-4 能够超过 90% 的人类考生，而老版本只能超过 10% 的人类考生，妥妥学渣学霸的区分。
在 GRE 数学和语文（浏览与填空）考试中，GPT-4 的考试成就 曾经是哈佛、麻省理工、斯坦福大先生的程度了。

不只本人回答问题才能变强了，GPT-4 还会人格表演。
好比你提出一个问题，ChatGPT 只会机械式地回答，而 GPT-4 能够按你的要求 以苏格拉底格调给你作答。
那这个弄法就多了呀。
向下滑动▼

不外，说了这么多，百闻不如一试。
即便曾经是早晨 2 点，编纂部仍旧花重金（ 20 美元/月），连夜让美国共事帮助降级试用了一波。
遗憾的是，OpenAI 斟酌到用户们搞幺蛾子的才能太狠，所以目前 GPT-4 的 图片输出功用临时不合错误大众凋谢，也没有说啥时分能够用上。

不外，咱们仍是能够试试它聪明的小脑瓜子。
先是给了一个全网疯传的“ 华为、阿里入职面试题 ”，应战大获胜利。
而隔壁的 ChatGPT 就有点拉了。

作为击败了 90% 人类的大律师，GPT-4 的推理才能应该强无敌吧。
所以咱们又搞了道法考的经典案件，想掂量掂量 GPT-4 究竟有几斤几两。
问：乙去甲家吃饭，后果电动车被偷了。因而乙筹备偷辆他人的电动车，此时，喝醉的甲来帮助撬锁，帮乙胜利到手。后果考察后发现，乙偷的是甲的电动车，问甲算不算是偷盗罪？
虽然新旧两款论断都是正确的，然而旧版的解题进程，就有点乱来了。。

而在一些 更需求 “ 发明性 ” 或是 “ 思考 ” 的问题，好比：
对于比来一次特斯拉投资者大会上 “ 完成寰球可继续动力 ” 的方案，你感觉是可行的吗？为何可行？
GPT-4 的表示就更让人吃惊了。
虽然 GPT-4 的常识库停留在 2021 年 9月，并无掩盖半个月前的那场投资者大会， 但它却神奇地料事如神了。

而老版本 ChatGPT 的回答就逊色了得多，没有条理，还有一堆车轱轳话，没有建立性观念。

随后，咱们又问了一个行业思考相干的问题：
你如何对待寰球的碳排放策略，它能胜利吗？
老版只能浮于外表抽象地给点泛泛的概念，而 GPT-4 的回答显著 维度更宽、思考更深，洋洋洒洒列了 10 点，更为粗疏有条理，而且含有更多专业辞汇与内容，能够说简直完善地回答了这个问题。

下面这些，还仅仅只是咱们编纂部的实验，在一些大佬们手上，GPT-4 使人恐怖的表示就更多了。
好比仅仅只用了 60 秒，就做出了一款 Pong 游戏，20 秒就可以做出贪吃蛇游戏。

不成否定，GPT-4 比起旧版来讲，强的不是一点半点。不外咱们试出来的问题，其实也不少。
咱们搞了套 高中数学比赛试卷来考它，后果，一试就为难了。。 第一道选择题，新旧两个版本就都解错了。
莫非说，斯坦福、麻省理工还不如。。？

由于 GPT-4 能够反对更长的输出文本，所以咱们就又测试了它的总结概括才能。
这下馅露得更大了。
咱们甩给它的是，差评君以前发过的一篇文章的链接，其实 GPT-4 是没有联网的，正常来讲是没法总结的。
后果，它愣是 闭门造车了两个文章总结，并且和咱们给的文章没有任何瓜葛。
直到在我重复斧正两次，语气都减轻了，它才抵赖本人的过错。

说瞎话，这个胡编乱造的才能让咱们心里一惊，因而就又想了个测试办法。
前两天，小黑胖把“ 手拿把攥 ”记混成“ 手拿把蒜 ”，被编纂部讥笑了很久，因而咱们就问 GPT-4 “ 手拿把蒜甚么意思？”
后果牛掰了，GPT-4 无理解了一部份“ 把蒜（攥）”是描述事件轻而易举的根底上，旁征博引地胡编乱造，很有种当年我写作文时，援用的俄罗文雅学家“ 沃兹基索德 ”的滋味了。
要知道，假如是实在场，这个半真半假、援用权威的胡言乱语的结果将是十分重大的，可谓最初级的谣言。

明明连更老的 ChatGPT 也不敢这么伪造来源地胡说，更初级的 GPT-4 怎么会这样呢？
咱们猜测，就是由于 新版本更偏向于表示出 “ 更拥有深度思考 ”，这么一来，在回答得多问题的时分，GPT-4 会本人给本人加戏，才会泛起这些闹剧。
虽然咱们试了这么多破绽，但总的来说，这次公布的 ChatGPT，无论是根底功用、想象空间、逻辑才能、思考才能，都比以前强了一大截。
明明间隔老版本 ChatGPT 推翻咱们的认知才没几个月，它们就又取出了一个船新版本，咱们只能说：
恐惧如此。
更恐惧的是，其实 GPT-4 降生时间，可能比咱们想的还要早得多，以前 OpenAI 公布基于 GPT-3.5 的 ChatGPT 时，外部员工就质疑过为啥发个这么古早的版本。
而咱们也早就接触过 GPT-4 了，New Bing 民间明天发了个布告，抵赖了 New Bing 其实就是 GPT-4。

所以这么说的话，有无种可能，GPT-5 也曾经近了呢？
我曾经开始期待除了文字、图片之外，视频、音频等方式的输出了。
撰文： 大饼 & 小陈 & 四大 & 八戒编纂：面线 & 江江封面：萱萱
图片、材料来源：
OpenAI、New Bing 官网、Twitter、Be My Eyes
New York Times：How ChatGPT Kicked Off an A.I. Arms Race
假如您感觉本文写的还不错
欢送关注差评孵化的商业财经类账号：知危（ ID:BusinessAlert ）

华人澳洲中文论坛

热图推荐

上手ChatGPT威力增强版后，我发现它很强，但也有点拉。。。

发表回复

逍遥浪子
关注TA

图文推荐

华人澳洲中文论坛

热图推荐

上手ChatGPT威力增强版后，我发现它很强，但也有点拉。。。

发表回复

逍遥浪子 关注TA

图文推荐

逍遥浪子
关注TA