谷歌报复性砸出5620亿参数大模型！比ChatGPT更恐惧，机器人都能用，学术圈已刷屏

qiuqiuqiu

原标题：谷歌报复性砸出5620亿参数大模型！比ChatGPT更恐惧，机器人都能用，学术圈已刷屏
明敏发自凹非寺
量子位 | 大众号 QbitAI
为应答新一轮技术比赛，谷歌还在不停出背工。
这两天，一个名叫 PaLM-E的大模型在AI学术圈疯狂刷屏。

它能只需一句话，就让机器人去厨房抽屉里拿薯片。

即使是半途搅扰它，它也会坚持履行工作。

   PaLM-E具有 5620亿参数，是GPT-3的三倍多，号称史上最大范围视觉言语模型。而它面前的打造团队，恰是谷歌和柏林工业大学。
作为一个能处置多模态信息的大模型，它还兼具十分强的逻辑思惟。
好比能从一堆图片里，判别出哪一个是能转动的。

还会看图做算数：

详细才能方面，PaLM-E表示出了对比强的逻辑性。
好比给它一张图片，而后让它按照所看到的做出蛋糕。
模型能先判别出图象中都有甚么，而后分红9步讲了该如何制造蛋糕，从最后的磕鸡蛋到最初洗碗都包罗在内。
有人还调侃说，这机器人怎么在把蛋糕给我前先本人吃了？
还有按照图片做判别：我能在这条路上骑自行车吗？
模型进行一系列逻辑推断：
1、不克不及进入
  2、除了自行车
  3、除了自行车之外都不克不及进入
  4、谜底是能够
1、不克不及进入
2、除了自行车
3、除了自行车之外都不克不及进入
4、谜底是能够

并且他们还发现，言语模型的范围越大，它终究能放弃的言语了解才能越强。
好比使用5400亿参数范围的PaLM时，PaLM-E在言语工作上的实际才能仅降落了3.9%。

从试验后果来看，PaLM-E在OK-VQA基准上达到新SOTA。

在摹拟环境下的工作实现度也都不错。
再次验证鼎力出奇观
目前这项钻研已诱发十分普遍的探讨。
次要在于下列几个方面：
1、一定水平上验证了“鼎力出奇观”
2、比ChatGPT更接近AGI？
一方面，作为目前已知的范围最大的视觉言语模型，PaLM-E的表示曾经足够惊艳了。
去年，DeepMind也公布过一个通才大模型Gota，在604个不同的工作上承受了训练。
但过后有得多人以为它其实不算真正意义上的通用，由于钻研无奈证实模型在不同工作之间产生了正向迁徙。
论文作者表现，这也许是由于模型范围还不敷大。
如今，PaLM-E似乎实现了这一论证。

另外一方面，是从大趋向下去看。
有人表现，这项任务看下来要 比ChatGPT更接近AGI啊。
确实，用ChatGPT还只是提供文字倡议，得多详细入手的事还要本人来。
但PaLM-E属于把大模型才能拉入到具象化层面，AI和物理世界之间的结界要被打破了。
并且这个趋向显然也是大家都在揣摩的，微软前不久也公布了一项十分类似的任务——让ChatGPT指挥机器人。
除此以外，还有得多人表现，这再一次验证了多模态是将来。
不外，这项效果当初只要论文和demo公布，真正才能有待验证。
另外还有人发现，模型驱动的机器人，面前的开发团队在几周前被谷歌一锅端了。。。
所以对于PaLM-E的更多后续，我们还得再蹲蹲看。
论文地址：
http://arxiv.org/abs/2303.03378
— 完—
「中国AIGC产业峰会」启动
邀您共襄盛举
「中国AIGC产业峰会」行将在往年3月举行，峰会将约请AIGC产业相干畛域的专家学者，独特讨论生成新世界的过来、当初和将来。
峰会上还将公布 《中国AIGC产业全景讲演暨AIGC 50》，片面平面描画我国以后AIGC产业的竞争力求谱。点击链接或下方图片查看大会详情：
被ChatGPT带飞的AIGC如安在中国落地？量子位邀你独特参预中国AIGC产业峰会
点这里 ?关注我，记得标星哦～
一键三连「分享」、「点赞」和「在看」
科技前沿停顿日日相见 ~

华人澳洲中文论坛

热图推荐

谷歌报复性砸出5620亿参数大模型！比ChatGPT更恐惧，机器人都能用，学术圈已刷屏

发表回复

浏览过的版块

qiuqiuqiu
关注TA

图文推荐

67岁男子被控2项谋杀得逞（家暴）罪名

墨尔本北郊车祸涉事女子负有枪伤，左近有一

华人澳洲中文论坛

热图推荐

谷歌报复性砸出5620亿参数大模型！比ChatGPT更恐惧，机器人都能用，学术圈已刷屏

发表回复

浏览过的版块

qiuqiuqiu 关注TA

图文推荐

67岁男子被控2项谋杀得逞（家暴）罪名

墨尔本北郊车祸涉事女子负有枪伤，左近有一

qiuqiuqiu
关注TA