华人澳洲中文论坛

热图推荐

谷歌报复性砸出5620亿参数大模型!比ChatGPT更恐惧,机器人都能用,学术圈已刷屏

[复制链接]

2023-3-10 18:26:39 77 0

原标题:谷歌报复性砸出5620亿参数大模型!比ChatGPT更恐惧,机器人都能用,学术圈已刷屏  
明敏 发自 凹非寺   
量子位 | 大众号 QbitAI   
为应答新一轮技术比赛,谷歌还在不停出背工。   
这两天,一个名叫 PaLM-E的大模型在AI学术圈疯狂刷屏。   


它能只需一句话,就让机器人去厨房抽屉里拿薯片。  


即使是半途搅扰它,它也会坚持履行工作。  


     PaLM-E具有 5620亿参数,是GPT-3的三倍多,号称史上最大范围视觉言语模型。而它面前的打造团队,恰是谷歌和柏林工业大学。   
作为一个能处置多模态信息的大模型,它还兼具十分强的逻辑思惟。  
好比能从一堆图片里,判别出哪一个是能转动的。  


还会看图做算数:  


详细才能方面,PaLM-E表示出了对比强的逻辑性。  
好比给它一张图片,而后让它按照所看到的做出蛋糕。  
模型能先判别出图象中都有甚么,而后分红9步讲了该如何制造蛋糕,从最后的磕鸡蛋到最初洗碗都包罗在内。  
有人还调侃说,这机器人怎么在把蛋糕给我前先本人吃了?  
还有按照图片做判别:我能在这条路上骑自行车吗?  
模型进行一系列逻辑推断:  
1、不克不及进入
  2、除了自行车
  3、除了自行车之外都不克不及进入
  4、谜底是能够
    1、不克不及进入   
2、除了自行车   
3、除了自行车之外都不克不及进入   
4、谜底是能够   


并且他们还发现,言语模型的范围越大,它终究能放弃的言语了解才能越强。  
好比使用5400亿参数范围的PaLM时,PaLM-E在言语工作上的实际才能仅降落了3.9%。  


从试验后果来看,PaLM-E在OK-VQA基准上达到新SOTA。  


在摹拟环境下的工作实现度也都不错。  
再次验证鼎力出奇观   
目前这项钻研已诱发十分普遍的探讨。  
次要在于下列几个方面:  
1、一定水平上验证了“鼎力出奇观”   
2、比ChatGPT更接近AGI?   
一方面,作为目前已知的范围最大的视觉言语模型,PaLM-E的表示曾经足够惊艳了。  
去年,DeepMind也公布过一个通才大模型Gota,在604个不同的工作上承受了训练。  
但过后有得多人以为它其实不算真正意义上的通用,由于钻研无奈证实模型在不同工作之间产生了正向迁徙。  
论文作者表现,这也许是由于模型范围还不敷大。  
如今,PaLM-E似乎实现了这一论证。  


另外一方面,是从大趋向下去看。  
有人表现,这项任务看下来要 比ChatGPT更接近AGI啊。   
确实,用ChatGPT还只是提供文字倡议,得多详细入手的事还要本人来。  
但PaLM-E属于把大模型才能拉入到具象化层面,AI和物理世界之间的结界要被打破了。  
并且这个趋向显然也是大家都在揣摩的,微软前不久也公布了一项十分类似的任务——让ChatGPT指挥机器人。  
除此以外,还有得多人表现,这再一次验证了多模态是将来。  
不外,这项效果当初只要论文和demo公布,真正才能有待验证。  
另外还有人发现,模型驱动的机器人,面前的开发团队在几周前被谷歌一锅端了。。。  
所以对于PaLM-E的更多后续,我们还得再蹲蹲看。  
论文地址:   
http://arxiv.org/abs/2303.03378  
—   
「中国AIGC产业峰会」启动  
邀您共襄盛举  
「中国AIGC产业峰会」行将在往年3月举行,峰会将约请AIGC产业相干畛域的专家学者,独特讨论生成新世界的过来、当初和将来。   
峰会上还将公布 《中国AIGC产业全景讲演暨AIGC 50》,片面平面描画我国以后AIGC产业的竞争力求谱。点击链接或下方图片查看大会详情:   
被ChatGPT带飞的AIGC如安在中国落地?量子位邀你独特参预中国AIGC产业峰会   
点这里 ?关注我,记得标星哦~   
一键三连「分享」、「点赞」和「在看」  
科技前沿停顿日日相见 ~

发表回复

您需要登录后才可以回帖 登录 | 立即注册

返回列表 本版积分规则

:
注册会员
:
论坛短信
:
未填写
:
未填写
:
未填写

主题18

帖子33

积分132

图文推荐

  • 67岁男子被控2项谋杀得逞(家暴)罪名

    上周,蓝山地域一户人家有两名女子被捅刀,警方起

  • 墨尔本北郊车祸涉事女子负有枪伤,左近有一

    9月1昼夜间,Epping 区产生枪击和车祸,警方正在