|
原标题:未知物体也能轻松辨认联系,成果可迁徙 | DeepMind钻研
Pine 发自 凹非寺
量子位 | 大众号 QbitAI
历来没有见过的新物体,它也能进行很好地联系。
这是DeepMind钻研出的一种新的学习框架:指标发现和表现网络(Object discovery and representation networks,简称Odin)
以往的自我监视学习(SSL)办法可以很好地形容全部大的场景,然而很难区别出单个的物体。
当初,Odin办法做到了,而且是在没有任何监视的状况下做到的。
区别出图象中的单个物体可不是很容易的事,它是怎么做到的呢?
办法原理
可以很好地域分出图象中的各个物体,次要归功于Odin学习框架的“自我循环”。
Odin学习了两组协同任务的网络,分别是指标发现网络和指标表现网络。
指标发现网络以图象的一个裁剪部份作为输出,裁剪的部份应该包孕图象的大部份区域,且这部份图象并无在其余方面进行加强处置。
而后对输出图象生成的特点图进行聚类剖析,按照不同的特点对图象中各个物体的进行联系。
3s14vcv1voj.jpg
指标表现网络的输出视图是指标发现网络中所生成的联系图象。
视图输出之后,对它们分别进行随机预处置,包罗翻转、隐约和点级色彩转换等。
这样就可以够获取两组掩模,它们除了剪裁以外的差别,其余信息都和底层图象内容相反。
展开全文 然后两个掩模会经过比较损失,进而学习可以更好地表现图象中物体的特点。
而后,最大化不同掩模中同一指标物体的类似性,最小化不同指标物体之间的类似性,进而更好地进行联系以区分不同指标物体。
exuktptjwsu.jpg
与此同时,指标发现网络会按期按照指标表现网络的参数进行相应的更新。
终究的目的是确保这些对象级的特性在不同的视图中大抵不变,换句话说就是将图象中的物体分隔开来。
那末Odin学习框架的成果到底如何呢?
可以很好地域分未知物体
Odin办法在场景联系时, 没有先验常识的状况下迁徙学习的机能也很弱小。
首先,使用Odin办法在ImageNet数据集上进行预训练,而后评价其在COCO数据集以及PASCAL和Cityscapes语义联系上的成果。
曾经知道指标物体,即获取先验常识的办法在进行场景联系时,成果要显著好过其余未获取先验常识的办法。
而Odin办法即便未获取先验常识,其成果也要优于获取先验常识的DetCon和ReLICv2。
1xlae0saqgk.jpg
2mmbg24eilg.jpg
除此以外,Odin办法不只能够运用在ResNet模型中,还能够运用到更繁杂的模型中,如Swim Transformer。
在数据上,Odin框架学习的劣势很显著,那在可视化的图象中,Odin的劣势在何处体现了呢?
将使用Odin生成的联系图象与随机初始化的网络(第3列),ImageNet监视的网络(第4列)中获取的联系图象进行对比。
第3、4列都未能明晰地描画出物体的界限,或者不足理想世界物体的统一性和局部性,而Odin生成的图象成果很显著要更好一些。
3uw5zqtfh2f.jpg
— 完—
百度钻研院、阿里达摩院、量子位智库
年度十大科技讲演
总结2022,预见2023。来自百度钻研院、阿里达摩院和量子位智库的年度十大科技讲演均已公布, 点击下方图片便可跳转查看。
百度钻研院
阿里达摩院
量子位智库
点这里 ?关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿停顿日日相见 ~ |
|