|
原标题:梗图搜寻神器来了!还能搜视频,网友:六年没找到的梗图这里两分钟找到了
Pine 发自 凹非寺
量子位 | 大众号 QbitAI
重度互联网喜好者们福利来了!
你是不是遇到过这类状况:一个梗图寻遍全网都还没找到。
当初外网一名小哥搞出了一个 互联网范围的Meme搜寻引擎,库里有 近两千万个梗图,涵盖各种小众文明。
检索症结词,或者上传类似图片,后果就可以 秒出!
若遇到Meme库里没有的梗图,还可同享上传。
网友六年都没找到的梗图,在这个小哥的网站上2分钟就找到了。
nmbu0ic1df5.jpg
然鹅这样一个秒秒钟出梗图的面前的安装的确酱婶儿的:
(这不会有点太粗陋了吧)
pz1ishld4iu.jpg
展开全文 这时候候可能就有盆敌对奇,这个粗拙的安装是如何做到疾速检索梗图的?
那无妨一同来看看这个“Meme搜寻引擎”是如何搭建的~
灵感来自iPhone图片辨认
这是原图:
j3pce1cl34m.jpg
30 BLUE man41;? S4-5?’?ew/ — V [IL ‘ . “,2; g” .’Sj /B”f;T”EArmDand [red] mvslmunlm: sawmills
30 BLUE man41;? S4-5?’?ew/ — V [IL ‘ . “,2; g” .’Sj /B”f;T”EArmDand [red] mvslmunlm: sawmills
e妹妹妹妹妹妹
不外灵感很快就来了,小哥偶尔间在iPhone给他人发一个验证码图片时。
这是验证码图片:
3rrj4hzmwgf.jpg
这是复制过去的文字:
ivk0sat0sbr.jpg
而且iPhone的这个功用曾经在iOS Vision框架中地下了,可伸缩OCR的问题这不就有解决方法了嘛~
s4gnpqvzact.jpg
不外对于Vision框架目前尚无现成的开源代码插件,只能本人写了,详细代码小哥目前还没发布。
BUT,小哥仍是总结了一下本人写代码时的办法教训,并且是针对一个从未用Swift写过任何正派货色的小白:
遇事未定Google之 Github上逆向工程各种Swift回购协定 求教懂iOS的敌人解决Xcode问题 …… 终究东拼西凑,搞出了一个可行的解决计划:iOS Vision OCR办事器,仅在一部iPhone上就可以运转。
rd3rkqd4q3k.jpg
小哥用的是ElasticSearch (已开源)和Postgres。
ElasticSearch具有多节点可以无效防止毛病的产生,而且可以在包管速度的状况下包容数百万个Meme,不外这都是在就义了牢靠性之后失掉的。
而 Postgres可以包管搜寻后果的牢靠性,但在超过一百万张图片的规模时,就会变得特别慢。
一个能包管速度,一个能包管品质,那……
5w4coft0gd3.jpg
Done!
在这其中,小哥用到了PGSync,它是一件两头件,能够用于同步从Postgres到Elasticsearch/OpenSearch的数据,详细的搜寻流程如下:
3yzwyfvx3k0.jpg
到这里,全部搜寻引擎的搭建已初见雏形,但还没完结……
视频Meme也能反对
由于Meme不单单靠梗图来传递,有时分还会有视频。
详细来讲,小哥编写了一个小型微办事,经过ffmpeg (它能够履行音频和视频多种格局的录影、转换、串流功用),从视频中截取10个平均距离的图片。
而后将截图文件发送到iPhone OCR办事,终究视频文件中会有每个屏幕截图OCR后的后果集。
不外具有视频检索功用后,毫无疑难OCR办事的负载就重了,一个视频OCR的任务量简直是个别梗图的10倍。
虽说OCR运用办事器的速度很快,但也禁不住这样薅,因而iOS OCR办事降级了 (多加几台手机),因而终究的安装就变结尾图中的那样了。
终究详细的流程图小哥也贴心肠给出来了:
4h5vm3enyg5.jpg
小哥的这个Meme搜寻引擎出来之后,网友们也都直呼太棒了。
vef20tiepme.jpg
固然也有网友给出了一些倡议,以为以后的搜寻引擎太文本化了,而得多Meme图自身就没多少文字,更多时分都是“意会”。
对此,小哥自己也作出了回应,称之后还会持续优化搜寻引擎:
斟酌将图象转换为形容的文本……
斟酌将图象转换为形容的文本……
m2dmek2pisj.jpg
不外值得一提的是,目前这个搜寻引擎还不太反对中文,中文的梗图搜寻成果不是很好,但既然小哥曾经将构建办法给出来了,就期待一波万能的网友吧。 (手动狗头)
假如你对这个名目感兴致的话,能够戳下文链接~
传送门:
http://findthatmeme.com/
参考链接:
http://findthatmeme.com/blog/2023/01/08/image-stacks-and-iphone-racks-building-an-internet-scale-meme-search-engine-Qzrz7V6T.html
— 完—
百度钻研院、阿里达摩院、量子位智库
年度十大科技讲演
总结2022,预见2023。来自百度钻研院、阿里达摩院和量子位智库的年度十大科技讲演均已公布, 点击下方图片便可跳转查看。
百度钻研院
阿里达摩院
量子位智库
点这里 ?关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿停顿日日相见 ~ |
|