华人澳洲中文论坛

热图推荐

    梗图搜寻神器来了!还能搜视频,网友:六年没找到的梗图这里两分钟找到了

    [复制链接]

    2023-1-21 18:18:37 16 0

    原标题:梗图搜寻神器来了!还能搜视频,网友:六年没找到的梗图这里两分钟找到了  
    Pine 发自 凹非寺   
    量子位 | 大众号 QbitAI   
    重度互联网喜好者们福利来了!  
    你是不是遇到过这类状况:一个梗图寻遍全网都还没找到。  
    当初外网一名小哥搞出了一个 互联网范围的Meme搜寻引擎,库里有 近两千万个梗图,涵盖各种小众文明。   
    检索症结词,或者上传类似图片,后果就可以 秒出!   
    若遇到Meme库里没有的梗图,还可同享上传。  
    网友六年都没找到的梗图,在这个小哥的网站上2分钟就找到了。  

    nmbu0ic1df5.jpg

    nmbu0ic1df5.jpg


    然鹅这样一个秒秒钟出梗图的面前的安装的确酱婶儿的:  
    (这不会有点太粗陋了吧)  

    pz1ishld4iu.jpg

    pz1ishld4iu.jpg


    展开全文    这时候候可能就有盆敌对奇,这个粗拙的安装是如何做到疾速检索梗图的?  
    那无妨一同来看看这个“Meme搜寻引擎”是如何搭建的~  
    灵感来自iPhone图片辨认   
    这是原图:  

    j3pce1cl34m.jpg

    j3pce1cl34m.jpg


    30 BLUE man41;? S4-5?’?ew/ — V [IL ‘ . “,2; g” .’Sj /B”f;T”EArmDand [red] mvslmunlm: sawmills
        30 BLUE man41;? S4-5?’?ew/ — V [IL ‘ . “,2; g” .’Sj /B”f;T”EArmDand [red] mvslmunlm: sawmills  
    e妹妹妹妹妹妹  
    不外灵感很快就来了,小哥偶尔间在iPhone给他人发一个验证码图片时。  
    这是验证码图片:  

    3rrj4hzmwgf.jpg

    3rrj4hzmwgf.jpg


    这是复制过去的文字:  

    ivk0sat0sbr.jpg

    ivk0sat0sbr.jpg


    而且iPhone的这个功用曾经在iOS Vision框架中地下了,可伸缩OCR的问题这不就有解决方法了嘛~  

    s4gnpqvzact.jpg

    s4gnpqvzact.jpg


    不外对于Vision框架目前尚无现成的开源代码插件,只能本人写了,详细代码小哥目前还没发布。  
    BUT,小哥仍是总结了一下本人写代码时的办法教训,并且是针对一个从未用Swift写过任何正派货色的小白:  
    遇事未定Google之  Github上逆向工程各种Swift回购协定  求教懂iOS的敌人解决Xcode问题 ……    终究东拼西凑,搞出了一个可行的解决计划:iOS Vision OCR办事器,仅在一部iPhone上就可以运转。  

    rd3rkqd4q3k.jpg

    rd3rkqd4q3k.jpg


    小哥用的是ElasticSearch (已开源)和Postgres。   
    ElasticSearch具有多节点可以无效防止毛病的产生,而且可以在包管速度的状况下包容数百万个Meme,不外这都是在就义了牢靠性之后失掉的。   
    Postgres可以包管搜寻后果的牢靠性,但在超过一百万张图片的规模时,就会变得特别慢。   
    一个能包管速度,一个能包管品质,那……  

    5w4coft0gd3.jpg

    5w4coft0gd3.jpg


    Done!  
    在这其中,小哥用到了PGSync,它是一件两头件,能够用于同步从Postgres到Elasticsearch/OpenSearch的数据,详细的搜寻流程如下:  

    3yzwyfvx3k0.jpg

    3yzwyfvx3k0.jpg


    到这里,全部搜寻引擎的搭建已初见雏形,但还没完结……  
    视频Meme也能反对   
    由于Meme不单单靠梗图来传递,有时分还会有视频。  
    详细来讲,小哥编写了一个小型微办事,经过ffmpeg (它能够履行音频和视频多种格局的录影、转换、串流功用),从视频中截取10个平均距离的图片。   
    而后将截图文件发送到iPhone OCR办事,终究视频文件中会有每个屏幕截图OCR后的后果集。  
    不外具有视频检索功用后,毫无疑难OCR办事的负载就重了,一个视频OCR的任务量简直是个别梗图的10倍。  
    虽说OCR运用办事器的速度很快,但也禁不住这样薅,因而iOS OCR办事降级了 (多加几台手机),因而终究的安装就变结尾图中的那样了。   
    终究详细的流程图小哥也贴心肠给出来了:  

    4h5vm3enyg5.jpg

    4h5vm3enyg5.jpg


    小哥的这个Meme搜寻引擎出来之后,网友们也都直呼太棒了。  

    vef20tiepme.jpg

    vef20tiepme.jpg


    固然也有网友给出了一些倡议,以为以后的搜寻引擎太文本化了,而得多Meme图自身就没多少文字,更多时分都是“意会”。  
    对此,小哥自己也作出了回应,称之后还会持续优化搜寻引擎:  
    斟酌将图象转换为形容的文本……
        斟酌将图象转换为形容的文本……  

    m2dmek2pisj.jpg

    m2dmek2pisj.jpg


    不外值得一提的是,目前这个搜寻引擎还不太反对中文,中文的梗图搜寻成果不是很好,但既然小哥曾经将构建办法给出来了,就期待一波万能的网友吧。 (手动狗头)  
    假如你对这个名目感兴致的话,能够戳下文链接~  
    传送门:   
    http://findthatmeme.com/  
    参考链接:   
    http://findthatmeme.com/blog/2023/01/08/image-stacks-and-iphone-racks-building-an-internet-scale-meme-search-engine-Qzrz7V6T.html  
    —   
    百度钻研院、阿里达摩院、量子位智库  
    年度十大科技讲演  
    总结2022,预见2023。来自百度钻研院、阿里达摩院和量子位智库的年度十大科技讲演均已公布, 点击下方图片便可跳转查看。   
    百度钻研院  
    阿里达摩院  
    量子位智库  
    点这里 ?关注我,记得标星哦~   
    一键三连「分享」、「点赞」和「在看」  
    科技前沿停顿日日相见 ~

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    中级会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题36

    帖子47

    积分224

    图文推荐