华人澳洲中文论坛

热图推荐

    ChatGPT取代搜寻引擎?谷歌急了,百度不慌:早已规划

    [复制链接]

    2023-1-11 18:42:35 60 0

    原标题:ChatGPT取代搜寻引擎?谷歌急了,百度不慌:早已规划  
    梦晨 衡宇 发自 凹非寺   
    量子位 | 大众号 QbitAI   
    生成式AI要取代搜寻引擎的声响,泛起在ChatGPT公布的 第一天。   

    gd4zjwitnxp.jpg

    gd4zjwitnxp.jpg


    起初越传越邪乎,有人构想当前大家找材料都不说古歌一下了,而是 geept一下。   
    还有人说,搜寻引擎给的一页10个蓝蓝的链接,当前就像老式拨号电话的转盘同样 成为历史。   
    谷歌刚开始还毫不在意,跟着ChatGPT爆火出圈也感触到要挟,外部拉响白色警报,调剂AI产品战略。  
    微软则把这视作弯道超车的时机,方案在必应搜寻中承继ChatGPT的才能。  
    ……  
    不外,持不同观念的也大有人在。  
    跟着大家使用加深,ChatGPT会用权威的语气输入过错信息,无奈获得最新常识等弱点袒露出来。  
    一本正派胡言乱语  
    OpenAI的CEO也表现,现阶段ChatGPT容易给人带来一种 假象,依赖它来做首要事件是不靠谱的。   

    rj0fvp5cgdh.jpg

    rj0fvp5cgdh.jpg


    展开全文    Keras之父则以为,搜寻与生成 基本就是两个问题,原理上就抉择了二者无奈互相取代。   

    oedcsxer02s.jpg

    oedcsxer02s.jpg


    无意思的是,另外一搜寻巨头百度的观念也站在这一边。  
    近日,百度刚刚举行Create AI开发者大会,大会前夕,百度搜寻宣告将基于百度自研的生成式模型,降级 “生成式搜寻”才能,并指出, 生成式AI和搜寻引擎是互补瓜葛而不是代替,还说 搜寻底层技术和AI底层技术是相通的。   
    其实你曾经用上了   
    百度这番话不是说说罢了,而是从2021年就开始尝试把AIGC与搜寻二者结合起来了。  
    十年前点击“百度一下”的按钮时,搜寻引擎面前的任务原理相对于简略,就是经过症结词索引,通过算法筛选排序,生成后果页。  
    而当初,后果页有时分 曾经不是单纯呈现链接摆列。   
    好比,买了新款iPhone的你,把手机翻了个底朝天,也没找到录音功用藏在哪。  
    无法求助于百度,在搜寻框输出“苹果怎么录音?”,生成页面最顶端泛起的不是链接,而是一个小卡片。  
    AI选出最能帮到你的谜底并做摘要,显示在最上方,无需再从搜寻后果翻找。  

    nhf2zlvqb14.jpg

    nhf2zlvqb14.jpg


    点进去看,仍是图文并茂,步骤明晰的那种。  
    (世界未解之谜:苹果的录音机究竟为何要叫语音备忘录???)  
    又或者网络冲浪时看到一帧截图,想要知道出自哪部剧,形容一下,搜寻引擎可基于深度语义了解问题并婚配后果,也能搜出谜底来。  
    不信能够一同书面语化形容上面这张剧照,“韩国有部电影野兽轮船在空中飘着叫甚么名字”,而后在评论区告知咱们谜底。  

    yhbe2qfygnj.jpg

    yhbe2qfygnj.jpg


    再好比,想理解“北京GDP和上海GDP谁高”,百度能够基于权威数据自动生成多年两地GDP走势图。  
    高下比较间接呈现,不必本人分别另行搜寻和自行计算。  

    xjahyqceimb.jpg

    xjahyqceimb.jpg


    搜寻引擎虽然有20多年历史,但对大少数网民来讲依然是难以代替的高频刚需,而且需要也始终在变动。  
    从简略的症结词命中搜寻,到天然言语搜寻,再到语音(特别是方言)搜寻,人们使用搜寻引擎的形式愈来愈凑近本能和直觉。  
    从根底的把网页当成文档去搜寻,到搜寻常识、办事,人们愈来愈期待搜寻提供更大的价值。  
    由此带来的繁杂需要与宏大计算量,使搜寻仍然是技术壁垒十分高的产品。  

    5wznvo2gji1.jpg

    5wznvo2gji1.jpg


    据理解,自百度发力AI十年来累计研发投入超过1000亿元,每一年研发占比都超过15%,2021年更是达到23%。  
    与此同时,搜寻则是百度20年来的中心业务,也是离公众比来的“窗口”之一,天天处置海量的申请。  
    百度当先的AI技术都会最早落地在搜寻上,让搜寻不停跟上需要的开展,同时也是AI技术最佳的试炼场。  
    两大“杀手锏”技术地下表态   
    提起百度的AI技术,最被人熟知的是 文心大模型,产业级、常识加强是其特色。   
    面前还有 飞桨深度学习平台,提供一系列根底设施和工具。以及更底层的 自研昆仑芯片,兼具超强算力与高性价比的本钱劣势。   
    那末这些技术怎么用于搜寻引擎呢?  
    这就要说到在百度Create大会上表态的两大“杀手锏”技术,跨模态大模型“知一”,新一代索引技术“千流”。  

    nnhxqdmxq5v.jpg

    nnhxqdmxq5v.jpg


    先看 跨模态大模型知一,是AI技术在搜寻场景落地的代表。   
    简略来讲,知一大模型能够从全网状态各异的资源中继续学习,无论是文本、图片、视频仍是构造化信息均可以死记硬背。  
    打破了资源状态的边界,就 更易了解用户的搜寻需要。   
    从技术层面讲,知一使用了百度文心大模型技术。大范围预训练技术晋升模型机能,蒸馏紧缩率高达99%的模型小型化技术以升高本钱,得以在搜寻场景片面运用。  
    据理解,目前知一在百度搜寻的各场景中天天要进行上万亿次的推理。如斯微小的使用范围又带来新的问题,如何把知足需要的后果高效呈现给用户。  
    这就要提到 新一代索引技术千流,担任把不同维度的信息进行智能有序的组织。   
    千流与以前的索引技术比拟,主打多畛域、多维度表白的 平面栅格化索引。   
    如何了解栅格化?  
    在过来,搜寻引擎为进步效力会把内容按品质横向切开,做分层处置。先从高品质内容开始检索,知足需要就能及时前往后果,还未知足再进入下一层。  
    在千流中,进一步把品质最高的一批内容按畛域垂直分层。品质分层+内容命中结合,一横一纵把内容切分红栅格按需检索,大大增加每次检索的计算量。  
    这是对搜寻引擎后端架构的完全革新,做到 本钱升高一半、速度快两倍。   
    但这又不光是节俭本钱的问题。  
    百度工程师透露,节俭下的计算量还能够投入到对内容的精耕细作中,如综合利用多种算法晋升索引品质,或者参加最新的生成式AI技术。  
    另外,在不同的栅格间也能够使用共性化算法,就比如 “一鱼多吃”,不同的部份使用不同的烹饪办法。   
    知一和千流二者配合起来,一方面对用户搜寻用意的了解更准确,一方面进步内容的品质和信息检索效力,为搜寻关上了更多可能性。  
    用户的高频需要,驱动着AI技术改革。新技术又能激起新用户需要表白,二者构成“双轮驱动”,继续推进搜寻进化。  

    i2h00tzdhch.jpg

    i2h00tzdhch.jpg


    在这样不停反馈迭代之下,下一个量变行将到来。  
    搜寻即创作  
    回到最后的话题:生成式AI会取代搜寻引擎吗?  
    作为国际最大的搜寻引擎,百度的谜底曾经明了:  
    AIGC和搜寻引擎是互补而非取代瓜葛。
        AIGC和搜寻引擎是互补而非取代瓜葛。  
    百度搜寻出色架构师辜斯缪解释了百度如斯判别的思惟门路:   
    以后的AIGC对话零碎,哪怕是最火最出圈的ChatGPT,尚有本身才能的显著瓶颈, (好比有时胡言乱语,以及不克不及及时获得最新动静) ,且不克不及包管将来技术一定可以解决这些问题。
        以后的AIGC对话零碎,哪怕是最火最出圈的ChatGPT,尚有本身才能的显著瓶颈, (好比有时胡言乱语,以及不克不及及时获得最新动静) ,且不克不及包管将来技术一定可以解决这些问题。  
    由于从工业运用和落地可能性角度看,现有模型范围其实不能撑持一个模型能记载一切常识。  
    尤为是用户需要量微小的强时效性内容。  
    解决方法,就是换个角度,利用AIGC为用户凋谢式的搜寻发问或定制化的信息需要“创作谜底”。  
    从单边的搜寻或生成,融会为检索+生成,会达到更好的成果。  
    这也是从2021年,百度就曾经着手研产生成式搜寻的首要缘故。  
    检索和生成的结合模式,注定了百度搜寻降级后的产品方式会有变动。  
    据理解,终究产品会与ChatGPT有很大不同,即虽是多轮交互,但 并不是单纯的多轮对话。   
    简而言之,用户能够更高效地向搜寻引擎提出需要,生成式搜寻则在知足需要的同时,迭代和调剂这个需要。  
    不会PS的人,能够利用生成式搜寻搜出一张图片,再用言语形容想要怎么修正这张图片,搜寻引擎就可以按照要求,经过百度的NLP技术对图片进行修正,给予反馈。  
    降级后,生成式搜寻会完成 三个方面的体验晋升。   
    信息智能整合组织。在包管权威性和精确性的条件下,梳理检索后果,提供整合后的构造化谜底。  内容创作。基于文心·NLP大模型,发扬天然言语处置才能,能够知足诸如“写文章”“写布告”“智能聊天对话”等创作型搜寻需要。  共性化内容体验。基于不同用户画像和浏览偏好,同一内容也有差别化、共性化的详细表白。   

    pqvodbhkwzz.jpg

    pqvodbhkwzz.jpg


    「内容创作」示意成果图  
    据引见,百度行将在近期降级全网首个生成式搜寻。  
    提纲挈领地梳理上去,不管是AIGC,ChatGPT,仍是生成式搜寻,都是技术、尤为是AI技术开展到一定境地发生出来的新的时机。  
    如2022年底,百度CEO李彦宏在全员大会上的发言所说:  
    把AIGC这么酷的技术变为人人需求的产品,这一步才是最难的。
        把AIGC这么酷的技术变为人人需求的产品,这一步才是最难的。  
    百度生成式搜寻会是下一集体人需求的“酷”产品吗?  
    刮目相待。  
    —   
    点这里 ?关注我,记得标星哦~   
    一键三连「分享」、「点赞」和「在看」  
    科技前沿停顿日日相见 ~

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    中级会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题35

    帖子44

    积分203

    图文推荐