华人澳洲中文论坛

热图推荐

    谷歌AI看不懂网友评论,会错意高达30%,网友:你不懂我的梗

    [复制链接]

    2022-7-18 21:45:52 36 0

    原标题:谷歌AI看不懂网友评论,会错意高达30%,网友:你不懂我的梗  
    Pine 发自 凹非寺   
    量子位 | 大众号 QbitAI   
    给你两句话,来品一下它们所蕴含的情感:  
    “我真的会谢。”  
    “听我说谢谢你,由于有你,和煦了四季······”  


    也许你会说,这很简略啊,不就是比来常常被玩的梗吗?  
    但若问问尊长,他们可能就是一副“地铁白叟看手机”的样子了。  
    不外与盛行文明之间有代沟这事,可不只限于尊长们,还有AI。  
    这不,一名博主比来就po出了一篇剖析谷歌数据集的文章,发现它对Reddit评论的情绪判断中,过错率竟高达30%。  
    就好比这个例子:  
    我要向敌人怒表白对他的爱意。
        谷歌数据集把它判别为“朝气”。  
    还有上面这条评论:  
    TM差点吓坏我了。
        谷歌数据集将其判断为“困惑”。  
    网友直呼:你不懂我的梗。  
    人工智能秒变人工智障,这么离谱的过错它是怎么犯的?   
    断章取义它最“拿手”   
    这就得从他判断的形式动手了。  
    谷歌数据集在给评论贴标签时,是把文字单拎出来判别的。  
    咱们能够看看上面这张图,谷歌数据集都把文字中的情绪过错地判别为愤恨。  


    不如咱们由此来揣测一下谷歌数据集判断过错的缘故,就拿下面的例子来讲,这四条评论中均有一些“脏话”。  
    谷歌数据集把这些“脏话”拿来作为判别的依据,但若子细读残缺个评论,就会发现这个所谓的“依据”只是用来加强全部句子的语气,并无实际的意义。  
    网友们的颁发的评论往往都不是孤立存在的,它所跟的帖子、公布的平台等要素均可能致使全部语义产生变动。  
    好比单看这条评论:  
    his traps hide the fucking sun.
        单单依托这个很难判别其中的情绪元素。但若知道他是来自一个肌肉网站的评论,也许就不难猜出了, (他只是想称誉一下这集体的肌肉) 。   


    疏忽评论的帖子自身,或者将其中某个情感颜色强烈的词语单拎出来判别其情绪元素都是分歧理的。  
    一个句子并非孤立存在的,它有其特定的语境,其含意也会跟着语境的变动而变动。  
    将评论放入残缺的语境中去判别其情绪颜色,也许会大大晋升判断的精确率。  
    但形成30%这么高的失误率可不单单只是“断章取义”,其中还有更深档次的缘故。  
    “咱们的梗AI不懂”   
    除了语境会搅扰数据集判断以外,文明配景也是一个十分首要的要素。  
    大到国度地域,小到网站社群都会有其外部专属的文明符号,这类文明符号圈层以外的人很难解读,这就形成了一个辣手的问题:  
    若想更精确地判别某一社区评论的情绪,就得针对性地对其社区进行一些数据训练,深化理解全部社区的文明基因。  
    在Reddit网站上,网友评论指出“一切的评分者都是以英语为母语的印度人”。  
    这就致使会对一些很常见的习语、语气词及一些特定的“梗”形成曲解。  
    说了这么多,数据集判断失误率这么高的缘故也就不言而喻了。  
    但与此同时,进步AI判断情绪的准确度也有了明晰的标的目的。  
    例如博主也在这篇文章中就给出了几条倡议:  
    首先,在对评论贴标签时,得对他所处的文明配景有粗浅地舆解。以Reddit为例,要判别其评论的情绪颜色,要对美国的一些文明、政治了解透辟,而且还要可以迅速get到专属网站的“梗”;   
    其次,要测试标签对一些讥刺、习语、梗的判断是不是正确,确保模型可以整整顿解文本的意思;   
    最初,核对模型判别与咱们实在判断,以做出反馈,更好地训练模型。   
    One More Thing   
    AI大牛吴恩达曾发动过一项以数据为核心的人工智能静止。  
    将人工智能从业者的重点从模型/算法开发转移到他们用于训练模型的数据品质上。吴恩达曾说:  
    数据是人工智能的食品。
        用于训练数据的好坏关于一个模型也相当首要,在新兴的以数据为核心的 AI 办法中,数据的统一性相当首要。为了获取正确的后果,需求固定模型或代码并迭代地进步数据品质。  
    ……  
    最初,你感觉在进步言语AI判断情绪这件事上,还有甚么办法呢?  
    欢送在留言区探讨~  
    参考链接:   
    [1] http://www.reddit.com/r/MachineLearning/co妹妹ents/vye69k/30_of_古歌s_reddit_emotions_dataset_is/  
    [2]http://www.surgehq.ai/blog/30-percent-of-古歌s-reddit-emotions-dataset-is-mislabeled  
    [3]http://mitsloan.mit.edu/ideas-made-to-matter/why-its-time-data-centric-artificial-intelligence  
    —   
    「人工智能」、「智能汽车」微信社群邀你参加!  
    欢送关注人工智能、智能汽车的小火伴们参加咱们,与AI从业者交流、切磋,不错过最新行业开展&技术停顿。  
    ps.加好友请务必备注您的姓名-公司-职位哦~   
    点这里 ?关注我,记得标星哦~   
    一键三连「分享」、「点赞」和「在看」  
    科技前沿停顿日日相见~

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题31

    帖子38

    积分179

    图文推荐