华人澳洲中文论坛

热图推荐

    「ChatGPT克星」降级:教师能够把全班功课丢进去检测了!华人作者:收费用

    [复制链接]

    2023-2-1 18:55:39 19 0

    原标题:「ChatGPT克星」降级:教师能够把全班功课丢进去检测了!华人作者:收费用  
    金磊 发自 凹非寺   
    量子位 | 大众号 QbitAI   
    「ChatGPT克星」,降级了!   
    没错,就是以前华人小哥Edward Tian所打造出来的阿谁 GPTZero ,几秒内就可以摸清文字是人类仍是AI写的。   


    而时隔近一个月,小哥所推出的版本名叫 GPTZeroX,而且他还说:   
    这是专门为教育任务者打造的AI模型。
        这是专门为教育任务者打造的AI模型。  


    动静一出,当即吸引了大批网友涌入,一天以内便有40万的拜候量和220万的办事申请。  


    展开全文    那末这一次,这位「ChatGPT克星」又带来了哪些新才能?  
    混写也能测,还反对Word等格局   
    降级的一大特征,就是GPTZeroX能够检测出来“人类+AI”混写的文字内容。  
    例如咱们先把一段人类写的旧事丢进去检测:  


    GPTZeroX在短短几秒钟时间内,十分迅速的给出了谜底:  
    Your text is likely to be written entirely by a human.
      你的文本极可能彻底是由人写的。
        Your text is likely to be written entirely by a human.  
    你的文本极可能彻底是由人写的。  
    接上去,咱们再把一段ChatGPT写的文字,丢进方才那段旧事的后边,来一场混合检测:  


    这一次,GPTZero给出的回答是:  
    Your text includes parts written by AI.
      你的文本一部份是由AI编写的。
        Your text includes parts written by AI.  
    你的文本一部份是由AI编写的。  
    而且ChatGPT生成的内容还会用黄色高亮标志出来。  


    小哥对此表现:  
    这是教育任务者始终想要的一个症结功用。
        这是教育任务者始终想要的一个症结功用。  
    但教师们反省先生功课的时分,一段一段的把文字复制粘贴进来也至关繁琐的任务了。  
    因而乎,这位小哥还贴心肠推出了另外一个新功用——可批量导入文件,反对Word、PDF和TXT等格局。  
    而且网站在引见这个功用时,是这么形容的   


    :   


    除此以外,为了避免办事产生解体,小哥还搞了一个Python API,是曾经实现压力测试的那种。  


    最初,小哥还贴心肠说了一句:  
    我许诺,本网站对个体老师和教育任务者,放弃 收费
        我许诺,本网站对个体老师和教育任务者,放弃 收费!   
    怎么做到的?   
    它次要靠 “perplexity”,即 文本的“困惑度”作为目标来判别所给内容究竟是谁写的。   
    NLP畛域的敌人们都知道,这个目标就是用来评估一个言语模型的好坏的。  
    在这里,每当你喂给GPTZero一段测试内容,它就会分别计算出:  
    1、文字总困惑度  
    这个值越高,就越可能出自人类之手。  


    2、一切句子的均匀困惑度  
    句子越长,这个值通常就越低。  


    3、每个句子的困惑度  
    经过条形图的形式呈现,鼠标悬浮到各个方块就能查看相应的句子是甚么 (这里就两块,由于我此时输出的测试内容就俩句子)。   


    之所以要绘制这样的条形图,作者也作出理解释:  
    按照最新的一些钻研:人类书写的一些句子可能拥有较低的困惑度 (后面说过,人类的困惑度是对比高的),但跟着持续写,困惑度必将会泛起峰值。
      相同,用机器生成的文本,其困惑度是平均散布的,而且老是很低。
        按照最新的一些钻研:人类书写的一些句子可能拥有较低的困惑度 (后面说过,人类的困惑度是对比高的),但跟着持续写,困惑度必将会泛起峰值。   
    相同,用机器生成的文本,其困惑度是平均散布的,而且老是很低。  
    除此以外,GPTZero还会挑出困惑度最高的阿谁句子 (也就是最像人写的):   
    反ChatGPT之风正盛   
    正所谓道高一尺魔高一丈,在ChatGPT尽显十八般武艺之际,诸如小哥GPTZero同样“用魔法打败魔法”的工具、钻研也在层见叠出。  
    例如比来斯坦福大学为了避免让先生借助ChatGPT之力来写论文或做弊,推出了“反侦查”神器—— DetectGPT。   
    这类办法既不需求训练独自的分类器,也不需求采集实在或生成的段落的数据集,是一种基于几率曲率的零样本办法。  


    除此以外,就连OpenAI本人也联结哈佛等高校机构联结打造了一款检测器: GPT-2 Output Detector。   


    作者们先是公布了一个“GPT-2生成内容”和WebText (专门从国外贴吧Reddit上扒上去的)数据集,让AI了解“AI言语”和“人话”之间的差别。   
    (RoBERTa是BERT的改进版。原始的BERT使用了13GB大小的数据集,但RoBERTa使用了包孕6300万条英文旧事的160GB数据集。)  
    ……  
    嗯,看来ChatGPT在大步向前迈的同时,顺便还推进了“反ChatGPT”钻研的开展。  
    参考链接:  
    —   
    百度钻研院、阿里达摩院、量子位智库  
    年度十大科技讲演  
    总结2022,预见2023。来自百度钻研院、阿里达摩院和量子位智库的年度十大科技讲演均已公布, 点击下方图片便可跳转查看。   
    百度钻研院  
    阿里达摩院  
    量子位智库  
    点这里 ?关注我,记得标星哦~   
    一键三连「分享」、「点赞」和「在看」  
    科技前沿停顿日日相见 ~

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题30

    帖子39

    积分180

    图文推荐