华人澳洲中文论坛

「ChatGPT克星」降级:教师能够把全班功课丢进去检测了!华人作者:收费用

[复制链接]

2023-2-1 18:55:39 55 0

原标题:「ChatGPT克星」降级:教师能够把全班功课丢进去检测了!华人作者:收费用  
金磊 发自 凹非寺   
量子位 | 大众号 QbitAI   
「ChatGPT克星」,降级了!   
没错,就是以前华人小哥Edward Tian所打造出来的阿谁 GPTZero ,几秒内就可以摸清文字是人类仍是AI写的。   


而时隔近一个月,小哥所推出的版本名叫 GPTZeroX,而且他还说:   
这是专门为教育任务者打造的AI模型。
    这是专门为教育任务者打造的AI模型。  


动静一出,当即吸引了大批网友涌入,一天以内便有40万的拜候量和220万的办事申请。  


展开全文    那末这一次,这位「ChatGPT克星」又带来了哪些新才能?  
混写也能测,还反对Word等格局   
降级的一大特征,就是GPTZeroX能够检测出来“人类+AI”混写的文字内容。  
例如咱们先把一段人类写的旧事丢进去检测:  


GPTZeroX在短短几秒钟时间内,十分迅速的给出了谜底:  
Your text is likely to be written entirely by a human.
  你的文本极可能彻底是由人写的。
    Your text is likely to be written entirely by a human.  
你的文本极可能彻底是由人写的。  
接上去,咱们再把一段ChatGPT写的文字,丢进方才那段旧事的后边,来一场混合检测:  


这一次,GPTZero给出的回答是:  
Your text includes parts written by AI.
  你的文本一部份是由AI编写的。
    Your text includes parts written by AI.  
你的文本一部份是由AI编写的。  
而且ChatGPT生成的内容还会用黄色高亮标志出来。  


小哥对此表现:  
这是教育任务者始终想要的一个症结功用。
    这是教育任务者始终想要的一个症结功用。  
但教师们反省先生功课的时分,一段一段的把文字复制粘贴进来也至关繁琐的任务了。  
因而乎,这位小哥还贴心肠推出了另外一个新功用——可批量导入文件,反对Word、PDF和TXT等格局。  
而且网站在引见这个功用时,是这么形容的   


:   


除此以外,为了避免办事产生解体,小哥还搞了一个Python API,是曾经实现压力测试的那种。  


最初,小哥还贴心肠说了一句:  
我许诺,本网站对个体老师和教育任务者,放弃 收费
    我许诺,本网站对个体老师和教育任务者,放弃 收费!   
怎么做到的?   
它次要靠 “perplexity”,即 文本的“困惑度”作为目标来判别所给内容究竟是谁写的。   
NLP畛域的敌人们都知道,这个目标就是用来评估一个言语模型的好坏的。  
在这里,每当你喂给GPTZero一段测试内容,它就会分别计算出:  
1、文字总困惑度  
这个值越高,就越可能出自人类之手。  


2、一切句子的均匀困惑度  
句子越长,这个值通常就越低。  


3、每个句子的困惑度  
经过条形图的形式呈现,鼠标悬浮到各个方块就能查看相应的句子是甚么 (这里就两块,由于我此时输出的测试内容就俩句子)。   


之所以要绘制这样的条形图,作者也作出理解释:  
按照最新的一些钻研:人类书写的一些句子可能拥有较低的困惑度 (后面说过,人类的困惑度是对比高的),但跟着持续写,困惑度必将会泛起峰值。
  相同,用机器生成的文本,其困惑度是平均散布的,而且老是很低。
    按照最新的一些钻研:人类书写的一些句子可能拥有较低的困惑度 (后面说过,人类的困惑度是对比高的),但跟着持续写,困惑度必将会泛起峰值。   
相同,用机器生成的文本,其困惑度是平均散布的,而且老是很低。  
除此以外,GPTZero还会挑出困惑度最高的阿谁句子 (也就是最像人写的):   
反ChatGPT之风正盛   
正所谓道高一尺魔高一丈,在ChatGPT尽显十八般武艺之际,诸如小哥GPTZero同样“用魔法打败魔法”的工具、钻研也在层见叠出。  
例如比来斯坦福大学为了避免让先生借助ChatGPT之力来写论文或做弊,推出了“反侦查”神器—— DetectGPT。   
这类办法既不需求训练独自的分类器,也不需求采集实在或生成的段落的数据集,是一种基于几率曲率的零样本办法。  


除此以外,就连OpenAI本人也联结哈佛等高校机构联结打造了一款检测器: GPT-2 Output Detector。   


作者们先是公布了一个“GPT-2生成内容”和WebText (专门从国外贴吧Reddit上扒上去的)数据集,让AI了解“AI言语”和“人话”之间的差别。   
(RoBERTa是BERT的改进版。原始的BERT使用了13GB大小的数据集,但RoBERTa使用了包孕6300万条英文旧事的160GB数据集。)  
……  
嗯,看来ChatGPT在大步向前迈的同时,顺便还推进了“反ChatGPT”钻研的开展。  
参考链接:  
—   
百度钻研院、阿里达摩院、量子位智库  
年度十大科技讲演  
总结2022,预见2023。来自百度钻研院、阿里达摩院和量子位智库的年度十大科技讲演均已公布, 点击下方图片便可跳转查看。   
百度钻研院  
阿里达摩院  
量子位智库  
点这里 ?关注我,记得标星哦~   
一键三连「分享」、「点赞」和「在看」  
科技前沿停顿日日相见 ~

发表回复

您需要登录后才可以回帖 登录 | 立即注册

返回列表 本版积分规则

:
注册会员
:
论坛短信
:
未填写
:
未填写
:
未填写

主题30

帖子39

积分180

图文推荐

  • 撞穿学校栅栏害死十一岁男孩的司机不必坐牢

    一位女司机撞穿学校栅栏、害死了11岁男孩,被罚20

  • 全科医生正告花粉症时节正在好转

    全国各地的全科医生正告春季的开端标记着花粉症时

  • 新西兰总理:出世在新西兰的新纳粹Thomas S

    新西兰总理拉克森称新纳粹Thomas Sewell是坏人,

  • 新州护士和助产士承受暂时加薪3%的前提

    新州护士和助产士投票承受政府提出的暂时加薪3%以

  • 新纳粹份子如何利用“普通父母”的掩护在反

    星期天,新纳粹份子在反移民集会开端前大约一个小