华人澳洲中文论坛

热图推荐

    智源“剽窃门”最新通报:2处剽窃4处援用不标准,相干责任人均已被动到职

    [复制链接]

    2022-7-18 06:49:37 19 0

    原标题:智源“剽窃门”最新通报:2处剽窃4处援用不标准,相干责任人均已被动到职  
    金磊 Alex 发自 凹非寺   
    量子位 | 大众号 QbitAI   
    “2处属于 剽窃,4处 援用不标准。”   
    “相干责任人均已 被动到职。”   
    “大模型钻研核心 部门重组。”   
    ……  
    一篇名为 A Roadmap for Big Model、由 百人联结实现的 综述讲演,因涉嫌剽窃在国际外学术圈诱发了不小的关注。   
    对此,涉事单位 北京智源人工智能钻研院,通报了事情考察后的 最新后果。   


    除了方才提到的几点外,通报还指出了负担这次“剽窃门”事情的次要组织责任人,是 智源大模型钻研核心人员。   
    那末诱发国际外热议的学术剽窃事情面前,究竟产生了甚么?  
    2处剽窃,4处援用不标准   
    此次“剽窃门”的焦点,即这篇综述讲演是由智源钻研院大模型钻研核心牵头,并约请了国际外 19个机构共 100位科研人员撰写。   
    按照通报的引见,综述共由 16篇独立专题文章组成。   
    除了第十二篇以外,每篇文章都都有其对应的撰写作者和通信作者。  


    而一个中心的问题便出在了“合作”的过程当中。  
    在通报里的“组织失察责任认定”中,智源钻研院表现:  
    智源大模型钻研核心人员未严格根据学术出版标准的流程履行,在未与其余作者确认的状况下,于2022年3月26日将综述讲演上传至arXiv,负有 次要组织责任
        除此以外,这次的通报还对此前网友们关于综述内容的质疑片断做了回应。  
    首先,智源钻研院抵赖有 2处质疑片断 属于剽窃。   
    第一个剽窃片断是综述讲演 第2篇文章的2.3.1节,存在总计179个单词的多句反复。   
    按照 《学术出版标准:期刊学术不端行动界定》中的“论文作者学术不端行动类型”规则:   
    文字表述抄袭:成段使用别人已颁发文献中的文字表述,虽然进行了引注,但对所使用文字不加引号,或者不改动字体,或者不使用特定的摆列形式显示。
        这个剽窃片断属于这类规则的类型,并且也达到了 《IEEE出版物办事和产品委员会操作手册》中,“对不等同级的剽窃行动进行断定的指南”的 第5级。   
    断定的要点是:对一篇文章的次要部份逐字复制,虽有引注但不足明晰区别。  
    (注:剽窃共分5级,第1级最重大,第5级最轻微)   
    对此,通报表现,这篇文章中的两位作者(均为智源大模型钻研核心人员)分别负担 间接责任失察责任。   


    第二处剽窃片断,是第8篇文章的8.3.1节,存在74个单词的整句反复。   
    担任该段落的作者也是来自智源大模型钻研核心的人员,文章公布前未与通信作者确认,应负间接责任。  
    对此,智源钻研院表现:  
    上述两名作者曾经根据IEEE手册的对应纠正措施向原作者致歉,并失掉原作者原谅,执行了应该承当的相干学术责任。
        除此以外,通报还表现,质疑片断中的 4处属于 援用不标准。   
    它们分别是:  
    第10篇文章:存在多数反复文字  第十二篇文章:十二.2.3节存在总计36个单词的反复,无整句反复  第14篇文章:14.2.2节一处多句63个单词反复  第16篇文章:16.1节一处存在多句反复    而且智源钻研院关于上述问题所对应的作者也做了通报。  
    至于剩下的被质疑片断,通报表现“属于标准援用”。  
    “相干责任人均已到职”   
    在通报的最初,智源钻研院还发布了 “处置和整改后果”。   
    首先,智源钻研院要求可能存在问题文章的作者,向原作者做书面致歉,而且表现“均已失掉原作者反馈和原谅”。  
    其次,因为“2处剽窃”的涉事人员均是来自智源钻研院大模型钻研核心的人员,因此通报抉择:  
    重组该部门。
        而且相干责任人均已 被动到职。   
    而关于此次 颁发流程中存在的破绽,智源钻研院表现“曾经整改了论文颁发流程,并订正完美了科研诚信与学风建立轨制”。   
    与此同时,鉴于此次的事情,智源钻研院还做了后续的相干方案:  
    智源钻研院方案与学界和业界协作,制订更谨严的文献援用标准, 开发论文和代码开源检测工具和零碎,防止再次泛起相似问题。
      事情回顾 在看完最新通报之后,咱们也来一同回顾下这件事件的始末。  
    4月8日,谷歌大脑钻研员Nicholas Carlini发文指出:  
    A Roadmap for Big Model这篇文章剽窃了本人比来颁发的一篇论文。  
    他罗列了10个剽窃得对比显著的段落,并用绿色标出文字统一的部份。  


    Carlini发现这个状况的阅历也挺戏剧的:他的一个论文协作者原本想看看智源这篇文章有甚么值得学习的,后果有些部份越看越奇怪,最初发现原来该论文有些段落间接照搬了他们本人的文章。  
    (吃瓜吃到本人头上 .jpg)   
    同时经过采集数据初步核对,Carlini发现这篇论文还涉嫌剽窃十余篇来自其余作者的论文。  
    在Carlini暴光智源这篇文章涉嫌剽窃后,很快惹起国际外的普遍关注。  
    连LeCun都评估道:  


    有网友以为这是一个团队的先生写的,这些先生可能不敷分明学术标准,而其余大部份人都是挂个名。  
    还有人分享了本人遇到过的学术不真个事件。  


    一名疑似涉事论文的作者出来爆料说,过后留给本人的撰稿时间十分紧急,只要一周多,他猜留给先生的时间可能更少,所以就泛起了大段照搬的状况。  
    想要解决问题,应该给作者们更富余的时间和更多时机。  
    跟着事件发酵,智源民间也很快做出了回应。  
    4月13日智源公布了《对于“A Roadmap for Big Model”综述讲演问题的致歉信》;两天后又宣告成立考察组,就涉事论文发展独立考察。  


    7月15日,智源民间通报了考察后果。  
    智源这次的排查机制,以及最初这类地下通明的后果发布,也算是对比得当的处置形式了。  
    后来爆料智源论文涉嫌剽窃的Carlini起初也说,这篇文章遭到的关注比本人的预期要多很多,所以恳请大家不要把这变为一场“猎巫行为”。  
    Carlini支持有人提出的“此类事件件中一切相干人员该当当即被辞退、应该被arXiv封禁等”,他劝各位不要对这篇文章的作者们过分苛责,而应该把更多眼光投在全部学术畛域的风尚上。  
    也正如智源在此次通告中所述:  
    除上述智源钻研院相干责任人外,综述讲演其余一切作者没有剽窃及学术不端行动。在此对此次事情给这些作者酿成的负面影响和困扰表现诚挚歉意!
      再次诚挚感激各界敌人对智源钻研院的监视和批判!
        参考链接:   
    [1]. http://www.baai.ac.cn/portal/article/index/cid/5/id/423.html   
    [2]. http://www.baai.ac.cn/portal/article/index/cid/5/id/422.html   
    [3]. http://www.baai.ac.cn/portal/article/index/cid/5/id/504.html   
    [4]. http://nicholas.carlini.com/writing/2022/a-case-of-plagarism-in-machine-learning.html   
    —   
    「人工智能」、「智能汽车」微信社群邀你参加!  
    欢送关注人工智能、智能汽车的小火伴们参加咱们,与AI从业者交流、切磋,不错过最新行业开展&技术停顿。  
    ps.加好友请务必备注您的姓名-公司-职位哦~  
    点这里 ?关注我,记得标星哦~   
    一键三连「分享」、「点赞」和「在看」  
    科技前沿停顿日日相见~

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    中级会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题35

    帖子43

    积分203

    图文推荐