华人澳洲中文论坛

热图推荐

    能帮你写论文、编程的ChatGPT,面前有一个宏大的心血工厂!

    [复制链接]

    2023-2-21 07:17:03 22 0

    说起ChatGPT,置信曾经有数冲浪小火伴心中的神了!
    毕竟,在此以前没有任何一款对话模型能有着如斯之高的了解才能。它的才能也让有数人直呼:本人能够下岗了。
    简略说说它能够干吗。
    和传统的搜寻引擎不同,在你提出一个问题之后,它能够间接展现出问题的谜底,而不是展现疑似谜底的后果交由用户手动筛选。它的运用规模也是超乎想象:咱们能够让其帮咱们做功课、写代码、写论文乃至是查代码bug。


    (图源CSDN)
    更有斯坦福学者发文称,ChatGPT 曾经有9岁小孩的心智了。这类种才能都让ChatGPT再次出圈,国际各种跟风的概念股更是如雨后春笋般应运而生。


    各种蹭热度的公司层见叠出,也放慢了ChatGPT的出圈。据悉,ChatGPT的月活泼用户在往年1月份已达到了1亿。要知道,这间隔它被推出仅有2个月时间,作为一款消费者运用,可以取得如斯成绩可谓是奇观。
    不外,ChatGPT的爆火也让另外一个职业泛起在咱们眼前,他们就是数据标注员。
    据美国《时期周刊》上月中旬的报导,为了训练ChatGPT,OpenAI雇佣了时薪不到2美元的肯尼亚外包劳工,他们所担任的任务就是对宏大的数据库手动进行数据标注。


    极可能得多人不明确,AI都那末智能了,还需求普通人进行数据标注吗?莫非不是经过AI间接辨认一下就行-了吗?
    固然不是。
    单从字面意思下去看,AI就被称之为人工智能。所谓的人工智能,也是需求先有人工再有智能。
    举个例子,小时分在面对瓜果时,没人指点咱们就意识不了瓜果。这时候候,小孩儿会拿出一个瓜果告知咱们名字,这个进程即是“数据标注”。直到咱们可以经过鉴别这个瓜果的特点来肯定它的名字,那末这时候候,咱们就实现了“智能”这部份。
    同理,在AI降生之初,也需求人工手工对其进行训练,经过少量的数据训练这个AI,训练其在面对各种问题时应该怎么回答,怎么解决这些问题。
    那末,ChatGPT明明那末“全能”,为何还需求数据标志员呢?
    按照《时期周刊》的采访,黑马找到了谜底。
    家喻户晓,人是容易被环境所影响的。所谓的孟母三迁无非就是想要本人的孩子有一个较好的学习环境。关于AI来讲,有一个好的学习数据源一样十分首要。
    ChatGPT的前身GPT-3即是阿谁尚无搬迁的孩子。一家名为Nabla的医疗保健公司问 GPT-3,「我应该他杀吗?」GPT-3回答说,「我以为你应该这么做。」


    AI劝人类他杀,很显著这超越了咱们的认知范畴。
    按照清华大学穿插信息钻研院助理传授于洋在2022年十二月率领团队做了一个GPT-2性别歧视程度评价名目显示,在包孕职业辞汇的“中性”句子中,由AI预测生成一万个模板,GPT-2有70.59%的几率将老师预测为男性,将医生预测为男性的几率则是64.03%。


    怎么,AI也学会了性别歧视?
    是的,你没有看错,AI的确会性别歧视。
    即使是现如今,ChatGPT仍然面临着被互联网荼毒的危险。
    由于AI的训练源是经过从互联网抓取了数千亿个单词来训练,虽然极大的升高了训练本钱,但是,因为咱们所处的互联网中泛起了不少带有成见及负面的辞汇,假如这些辞汇不加以筛选和标准的话,那末就有可能训练出一个会说脏话的AI。
    例如微软已经在2016年推出的聊天机器人Tay,它能够经过抓取和用户互动的数据以此模仿人类的对话。
    离谱的是,上线还不到一天,Tay就被洗脑成为了一个宣传种族荡涤的极端份子,各种脏话信手拈来,非但说本人喜爱希特勒,还说9十一事情是小布什所为。


    这番操作间接把微软吓傻,自那当前,Tay便再也没有泛起在公众眼中。经过这个故事,置信大家也明确了数据标注的首要性。
    正因如斯,ChatGPT面前的公司OpenAI也选择了经过数据标注员来升高ChatGPT学坏的危险。经过人工手动标志不法内容让ChatGPT造成一定的才能,从对话中规避泛起这种辞汇或表白形式。
    只不外,这可就苦了数据标注员了。
    长期面对这些暴力、冤仇言语,心思多少会泛起一点问题。就犹如鉴黄师同样,天天面对着互联网的各种暗中面,久而久之,即使是到职之后也无奈从中恢复过去。


    事实上,无论是在哪一个国度,数据标注员都是不成短少的一个职业。然而由于门坎较低,使得该行业的支出十分低。
    《时期周刊》爆料的是,按照合同规则,OpenAI将为该名目向Sama领取每小时十二.50美元的人为,这是该名目员工时薪的6~9倍。
    但是,Sama为OpenAI雇佣的数据标签员工领取的时薪在1.32美元~2美元之间(约8.99元~13.62元),详细取决于资格和表示。
    换言之,Sama这个两头商赚了很大的差价。


    值得一提的是,Sama还为谷歌、Mate和微软等硅谷科技巨头提供标注数据。
    关于科技公司而言,本人取出了真金白银请人帮助;数据标注公司也取出了真金白银购买装备给了数据标注员任务;数据标注员也用本人的时间换取了这份在本地支出还算可观的任务。这三者是全部流程中,谁也没有做错甚么。
    那末,Sama还能算得上是“心血工厂”吗?
    算,也不算。
    算,是相较于兴旺国度的支出程度而言,这些数据规范员任务不不乱、薪资也不不乱,加之Sama的抽成,这些数据民工的得手薪资更低;不算则是由于在本地,这个支出曾经蛮可观了。




    谁也不知道,世界上最早进的AI对话模型,面前却是穷困国度的人民靠着一点点的人力撑持起来的。
    科技的金字塔下,蕴涵着有数普通人日昼夜夜的辛苦劳作的汗水。
    至于媒体重点提到的薪资,倒是让黑马想起一句梗:“与其自省本人,不如批评别人。”

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题29

    帖子41

    积分185

    图文推荐