华人澳洲中文论坛

热图推荐

    ChatGPT过错太多,正在制作挫伤

    [复制链接]

    2023-3-4 07:13:24 68 0


    芝加哥城市旧事署(City News Bureau of Chicago)是一家目前曾经开张的旧事机构,已经被誉为培训意志坚决的实地报导记者的传奇基地,该机构有一句著名的非民间格言:“假如你的母亲说她爱你,那也得去核实一下。”多亏了ChatGPT、新版必应搜寻(Bing Search)、Bard和少量基于大型言语模型的山寨搜寻聊天机器人的泛起,咱们不能不奉行该机构的陈旧信条。  
    钻研人员曾经知道,关于搜寻查问或任何基于事实的申请来讲,大型言语模型训练出来的引擎都远非完善,由于这样的引擎偏向于假造事物(人工智能钻研人员称之为“幻觉”景象)。但科技公司巨头以为,能够进行对话的用户界面带来的“利”大于“弊”(提供的信息不许确或是提供了过错信息),这些大型言语模型可以履行少量从翻译到做总结的天然言语相干工作,还能够将这些模型与其余软件工具结合起来履行工作(无论是进行搜寻仍是预订剧场门票)。  
    固然,当这些零碎发生幻觉时,可能会形成真实的侵害——乃至当它们没有发生幻觉时,只是从训练数据中学习了一些与事实有出入的货色,也会形成真实的侵害。Stack Overflow不能不阻止用户提交使用ChatGPT生成的编码,由于该网站上充斥着看似公道但实则过错的代码。科幻杂志《克拉克世界》(Clarkesworld)不能不住手承受投稿,由于得多人提交的故事并非他们本人创作的,而是ChatGPT创作的。一家名为OpenCage的德国公司提供可以进行地舆编码的运用顺序接口,该接口能够将物理地址转换为可以标志在地图上的经纬度坐标。该公司表现,因为ChatGPT的保举犯错(将其运用顺序接口作为一种仅按照号码就能查找手机地位的办法做了保举),他们不能不应答愈来愈多大喜过望的注册用户。ChatGPT乃至还帮忙用户编写了python代码,允许他们为此目的调用OpenCage的运用顺序接口。  
    然而,正如OpenCage自愿在一篇博文中解释的那样,这不是它提供的办事,也不是使用该公司的技术可以完成的。OpenCage表现,ChatGPT之所以有这样过错的设法,是由于它从YouTube的视频教程中学习了相干内容,有人宣称OpenCage的运用顺序接口能够用于反向推断手机地舆定位,其实这类说法是过错的。然而,那些教程只压服了多数人注册OpenCage的运用顺序接口,而ChatGPT却促令人们成群结队地注册OpenCage。OpenCage写道:“症结的区分在于,人们在承受别人的倡议时持疑心态度,例如在视频编码教程学习时,人们也会持疑心态度。但在人工智能或ChatGPT方面,咱们似乎尚无把这一点内化于心。我想咱们最佳把这一点内化于心,放弃适量的疑心态度。”  
    与此同时,在一系列对于其基于OpenAI的新版必应聊天功用的幽暗面的报导诱发人们耽忧后——聊天机器人自称希德尼,变得很急躁,有时乃至充溢敌意,极具要挟性——微软(Microsoft)抉择限度用户与必应聊天机器人的对话长度。但正如我和其余许多人所发现的那样,不言而喻的是,虽然这类对对话长度的随便限度让新版必应的聊天功用更平安,但也让它的功用大打折扣。  
    好比,我向必应聊天讯问了方案去希腊旅行的问题。我正试图让它为倡议的行程提供具体的时间支配和航班选择时,这时候忽然弹出“哎呀,咱们的对话到此完结喽。假如你还想持续和我聊天的话,就请点击‘新话题’!”  
    长度限度显然是微软自愿给出的“克鲁格”(不敷精妙,但还可以应付要求的解决计划),由于它一开始就没有对其新产品进行足够严格的测试。对于Prometheus(微软对新版必应模型的命名)到底是甚么,以及它到底有甚么功用,还有得多亟待解决的问题(没有人宣称新版必应有感知才能或自我认识,但新版必应泛起了一些十分奇怪的突现行动,乃至超越了希德尼人格的范畴,微软应该就此事做出解释,而不是伪装它不存在)。微软在地下场所对它和OpenAI如何创立了这个模型讳莫如深。除了微软以外,没有人切当地知道为何新版必应聊天机器人偏向于表演急躁的希德尼的角色,而当ChatGPT基于一个更小、功用更弱的大型言语模型时,它似乎表示得好很多——并且,微软对它已知的事件也是三缄其口。  
    [OpenAI的初期钻研发现,通常状况下,用更高品质的数据训练出来的较小模型会给出人类用户更喜爱的谜底,只管在一些基准测试中,它们的表示不如大模型。这致使一些人猜测Prometheus是OpenAI的GPT-4,该模型被以为比以前推出的任何模型都要大得多倍。但若是这样的话,微软为何选择使用GPT-4,而不是一个更小但机能更好的零碎来反对新版必应,这是真实的问题所在。坦白地说,此外一个问题是,假如OpenAI实际上意想到新版必应聊天机器人颇有可能让用户感到不安,那末为何它会倡议微软使用更弱小的模型呢?微软的钻研人员可能和许多人工智能钻研人员先辈同样,被当先的基准机能蒙蔽了双眼(他们能够向其余人工智能开发人员夸耀这些机能),但这些机能自身却是十分差的目标,其实不能代表人类用户的需要。]  
    能够确定的是,假如微软不尽快解决这个问题,假如其余公司,例如谷歌(正在致力完美其行将推出的搜寻聊天机器人),或者包罗Perplexity和You.com等守业公司在内的任何一家(曾经推出了本人的聊天机器人)标明他们的聊天机器人可以进行长期对话,并且也不会变身达米安这样的人格,那末微软就有可能在新的搜寻引擎之争中失去其先发劣势。  
    同时,让咱们花点时间来感触一下这样的反讽,微软,一家已经以本人是最担任任的大型科技公司而骄傲的公司(不无情理),当初却让咱们重回初期社交媒体时期“疾速行为,打破陈例”的艰巨往昔——可能结果更糟。(但我猜,当你的首席履行官痴迷于让他的次要竞争对手“舞蹈”时,乐队里的乐手们很难辩驳说,或许他们不该该当初就开始吹奏这首曲子。)除了OpenCage、《克拉克世界》和Stack Overflow以外,人们还可能由于过错的用药倡议而致使重大结果,由于相似希德尼的迫害行动致使某人自残或他杀,或者由于强化可憎的刻板印象和措辞而遭到挫伤。  
    我之前说过这一点,但我要再强调一遍:鉴于这些潜伏的要挟,当初是时分让政府染指,就如何构建和部署零碎制订明白的规则。基于危险的办法是终点,好比欧盟(European Union)的人工智能法案提案(A.I. Act)的最后草案中提出的设法。但危险的定义和评价不该该彻底由公司本人来抉择。假如没有特定的规范,就需求有明白的内部规范和相应的问责轨制。(财产中文网)  
    译者:中慧言-王芳

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    中级会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题35

    帖子44

    积分200

    图文推荐