华人澳洲中文论坛

热图推荐

    ChatGPT上岗医疗还有多远?哈佛传授亲测表示接近医生,云知声被曝打造行业版

    [复制链接]

    2023-2-22 21:31:26 17 0

    原标题:ChatGPT上岗医疗还有多远?哈佛传授亲测表示接近医生,云知声被曝打造行业版  
    白交 发自 凹非寺   
    量子位 | 大众号 QbitAI   
    国际玩家如火如荼入局ChatGPT,其在各行业出圈也引人注目。  
    但详细何时能上岗尚且还不清晰,尤为像一些通俗、壁垒性高的行业,好比医疗。  
    当初,一名哈佛医学院传授,就亲身下场测试ChatGPT的表示。  
    后果显示,它在45个案例中的39个诊断正确,正确率87% (超过了现无机器诊断率的51%);并为30个案例提供了适量的分诊倡议。   
    他表现,ChatGPT辅佐诊断的表示,曾经接近医生。既然如斯,那何时能够上岗?  
    事实上,这也是目前国际大少数玩家所面临的问题: 红利在此,如何率先吃掉?  


    此前咱们也零碎性地梳理过复刻中国版ChatGPT面前的技术与生态难度,显然不是短时间就能完成的。  
    当初曾经衍生出来一种新思绪: 间接打造行业垂直版ChatGPT。   
    这类形式是不是可行?  
    打造行业版ChatGPT可行吗?   
    ChatGPT的打造,技术中心绕不开算力、数据和算法三因素。  
    算力方面,OpenAI背靠微软这头奶牛——具有28.5万个CPU中心、1万个英伟达V100 GPU,光是训练一个GPT-3,费用就高达460万美元; 数据上,GPT系列几经迭代优化,一度惊艳世人的GPT-3就有1750亿参数,而上一版本GPT-2只要15亿参数; 算法天然也有多年深挚的积攒,不然也不克不及泛起“类人”自主学习特点,并且进一步展示出疾速顺应多畛域、多场景的才能。   
         再加之生态反哺技术,造成迭代闭环。OpenAI自GPT-3开始就以凋谢接口的方式,构建起了专属 “GPT生态”。据gpt3demo网站统计,目前已有656个调用GPT-3系列模型开发的运用顺序。   


    这样的 技术与生态壁垒,抉择了复刻ChatGPT并不是那末容易。既然如斯,垂直版ChatGPT的解决思绪也开始外行业中讨论。   
    首先从 技术下去看,他们的中心应战次要在于以更少的参数,好比以百亿范围参数量,在垂直畛域的工作达到或超过ChatGPT的成果。   
    这可能比复现ChatGPT更难,由于参数数量要小得多,不克不及仅仅依赖“暴力美学”,还要有高超的模型设计和紧缩技能。  
    此外一个应战是 数据来源的不同。   
    像谷歌、微软他们其实有自然的通用数据来源,但公用数据积攒不克不及跟垂直玩家比拟。  
    尤为像医疗等民生行业,专业性强掩盖面广,所需的高品质数据可能其实不比ChatGPT小,且大部份数据不是网上能够抓取的。  


    但对多年深根于此的垂直玩家来讲,他们早已构筑起本人的产业生态,有丰硕的行业数据和常识积攒,为复现ChatGPT奠定了须要的根底。  
    并且从 价值需要来看,垂直行业所代表的价值是实真实在的。像医疗自身需要就不小,一旦ChatGPT落地医疗,所代表的社会价值很大。   
    以往用户们会习气性使用的用搜寻、APP来帮忙诊断本人的疾病,但往往可能收效甚微。  
    哈佛医学院传授Ateev Mehrotra曾测试,现有的在线诊断器均匀正确率仅在51%,而ChatGPT则有87%,因此他以为ChatGPT有可能成为医疗诊断的游戏规定改动者。  
    为了减速ChatGPT运用落地,从技术难度、价值需要等维度看,打造垂直版ChatGPT是可行的。  
    而当初国际有AI玩家,曾经在这样做了。  
    云知声ChatGPT行业版   
    最新暴光的停顿,智能语音赛道独角兽云知声正在推动ChatGPT行业版的建立——  
    以医疗作为切入口,构建ChatGPT医疗行业版,同时基于ChatGPT行业版构建平台,疾速扩展到其余畛域,再利用畛域模型集成MoE(Mixture of Experts)技术,训练失掉通用ChatGPT模型。  


    而这类从公用到通用的思绪。实际上是云知声一向的 “U+X“做法。在这里, “U”指的通用大模型算法研发及高效训练底座平台; “X”则是运用于多个行业畛域的公用大模型版本。   
    事实上这也正在成为不少企业入局ChatGPT的思绪,这样一来,能够利用已有的公用数据劣势。  
    不外也不是那末容易走的,更何况云知声选择的,仍是对生成内容品质要求更高的医疗行业作为切入口。  
    最重要的困难,是要进步医疗常识的牢靠水平。ChatGPT最长于的,就是一本正派地胡言乱语。放在当初Bing上聊天搜寻、内容出产其实问题不大,用户们也乐在其中。  
    但运用外行业中,往往让非专业人士难以察觉,这会诱发各种危险。因此行业版ChatGPT要根绝所有胡言乱语,尤为像医疗、教育、工业等行业,内容生成要求极高容错率很低,也对数据的品质要求也就更高了。  
    其次,就是完成行业中的“性价比”。任何一项技术可以大范围落地,都必需要解决「如何以无限的资源,完成成果的最大化」问题。  
    这也是ChatGPT行业落地的必经之路—— 模型能以更小的参数范围,达到与ChatGPT一样的成果。这也就给这些企业带来了不小困难。   
    事实上,云知声也坦言,ChatGPT行业版的参数可能也需求达到百亿量级范围,要做出成果并完成范围化运用应战也不小。  
    从某种水平上说,打造行业版的ChatGPT比当初通用的ChatGPT还要更难,但到真正ChatGPT行业落地时,这些问题又都必需得解决。概括来讲,就是完成ChatGPT工程化才能。  
    这是每个躬身入局者,绕不开但必需得过的路。  
    在此根底上,毫无疑难的是,云知声的选择更难——医疗作为切入口。这是一直被以为是行业壁垒高、专业性强、技术难度制高点的畛域,也是为何相较于其余行业的盛况,医疗AI玩家就显得少之又少的缘故。  
    但一旦将医疗版ChatGPT买通,那末其余畛域的完成,包罗最初的通用大模型也就事倍功半了。  
    作为成立于20十二年的AI公司,他们始终亲密关注AI前沿技术,并踊跃推进技术产业化运用,包罗20十二年的深度学习算法降级和产业化运用,到2016年Atlas超算平台、常识图谱和全栈AI技术运用,到当初基于ChatGPT框架的AGI认知技术降级。  
    同时,在医疗行业有近10年深耕,积攒的行业常识、数据和运用,还获取了2019年北京市科技提高一等奖。  


    在回应是不是有决心打造ChatGPT行业版时,云知声方面表现: 彻底有决心。   
    后面总结,打造ChatGPT离不开高品质的数据,当先的算法和充沛的算力。而关于垂直版ChatGPT还需求更深挚的工程化才能。  
    从这几方面来看,云知声确实拥有行业参考性。  
    数据方面,近10年来云知声积攒了全方位的行业数据,包罗面向患者的导诊、预问诊、患者教育和随访零碎,也有面向临床的语音病历,病历质控,单病种质控和医疗危险办理零碎,已有近400家病院落地使用。 据称数据范围已达到了5T,为医疗行业言语大模型提供数据根底。   
    算法方面,而ChatGPT所代表的认知智能,自身就是云知声中心技术劣势。他们构建了国际最大的医疗常识图谱之一。从2019年至2022年,云知声的认知智能技术在国际外相干评测中荣获7冠5亚。其自主研发的医疗预训练言语模型CirBERTa一度登顶中文医疗信息处置应战榜榜首。   
    算力上,云知声超算平台浮点计算才能可达8亿亿次/秒,可为千亿级参数范围模型提供算力保障。   
    而在 大模型工程化方面,云知声曾经研发了CirBERTa模型,复现了GPT-2模型,并利用模型紧缩和常识蒸馏机制,完成了线上推理效力的近百倍减速,为大模型的普遍运用奠定了根底。   
    另外作为行业版ChatGPT, 内容品质保障也是症结一环。   
    云知声给出的解决计划是,利用运用在CirBERTa的继续学习和常识嵌入技术,基于已有常识图谱积攒,优化ChatGPT模型的常识获得和更新机制。  
    据引见,这样一来能够包管ChatGPT回答中的常识正确性,与此同时还能够给出常识溯源信息。  
    此外,利用云知声业内当先的病历质控技术,能够自动发现生成的病历中的问题,进而自动生成作为ChatGPT中心技术的基于人类反馈的强化学习 (RLHF,Reinforcement Learning from Human Feedback)所需的用户反馈数据,减速模型的优化。   
    谁最早吃掉ChatGPT红利?   
    最初回到事情自身,此前论及ChatGPT对行业的价值,都是从微观上的产业生态和模式翻新上谈,好比对人机交互、信息散发、内容出产等方面。  
    如今跟着愈来愈多的垂直企业入局,ChatGPT对企业的意义也跃然纸上——一种全新AGI的技术范式选择: 基于“大范围通用根底模型+轻量级行业运用优化”的行业常识整合和问题解决办法。  
    以往这些场景玩家,关于AI的探究可能处于“看山是山、看山不是山”的懵懂形态,当初泛起了一座“更小,并且明知会有路的山”。  
    ChatGPT所表示出来的“智能”,给他们带来了一种明白的技术标的目的。  
    云知声CEO黄伟也深有领会,乃至于相较于AlphaGo,他以为ChatGPT所带来的影响要深挚很多,至关于一场新的 “工业反动”。   
    这场反动最大的劣势是,经过自监视留意力机制,可以充沛利用海量无监视数据训练通用根底模型,并将感知、认知与生成,用一致框架完成“端到端”的整合,间接从高品质生成后果下来呈现机器智能。机器采用的人工疏导的数据驱动学习办法,与人类的逻辑思惟形式是彻底纷歧样的,相似飞机所采取的喷气式“空气能源学”机制,与鸟类采用的“扇动翅膀”形式彻底不同。  


    不论是对全部产业,仍是单个企业而言,ChatGPT所带来的价值的确让他们不跟不行。  
    尤为关于一些场景玩家来讲,他们仍是最有可能吃掉ChatGPT红利的一拨人。  
    他们有场景无数据、有深挚的行业壁垒,一旦具备ChatGPT才能,就能率先外行业落地。这是其余玩家所不克不及及的先发劣势。  
    上一次AI浪潮来袭时,终究也是场景玩家率先吃掉AI红利。只不外当初ChatGPT是间接以技术门路泛起,落地速度天然要比以往快很多。  
    云知声CEO黄伟也给出了个明白的时间点:  
    年内就会完成胜利运用落地的计划。
        年内就会完成胜利运用落地的计划。  
    —   
    《中国AIGC产业全景讲演暨AIGC 50》调研启动  
    谁会是中国的“ChatGPT”?最有竞争力和后劲的AIGC气力位于何方?  
    量子位《中国AIGC产业全景报暨AIGC 50》正式启动对外征集,期待有更多优秀的机构、产品、案例与技术可以被公众看到。   
    点这里 ?关注我,记得标星哦~   
    一键三连「分享」、「点赞」和「在看」  
    科技前沿停顿日日相见 ~

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题29

    帖子38

    积分171

    图文推荐