|
原标题:最火线 | 百度公布大言语模型“文心一言”:具备多模态生成才能,机能有待市场检修
文 | 周鑫雨
编纂 | 苏建勋
一天前公布的GPT-4将OpenAI推上了“AI终结者”的地位,对于百度能否讲好中国大模型的故事的猜测也更甚。
百度给出了谜底。北京时间3月16日14时,百度科技园工区的标记性修建熊掌会议室中,百度宣告正式推出基于百度新一代大言语模型的生成式AI 产品“文心一言(ERNIE Bot)”。
列席阵容堪称奢华。百度开创人兼CEO李彦宏坐镇会场——这也是继2018年为自动驾驶平台“萝卜快跑”和智能视频音箱“小度在家”后,李彦宏时隔五年亲临公布会现场,为单个产品站台。
一样列席公布会的百度CTO王海峰。此前36氪报导中提及,王海峰也是文心一言名目的总指挥。
从2月7日立下公布大言语模型的“军令状”,到文心一言表态的短短一个多月,亦是百度在AI畛域十多年的积攒的试金石。
预期以内的答卷
前有OpenAI地下GPT-4,后有行将接入最新版ChatGPT的微软召开产品公布会,文心一言的公布备受压力。
不成否定的是,因为中文粘连度初等难以被AI处置的特点,文心一言的研发难度其实不亚于寰球巨头的。百度搜寻产品总监张燕蓟曾表现,中文语义的了解难度弘远于非中文,因此百度必需研发一个更难、更繁杂的大模型。
基于百度自研的ERNIE及PLATO系列模型,文心一言的症结技术包罗监视精调、人类反馈的强化学习、提醒、常识加强、检索加强和对话加强。李彦宏引见,文心一言大模型的训练数据包罗万亿级网页数据、数十亿的搜寻数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的常识图谱等。
公布会上,李彦宏用文学创作、商业案牍创作、数理逻辑推算、中文了解和多模态生成5个根底的Prompt(问答提醒),对文心一言的才能进行了测试。
从现场演示的后果来看,文心一言具备处置根底问题的才能,回答拥有一定的精确性、逻辑性和流利性,并提供了GPT-4目前其实不具备的多模态生成才能。但李彦宏也抵赖,在部份场景的精确性和了解才能上,文心一言仍无奈战胜大多言语生成大模型的通病。
此前,外界对于文心一言的产品状态就有诸多探讨。公布会暴-露了终究谜底。李彦宏表现,大言语模型将给产业带来三大时机,文心一言也将捉住时机:
大言语模型将给产业带来三大时机。
首先是提供新型云计算办事。文心一言将经过百度智能云对外提供办事,帮忙企业构建本人的模型和运用,李彦宏预报称,百度智能云将于近期举行旧事公布会,主题环抱文心一言的云办事和运用产品,既有私有云办事和也能够做公有化部署。
其次是提供行业模型精调的两头层办事。目前,百度文心大模型曾经在电力、金融、媒体等畛域,公布了10多个行业大模型。
最初是为运用提供大模型底座办事。李彦宏以为,对与大部份守业者和企业而言,从头开始做根底大模型其实不理想。因此基于通用大言语模型抢先开发首要的运用办事,这可能才是真实的时机。
AI,百度追求的新杠杆
去年十二月底的一次外部全员会中,李彦宏正视了百度这几年的颓势。
他说:“百度这几年过得对比苦,财报、业务增长性都不是那末鲜明……有些技术同窗做的事离市场很远,纯属自嗨,做了一两年发现货色没人用。”
以2010年“天然言语处置部”成立为终点,百度在AI上发力曾经超过十年。但直到去年,百度全年广告营收仍占60.4%,被寄与厚望的AI还在往撑起百度第二增长曲线的指标致力。
ChatGPT爆火后,三个月达到过亿用户,其注目水平也让国际科技公司趋之若鹜,一样身披搜寻+AI标签的百度,天然不会放过这一时机。2月初,百度CEO李彦宏的OKR暴光:“引领搜寻体验的代际改革”。
具有少量数据、技术积淀和业务场景的百度,是现有互联网企业中跑通大模型可能性最大、速度最快的一家——芯片有昆仑,学习框架有飞桨,模型有文心,运用则有搜寻、智能云、智能驾驶等宽广的落地场景。
文心一言的基座、2019年公布的通用大模型“文心大模型ERNIE”,目前以迭代至千亿级参数的ERNIE 3.0 Zeus,具备智能创作等天然言语了解和生成工作。在李彦宏的期待中,一旦文心一言与百度多项业务结合,数据和模型迭代的飞轮将会疾速滚动:“目前,ERNIE 3.0天天承受数十亿次用户的搜寻申请。这让文心一言可以基于一个宏大的、高效的数据池,疾速地学习和改进。”
3月16日起,文心一言官网针对大量用户开启了内测,后续将陆续凋谢给更多用户。另外,百度智能云行将面向企业客户凋谢文心一言API接口调用办事。
文心一言能否真能如李彦宏期待的那样,成为撬动业务开展的杠杆,还需求市场的检修。
36kr制图 |
|