华人澳洲中文论坛

热图推荐

    FlagOpen大模型技术开源体系,开启大模型时期“新Linux”生态

    [复制链接]

    2023-3-1 22:02:51 14 0

    原标题:FlagOpen大模型技术开源体系,开启大模型时期“新Linux”生态  
    大数据+大算力+强算法=大模型”是以后人工智能开展的次要技术门路。言语大模型ChatGPT成为景象级运用,人工智能进入遍及运用的新时代。  
    智源钻研院2020年搭建大模型攻关团队,2021年6月推出过后范围最大、机能当先多模态大模型“悟道2.0”。为了推进大模型标的目的的协同翻新,在“科技翻新2030”新一代人工智能严重科技名目反对下,2023年终,智源钻研院联结30多家产学研单位独特承当的旗舰名目“人工智能根底模型撑持平台与评测技术”片面启动。经2个月集中攻关,开收回FlagOpen(飞智)大模型技术开源体系,旨在打造片面撑持大模型技术开展的开源算法体系和一站式根底软件平台,反对协同翻新和凋谢竞争,共建同享大模型时期的“新Linux”开源凋谢生态。  


    北京市副市擅长英杰和科技部高新司副司长梅建平列席任务会并致辞。  
    于英杰副市长指出,大模型的研发是一项体系化任务,波及数据、算法、算力及训练根底设施等。智源钻研院公布的FlagOpen大模型技术开源体系,是智源及上上游生态协作机构联结发展技术攻关的效果展示,为大模型技术翻新提供了“北京奉献”。同时,他关于大模型的开展提出了三点冀望:一是要捉住大模型开展时机,放弃定力,强化根底。要聚焦源头,翻新底层技术,鼎力冲破中心症结技术,抢占制高点。二是运用导向,推进大模型运用生态建立。要放慢大模型翻新运用开发及API办事凋谢,造成数据飞轮效应,发扬大模型的通用泛化才能,赋智经济社会开展。三是科研机构、企业等要环抱算法及技术钻研、数据等增强协同翻新,建设开源凋谢的协作生态。  


         于英杰 北京市副市长  
    梅建平副司长指出,面对大模型诱发的人工智能技术范式改革趋向,科技部从2021年开始超前规划大模型旗舰名目群,着力打造开源凋谢的大模型翻新生态体系。“人工智能根底模型撑持平台与评测技术”旗舰名目是全部名目群的中心,由智源钻研院联结30多家产学研单位独特承当。FlagOpen大模型技术开源体系便是旗舰名目的阶段性效果,将对我国大模型技术翻新才能的晋升提供首要撑持。此外,为知足大模型开展所需的算力需要,科技部正在推进建立“国度公共算力平台”和“中国算力网”,为科技翻新和产业智能化转型提供普惠算力。他同时指出,大模型开展需求技术翻新与伦理治理偏重,科技部也将组织探究钻研大模型的伦理治理问题,让大模型技术趋利避害,更好地发扬前沿技术的赋能作用。  


    梅建平 科技部高新司副司长  
    FlagOpen飞智大模型技术开源体系  
    开启大模型时期“新Linux”生态建立  
    FlagOpen(飞智)大模型技术开源体系是由智源钻研院与多家企业、高校和科研机构共建的一站式、高品质的大模型开源凋谢软件体系,包罗大模型算法、模型、数据、工具、评测等首要组成部份,旨在建立大模型畛域的“Linux”。  
    基于FlagOpen,国际外开发者能够疾速开启各种大模型的尝试、开发和钻研任务,企业能够低门坎进行大模型研发。同时,FlagOpen大模型根底软件开源体系正逐渐完成对多种深度学习框架、多种AI芯片的残缺反对,撑持AI大模型软硬件生态的百花齐放。  
    FlagOpen将经过Linux基金会、启智社区等开源组织,推进国际外开发者协同翻新。经过开源凋谢形式,寰球开发者能够自在探究、独特奉献、协同翻新。将来,FlagOpen也将撑持寰球AI企业、机构基于FlagOpen构建AI大模型软件发行版本、平台、商业软件等。  
    1. FlagAI :大模型算法、模型及工具一站式开源名目  
    为升高大模型开发和运用的门坎,进步大模型的开发效力,智源钻研院打造了大模型算法、模型,及各种优化工具的一站式、高品质开源名目FlagAI。  
    FlagAI集玉成球各种主流大模型算法技术,以及多种大模型并行处置和训练减速技术,反对高效训练和微调。  
    FlagAI涵盖多个畛域明星模型,如言语大模型OPT、T5,视觉大模型ViT、Swin Transformer,多模态大模型CLIP等。  
    坚持开源凋谢线路,智源钻研院也继续将“悟道”大模型名目效果开源至FlagAI,包罗“悟道2.0”通用言语大模型GLM,“悟道3.0”视觉预训练大模型EVA,视觉通用多工作模型Painter,文生图大模型AltDiffusion(多言语),文图表征预训练大模型(多言语)、EVA-CLIP(英文),阿拉伯语大模型ALM,百亿言语根底模型CPM3等。  
    目前,FlagAI曾经参加Linux基金会,吸引寰球科研气力对大模型技术独特翻新、独特奉献。  
    2. FlagPerf:面向多种AI硬件的一体化评测引擎  
    AI硬件评测对AI生态有首要价值,但因为AI软硬件技术栈异构水平高、兼容性差,运用场景繁杂多变,给评测自身带来了得多应战。  
    FlagPerf但愿独特探究开源、凋谢、灵敏、公正、主观的AI硬件评测体系,建设反对多种深度学习框架、最新主流模型评测需要、易于AI芯片厂商拔出曾经底层撑持工具的AI零碎评测生态。不以排名为中心指标,而以提供行业价值、增进AI产业生态开展为愿景。  
    目前该名目已和天数智芯、百度PaddlePaddle、昆仑芯科技、中国挪动等深度协作,独特推动AI硬件评测建立。环抱FlagPerf,也将有更多厂商和团队参加独特奉献的小家庭。  
    3. FlagEval:多畛域、多维度的根底大模型评测开源名目  
    大模型时期需求迷信、公正、凋谢的评测基准及工具来帮忙人们更粗浅的了解和意识模型,但在学术界始终不足能涵盖多种模态畛域、多种评测维度的一致化评测体系和名目。尤为在AIGC的开展浪潮下,如何对生成工作进行更高效、更主观的评估,是妨碍大模型落地的首要制约。  
    智源钻研院将联结多个高校团队,独特打造掩盖多个模态畛域、包孕评测维度的评测工具FlagEval,探究大模型自动评测技术,推进大模型技术翻新和产业运用。  
    FlagEval首先凋谢近期备受关注的多模态畛域-CLIP系列模型评测工具,反对多言语多工作、开箱即用。之后,更多畛域、更多维度的评测工具陆续公布。  
    4. FlagData:开箱即用、易于扩展的数据工具开源名目  
    数据是人工智能畛域开展的根底因素之一。跟着大范围预训练模型及相干技术不停取得冲破,在相应钻研中使用高效数据处置工具晋升数据品质变得日趋首要。  
    智源钻研院长时间投入数据建立任务,构建了寰球最大 WuDaoCorpora语料库,同时开发了一批数据处置的高效工具。  
    FlagData数据工具开源名目集成包孕荡涤、标注、紧缩、统计剖析等功用在内的多个数据处置工具与算法,为天然言语处置、计算机视觉等畛域的模型训练与部署提供了数据层面的无力撑持,有助于推进大模型的疾速开展。  


    林咏华 智源钻研院副院长兼总工程师  
    FlagOpen 大模型技术开源体系正在与Linux基金会等寰球开源代表组织与机构踊跃协作,放慢建立面向寰球的大模型技术开源生态。  
    寰球最大的AI畛域开源基金会- Linux AI & DATA 基金会主席堵俊平以为FlagOpen大模型技术开源体系的公布,是人工智能大模型时期开源翻新生态建立的首要一步:“将来,大模型畛域一定会泛起相似Linux的开源生态体系,开源凋谢减速AI技术翻新。”  


    堵俊平 Linux AI & DATA 基金会主席  
    Stability AI 寰球产品副总裁Christian Cantrell说:“咱们在开源社区中与智源团队协作,基于FlagAI开源的多言语文图模型才能,协作打造反对更多言语的分散生成模型。很快乐看到智源钻研院把大模型技术体系开源,这对寰球大模型翻新的推进和凋谢协作非常首要”  
    “数据飞轮”开源数据互助方案启动  
    大模型前沿训练营推进顶尖人材造就  
    时不我待,十年一遇信息技术产业改革席卷世界。  
    高品质数据与零碎性人材是这一轮计算机范式转变的症结因素。  
    本次公布会上,智源钻研院凋谢中文世界首个凋谢数据标注平台OpenLabel,与CSDN协作启动”数据飞轮”凋谢数据互助公益方案。方案以“咱们的数据,咱们的AI”为主旨,让泛博人民发生的数据,造福于泛博人民。  
    “数据飞轮”方案的指标是建立静态凋谢的首要大型数据集,为大模型、AIGC开展创立丰硕权威的大模型训练数据来源。智源钻研院但愿经过公益协作,夯实数据根底建立,增进数据翻新,推进国际外大模型训练钻研开展。  
    减速迈向人工智能大模型时期,必定伴有着大模型从精英学者到公众开发者的技术遍及。  
    为推进优秀大模型技术人材造就,智源钻研院与中国挪动钻研院、中科曙光、国度先进计算太原核心协作,与多所顶尖高校联动,面向穿插学科配景先生与相干畛域学者推出大模型前沿训练营,经过举行系列人工智能前沿地下课、翻新运用大赛与前沿讲习班,为大模型技术钻研和产业开展造就拥有实战教训的零碎性人材。  
    大模型是智能时期生态中心  
    FlagOpen建立大模型技术体系根基  
    智源钻研院院长黄铁军颁发题为《放慢建立人工智能开源凋谢生态》的宗旨演讲,他以为开源凋谢是智能时期的必定选择。  
    大模型经过同一模型实现多场景工作,成为撑持有数智能运用的根底平台,使得人工智能技术的大范围运用变成可能,减速了智能时期的真正到来。以后深度学习阶段的人工智能零碎拥有难以透辟了解的技术特性,智能时期不该关闭、必需凋谢、最佳开源,特别是作为根底平台的大模型需求片面开源、承受监视,能力失掉信赖、驳回和普遍运用。  


    黄铁军 智源钻研院院长  
    结合当下ChatGPT热潮,黄铁军以为,此类AI景象只是大模型技术“海立体以上”的冰山一角,深藏于“海立体下列”的大模型技术体系才是更值得关注的部份。从久远斟酌,打好根基,造成残缺的大模型技术体系及弱小的资源才能,将来能力发生更多的“ChatGPT级”的现场级运用。  
    FlagOpen恰是为了建设大模型技术体系而发展的根底性任务,经过开源凋谢的方式增进各类机构共创同享,造成良好生态,独特打牢大模型开展根基。将来将面向各类企业提供大模型相干技术办事,撑持各行业智能运用开发,赋能经济社会智能化降级。  
    FlagOpen开源生态协作  
    推进大模型产业价值晋升  
    为推进大模型技术在更普遍的规模失掉运用,在产业中发扬大模型的价值和作用,FlagOpen大模型技术开源体系已与中国挪动、浪潮信息、昆仑芯科技、天数等多家出名企业达成生态协作,并将FlagAI开源工具部署在中国挪动九天毕昇教育平台、浪潮AI Station等平台。  
    为增进人工智能与经济社会开展深度融会,智源联结多家单位发展大模型行业运用探究,次要有:联结中国挪动钻研院建设AI根底模型办事凋谢试验室,面向行业运用场景的听觉内容剖析等畛域进行大模型钻研与运用;联结浪潮信息建设大模型开源生态联结试验室,独特推进国产AI硬件底层软件的完美;联结中国电子云建设大模型国产算力云平台凋谢试验室,探究国产CPU的大模型适配部署;联结航天信息建设智慧政企人工智能凋谢试验室,探究税务、政务畛域的模型才能调优、模型研发、算法钻研等;联结工商银行共建数字金融凋谢试验室,努力于应用AI技术晋升金融生态垂直畛域智能化才能;联结启元世界建设认知决策大模型凋谢试验室,探究AI NPC、数字人AI等场景的大模型运用;联结核桃科技建设国产3D图形化AI编程平台凋谢试验室,独特发展基于开源体系的国产化编程平台工具研发。  


    为推进AI底层根底软硬件生态的共建同享和独特繁华,智源钻研院联结浪潮信息、昆仑芯科技、壁仞科技、天数智芯、燧原科技、摩尔线程等硬件企业,清华大学、北大、中科院计算所劣势团队,共建“北京国度新一代人工智能翻新开展实验区AI凋谢生态试验室”,独特发展根底软硬件适配、评测等任务,完成拉动根底软硬件对AI严重科研计算范式的优化,减速完美软硬件生态建立。  

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题23

    帖子33

    积分153

    图文推荐