华人澳洲中文论坛

热图推荐

    最火线 打造Data-Centric MLOps根底设施,构建企业AI理论新范式

    [复制链接]

    2022-8-26 15:36:35 62 0

    现如今,人工智能开展迅速且日趋遭到注重,机器学习曾经成为AI的中心技术。跟着人工智能开展走向纵深,在AI三因素(数据、算力、算法)中,数据已成为其中的中心部份,并向着高品质化、高专业化的标的目的蓬勃开展,“数据为王”的时期未然降临。


    人工智能在大数据、大模型的深度学习根底上,曾经造成用大数据替代教训、用算法挖掘常识、用并行计算确保模型训练的可行性的根本范式。
    UBS Global 钻研讲演发现:现如今AI工程师70%-90%的时间都破费在训练数据上。伴有着建模门坎的升高,数据的门坎却愈来愈高,使得训练数据变为了机器学习的瓶颈。
    现阶段,工程师在标注计划以及对应的建模调试方面,在样本数据的平衡性、可视化、统一性以及精确性等数据治理方面都投入了少量的时间和精神,这也是训练数据过程当中广泛存在的痛点。
    日前,倍赛科技CTO刘世林博士应邀在第四届智能制作翻新顶峰论坛流动中,进行了以“打造Data-Centric MLOps根底设施,助力AI提效”为主题的演讲分享,总结了企业在人工智能工程运用方面的两大理论标的目的。


    一个是基于中小型的模型,配合较多的“好数据”和较低的计算资源;
    另外一个标的目的则是使用大模型,用较少的“好数据”和较多的计算资源。
    能够看出,两个标的目的都离不开“好数据”,所以,刘博士保举企业AI的工程理论环抱Data-Centric MLOps的运用战略展开,更为便捷、高效地完成人工智能落地运用和产品交付。
    作为打造Data-centric MLOps策略的第一步,倍赛科技研发了新一代反对多模态数据的AI训练数据平台X1,全新的X1从功用层面由四大板块构成,Ontology Center,Annotation Suite,Dataset Curation,SOTA Models。


    Ontology Center(本体核心)
    本体核心是倍赛科技过来在履行了数万标注名目后重点打造的产品功用,将人工智能训练数据与模型之瓜葛在各行各业运用开展积攒上去的Know-How进行了笼统化的总结,目前已积攒了数千个本体,掩盖了自动驾驶、医疗、批发、工业、安防、金融等多个行业。
    X1能够自动剖析用户训练数据的特点并给出最好的本体保举,从而帮忙企业疾速定义AI的问题和数据到模型的需要标准,让企业把更多的精神聚焦在解决问题而不是定义问题。
    Annotation Suite(标注套件)
    倍赛的标注工具套件阅历了6年的打磨,已实现了两大的技术降级和革新。首先是从反对传统的繁多数据类型,如文本、图象、视频、语音、点云等,降级至反对新的多模态数据类型,好比文本+图象,图象+点云,视频+语音等等,能够反对更丰硕的建模需要和场景。
    其次是半自动的智能标注,倍赛目前曾经反对了从语音、文本、图象、视频、点云等全类型的预辨认模型的功用,均匀达到30%以上效力晋升。
    Dataset Curation(数据治理)
    X1的数据治理模块次要解决企业数据多、数据乱、品质纷歧等问题,新的平台除了设计了全新的交互界面和统计面板以晋升QC和数据办理的效力,还少量引入了AI才能的加持,好比标签的自动生成、数据的智能排序、搜寻、批量修正等实用功用。
    同时为了升高客户在数据投入上的本钱,X1完成了Active Learning的技术帮忙客户寻觅最有价值的数据,也集成为了得多数据加强的技术来解决客户数据的长尾问题。最初,数据治理模块也凋谢了SDK和API便利用户对接离线数据或实时数据,完成了人工智能运用闭环。
    SOTA Models (先进模型)
    X1不光光是解决了建模进程的数据软件问题,并且配备了最新的先进算法、预训练模型、凋谢接口的对接客户模型,从而解决得多客户建模工具碎片化的问题。关于没有AI配景或初级算法工程师的企业或个体来说,能够只需求往平台输出数据和简略标注,无代码或低代码便可实现后续的模型训练和部署。同时,倍赛在各行各业教训积攒也造成了倍赛共同的预训练模型的劣势,帮忙特定行业完成更低本钱更好成果的AI落地。
    据Gartner预测:到2025年,人工智能和数据迷信平台市场将以21.6%的复合年增长率增长到超过100亿美元。恰是因其微小的市场需要,倍赛科技将6年多的AI理论教训,凝聚成为了全新的Data-centric MLOps X1,初次向寰球面世。X1不光光提供SaaS版的私有云软件,也提供便捷的“一键式公有化部署”,解决无数据隐衷和数据平安需要的客户。实现了从“标注平台”到“一体化AI根底设施标的目的”的晋阶,构建最易于拜候的Data-Centric MLOps,用于衔接人、模型和数据。

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题23

    帖子30

    积分142

    图文推荐