华人澳洲中文论坛

热图推荐

    36氪首发|「将来速度」获数百万美元天使轮融资,Xorbits减速大范围数据处置和AI

    [复制链接]

    2023-2-27 12:10:39 23 0

    作者|肖千平、周倩
    编纂|彭孝秋
    36氪得悉,「将来速度」日前实现数百万美元天使轮融资,由耀途资本独家投资,融资资金将用于产品研发、用户体验改良和云平台搭建。
    将来速度成立于2022年,旗下产品Xorbits为散布式数据迷信计算框架,旨在减速Python生态下大范围数据的处置。
    Python作为一门容易上手的编程言语,拥有较高的开发效力,同时有Pandas、Numpy等丰硕的第三方库帮忙简化操作,是大数据及AI畛域的规范言语之一。但是,在金融量化剖析、生物基因测序、地舆空间多维度剖析等实际运用中,Python却可能面临运转效力较低、单机运转第三方库时内存缺乏等诸多应战。
    对此,Xorbits应用多核、异构、散布式等技术,减速履行已有代码,进步顺序运转效力,可以掩盖迷信计算、数据迷信和机器学习等维度。同时,Xorbits还可兼容Pandas、Numpy等现有的Python数据迷信库,用户无需学习新接口便可实现代码迁徙,获取并行减速成果。
    “就像在装修房子,咱们调配10集体铺地板,5集体刷墙,把大的计算工作合成成得多小工作。”将来速度CEO秦续业告知36氪。为了完成减速功用,Xorbits采取了分而治之的并行计算形式。详细来看,用户调用Xorbits函数时,Xorbits客户端将构建相应的计算图并提交至办事端,计算图将在办事端被处置成多个小的履行单元,再由调度器散发工作给worker履行处置。
    “市面上一些大数据或并行计算框架,采取的是更加集约的调度形式,比如先让10集体把地板铺完,才开始刷墙。”秦续业引见。为了不相似的算力挥霍,Xorbits为细粒度调度引擎,能让工作细分与调度更为精密,如默许使用深度优先战略以及早释放两头后果,增加计算使用的峰值内存等,目的在于以最优解进行调度。另外,Xorbits还进行了计算图静态列裁剪、图融会、反对迭代式tiling等优化任务。
    比拟国外Dask、Modin等计算框架,Xorbits在履行模式上也有其特色。计算框架履行模式次要分为当即履行与提早履行两类。当即履行可在调用框架时当即计算,便利用户操作,但也紧缩了机能优化的空间;提早履行则象征着顺序构建实现后,用户需求在一定节点手动调用函数等触发履行,拉高了使用门坎。而Xorbit采取了特殊的推延履行形式,能够推断用户所需并自动将工作提交履行,尽量增加用户操作,以此均衡计算框架的机能与易用性。
    基于上述设计,在面对scale factor 100(约100GB数据集)和scale factor 1000(约1TB数据集)的基准测试中,Xorbits比拟同类计算框架,运算速度能快3-7倍,且体现出更高的机能与API兼容性。


    xorbits在机能上比竞争对手快7倍摆布
    在详细办事方面,Xorbits与多个云厂商展开协作,提供云上SaaS办事,用户改变相应代码便可进行云上运算提速。Xorbits会按照用户估算及诉求,权衡机能和性价比,为用户选择适合的计划。另外,因为Xorbits是开源平台,用户可以独特参预平台保护,并帮忙平台进一步完美。
    目前,Xorbits开源产品已正式公布,将来速度方案将进一步开展其开源社区,吸引更多用户独特建立平台,同时也将继续推动产品迭代,进一步简化操作。
    团队方面,将来速度成员次要来自阿里、华为、微软等企业,在大数据及Python畛域教训丰硕。开创人秦续业结业于上海交通大学,曾在阿里云长时间担任Python数据和AI畛域任务,主导并开源Mars开源名目。
    投资观念:
    耀途资本开创合伙人杨光表现,“数据迷信和人工智能(DSML)的突起面前,是?Python工程师的突起。Python native生态会在将来根底设施中表演愈来愈首要的角色。Python数据剖析、数据迷信和机器学习,不该该仅仅停留在单机,咱们看好Xorbits成为推进Python从单机走向散布式的症结气力。”

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题32

    帖子41

    积分181

    图文推荐