华人澳洲中文论坛

热图推荐

    超融会时序数据库 YMatrix 在数字汽?和???脑的理论

    [复制链接]

    2022-10-22 09:49:01 32 0

    导读:明天分享的主题是 YMatrix 在数字汽?和???脑的理论,首先引见时序和物联网开展趋向,基于传统技术架构提出我司研发的产品——YMatrix 超融会时序数据库的一些技术特征,最初针对数字汽?和???脑案例做一个分享。
    明天的引见会环抱上面三点来展开:
    时序和超融会数字汽车工厂大脑01
    时序和超融会
    1. 全?数字化时期到来,拐点泛起


    上图是美国 Statista 机构于 2021 年公布的一项统计讲演,从讲演中能够显著看出,从 2020 年开始,寰球联网的物联网装备曾经超过了非物联网装备;预计到 2025 年,寰球物联网装备的数量可达非物联网装备数量的 3 倍以上。由此能够看出,将来由“物”发生的数据要远远超过“人”发生的数据。
    相似地,DB-Engines 的排名也体现出了类似的趋向:


    上图中,时序数据库的趋向遥遥当先于其余类型的数据库。这一点阐明了两件事件:
    (1)用户对时序数据库的关注度十分高。
    (2)业内现有的产品无奈很好地知足物联网、工业互联网等新兴场景的需要。
    另外,?肯锡在《物联?:捉住减速机遇》中指出:到 2026 年,IoT 数据市场范围将达到 1000 亿美?,?且“IoT 最?场景在中国”;?物联?场景中最典型的数据是“时序数据”。
    2. 甚么是时序数据
    ① 时序数据简介
    时序数据是时间序列数据,即带有时间戳的数据序列。这个序列中的?个数据同样成为数据点(data point),?个数据点一般为?个(timestamp,value)对。


    能够有得多时间序列,每个时间序列有??的节拍。


    以冰箱为例,冰箱的温度能够组成时序数据的一条线,而电压、电流则构成此外的一条时序数据;两条时序数据的节拍能够是不同的。
    ② 时序数据的存储和查问
    每一个条时间线(即时间序列)都会有不同的动态属性,经过动态属性能够区别时间线。


    最典型的动态属性就是名字,不然无奈区别时间序列是甚么含意。上图中,以 CPU 使用率为例,在不同的时间点,都可采集到 CPU 的使用状况;至于对应的是哪一台 CPU,这样的信息是经过动态的属性——IP 来标注的。


    如上图所示,时间序列数据的存储,个别是包孕动态属性和静态目标两个部份来存储。
    时间序列数据的查问多是多种多样的,例如,查问某一指按时间线的最新值,或者查问某一时间序列在指按时间段内的目标变动,以及某段时间内多个时间线的目标值或者聚合值的查问等。


    ③ 时序数据的罕用剖析场景
    对不同时间线之间的相干性进行探究和剖析,这个场景在物联网、车联网、工业互联网等十分常见。


    以前的时序数据次要运用场景在 APM(运用零碎监控)中(典型运用产品如 Prometheus),这种产品更多地是关注一类目标(例如 CPU,拜候次数等),到了物联网时期,咱们的关注点更多地在于一个实体。以某台数控机床为例,经过监测数控机床上刀片的角度、力度等信息,以反映该数控机床的形态;再以常见的汽车为例,将车速、地位等信息绑定在该实体上,该实体的不同属性之间会存在很强的相干性。
    因此,时序数据存在多种不同的处置形式:能够着重剖析某繁多目标的时序特点,也能够片面剖析某个实体内多个序列之间的特点。


    以上图的冰箱为例,两台不同品牌不同型号的冰箱,每台冰箱都有温度、湿度、耗电量这 3 项目标,每个目标跟着时间的推移都会记载一个目标值;同时,每个冰箱都会有一些标签。这是物联网中常见的一类场景。
    3. 时序数据建模
    如前文所述,时序数据存在两种解读形式:一种是把目标作为中心,另外一种是把实体(即装备)作为中心。基于这两种解读形式,能够衍生出三种常见的数据建模?式:窄表模式、宽表模式及树型模式。
    ①窄表模式
    ???个数据点,能够? KV 数据模型,也能够?瓜葛数据模型。留意窄表不是字?意思的字段个数多少,?是??只表现?个数据点。


    如上图所示,将时间、装备编号、城市作为主键,每笔记录一个数据点(风速或风向);可用 OpenTSDB 等数据库存储。
    ②宽表模式
    ??表现多个数据点,通常采?瓜葛数据模型。能够??张表,也能够?多张表。留意宽窄定义不依据字段个数,?是??表现?个数据带仍是多个数据点。宽表也能够只要 5、6 个字段。


    实际存储的时分,能够将动态属性表和时序数据表离开存储,以进步存储效力。
    ③树形模式
    与窄表区分是以层级?式组织动态属性(元数据)。
    树形模式的实质也是一种窄表模式,在窄表的根底上对动态数据做了层级化处置,而静态数据的处置形式和窄表相反。


    综合比较这3 种存储模式的优劣,能够看出:


    窄表模式写入效力高,查问效力低,特别是多装备多维度的查问。宽表模式查问效力高,然而写入效力低,特别是装备测点的分批次写入。树形模式能够以为是窄表模式和宽表模式的一种折衷。4. 时序数据是企业海量多样化数据的?部份
    ①传统?案形成繁杂、低效、孤岛化的现状


    在物联网畛域,将来的数据维度也将呈现愈来愈多样化的趋向:
    跟着运转装备无休止地发生数据,时序数据的数据量将日趋增大;瓜葛型数据依然占有很大的一席之地,个别会存储大量低价值的数据;其余包孕文本数据、GIS 数据、Json 数据(半构造化数据)、Lidar 数据(点云数据)、视频帧数据、图象数据等诸多等类型的数据。基于以上多样化的数据,采取怎么样的技术架构以解决企业多样化数据的写入、存储和剖析的问题,会带来得多的应战。


    目前一些大型企业采用的常见的计划,是针对不同的数据类型,使用不同的数据库产品进行存储;关于买卖型数据(TP),使用 Oracle/MySQL 存储;关于剖析型数据(AP),使用 Greenplum 等数据库存储;关于时序数据、图数据等公用数据库,使用相应的数据库产品存储;另外,通常还会使用诸如 Hadoop/Flink 等各种各样的大数据产品。
    使用这样的架构和技术栈,会形成数据的孤岛化,每减少一种数据产品的使用,就会带来一个新的数据孤岛;有孤岛就会有深井存在,因此很难建设全局的 whole picture;因此想要进行片面的数据剖析,需求首先穿墙打洞汇总数据造成数据湖,然而这样会使全部流程变得繁杂低效,并且各类数据的品质也会错落不?。
    ②YMatrix:?机能超融会数据库


    上图中,左图展现的就是传统的全架构技术栈,关于不同的数据使用不同的产品去存储,以撑持不同的业务,这样会把繁杂留给用户,会致使业务运用过程当中纷简约杂且非常低效。
    基于以上痛点,YMatrix 提出了一种全新的形式,即超融会高机能数据库,如下图所示。基于这样的形式,业务端和数据库端边界划分明晰,业务端对数据的使用也将会变得十分简略;比拟于传统的繁杂架构,YMatrix 构造简略明晰明了。
    YMatrix 架构图如下,欢送实测,实测链接如下:
    http://ymatrix.cn/download


    从 YMatrix 架构图能够看出,全部数据库会少量共用根底设施。包罗认证办理、事务管制、监控备份等,也包罗优化器,以及各种通用组件等;同时,会按照不同的场景使用不同的引擎,例如 TP 引擎、AP 引擎等,目前时序引擎曾经投入使用并失掉了客户良好的反馈,下一步会将内存引擎落实。
    经过上述的形式,在数据库中经过不同的引擎以反对不同的业务场景,同时各个不同的引擎之间能够间接关联,完成数据架构的“超融会”。
    前文所述是逻辑架构图,关于散布式和线性扩展,YMatrix 采取经典的 MPP 架构,即大范围并行处置,反对从单节点到数百节点,最大可反对 100PB 原始数据量级。


    ③小结
    新时期需求新技术栈,以满?新业务、新场景、新数据和新?户;关于物联网相干行业,以及传统行业的数字化转型,企业需求卓着的数据基座?不是单品数据库,需求的是?站式的?数据平台,而不是将各个运用像拼图同样拼接。


    02
    数字汽车
    1. 汽?数字化是汽?业演进的次要趋向之?
    ①数字汽车简介
    前文具体引见了时序数据和超融会,并引见了 YMatrix 数据库的架构和功用。上面将会引见两个实际的案例运用。第一个案例是数字汽车。
    在汽车行业,数字化和智能化是次要趋向。基于这样的趋向,又演化出两个畛域:自动驾驶和智能座舱。因为自动驾驶畛域波及诸多法律法规要素的牵制,因此智能座舱成为数字化的首要畛域。前几年智能座舱能够成为一台汽车的中心竞争力,但如今假如没有足够先进的数字化技术做撑持,很难造成足够的竞争力。
    而经过汽车的数字化,能够发展多种业务,包罗车辆驾控、车辆后市场办事、出行办事、生态办事等,将用户的数据、车辆的数据和场景的数据整合到一同,为客户提供全新的更优质的体验。


    2. YMatrix 在数字汽车畛域的运用
    ①整体架构
    下图是 YMatrix 在数字汽车畛域一个运用案例的简化架构图:


    最左侧是少量的汽车,时辰发生时序的数据;时序数据经过 GB32960、JT/T808、MQTT 等规范将数据发送出来;企业通常使用 Kafka 等工具承接这些数据;不同的消费者会拉取 Kafka 中不同 Topic 的数据,做相应的数据解析,发送给对应的数据库集群;YMatrix 为完成高吞吐、低提早的负载平衡,提供一种专门的组件——MatrixGate,能够完成负载平衡,也能够对短时装备毛病进行数据修复,以确保业务的正常运转;MatrixGate 接纳到数据后,以秒级乃至毫秒级的提早,便可写入到 YMatrix 高可用集群内;用户经过 SQL 从 YMatrix 中抓取数据以完成智能座舱、画像剖析、行动预警、实时查问等业务剖析和运用。这样的架构,比较传统的基于 Redis、OpenTSDB、HBase、Hive、HDFS 等多种产品集成的架构,要简洁得多。
    ②数据建模
    数据分红得多类,其中一大类是车机信号,即每辆车的地位信息、车速、胎压等信息;将以上信息寄放在一张表中,包罗 vin 号、时间戳、800+ 常见目标等,并经过 JSON 存储每辆车的新增目标或者不罕用目标。
    除了车机信号,零碎还能够存储各种瓜葛型数据,包罗?主信息、颐养记载、借贷信息等。


    ③存储模型
    关于车机信号表:
    采?自研的时序优化 MARS 存储引擎按天分区,进行冷热分级存储。热数据存储在当地磁盘,冷数据采?内部表存储(例如 S3、HDFS 等)以升高存储开消分区?动办理,完成分区?动创立和?动转化使?继续会萃完成最新值查问,取代 Redis 集群关于其余瓜葛表,通常采?传统的瓜葛存储引擎进行存储便可,关于数据量大的历史数据表,则使用 OLAP 引擎。
    ④数据查问
    数据查问通常包罗一下查问形式,YMatrix 都予以反对。
    单?某个目标最新值、多个目标最新值单?某个时段某个目标明细数据、某个时段多个目标明细数据单?某个时段某个目标聚合值、某个时段多个目标聚合值多?某个目标最新值、多个目标最新值多?某个时段某个目标明细数据、某个时段多个目标明细数据多?某个时段某个目标聚合值、某个时段多个目标聚合值常?目标 + ?常?目标⑤初级查问
    市场上大多同类型数据库都只能做简略的查问,包罗点查、明细查问、会萃查问等,但是很难反对更高阶的查问;而这些高阶的查问在一切时序场景简直都会用到,特别是在物联网、车联网、工业互联网畛域,对海量的时序数据做数据剖析和数据挖掘的过程当中,会用到得多高阶功用。
    目标对?:同装备不同目标的收集时间点通常不会准确统一,常有误差存在;此时往往需求根据指按时间窗口对数据进?对齐和剖析,这均可以间接经过 SQL 来完成。对?是机器学习中?经常?的操作,经过 SQL 完成,能够?幅晋升开发效力。
    下图就是乱序、非同频收集数据的对齐,经过函数 time_bucket 完成数据的对齐。


    跳变差值:毛病剖析时,需求查问某个时段的某个或者某几个信号的跳变状况:譬如摘取?个症结目标,判别是不是碰撞,发?碰撞后,疾速查问碰撞前?段时间的相干信号的跳变差值。场景常?于平安告警业务。得多客户罕用 Flink 一类流式数据产品完成相似功用,个别需求上百行 Flink 代码,外加少量测试。
    在 YMatrix 零碎中,使用如下一条惯例 SQL 语句,便可完成这种功用,因此?幅晋升开发效力。


    驾驶循环划分:对一切?的运转数据进行全天驾驶循环划分,常?于?级剖析、模型训练等;此类功用不局限于汽车畛域,在装备运维畛域的工况切分等场景也会少量运用。一辆车天天可能会阅历若干个驾驶循环,讲一切驾驶循环放到一同剖析是没无意义的,因此需求经过运转数据划分出每个驾驶循环,对每个驾驶循环进行分别剖析。
    该功用假如经过 Java 或 Python 完成,个别需求少量代码,繁杂清醒可能多达上千行代码,外加少量的测试。
    在 YMatrix 中,经过如下?条 SQL 便可完成,节俭千?代码 + 测试,?幅晋升开发效力。


    3. 计划成果


    1.4 亿数据点/秒?吞吐低提早写?400+ 并发毫秒级前往?峰数据提早 2 ?时缩短到 10 秒,500 倍晋升开发效力晋升 100 倍(客户反馈从 3 天到 10 分钟)硬件本钱节俭 80%精简技术栈:超融会数据库 YMatrix 交换 Hadoop 全家桶 OpenTSDB、HBase、HDFS、Hive、Redis 等4. 智能设备运维
    和数字汽车类似,YMatrix 在智能设备运维畛域也有得多运用案例。某泵机设备制作业巨头对散布在寰球各地的产品进?智能化革新,使其对产品的使?进程了如指掌,为期客户提供运维办理、预测培修、动?优化等。该客户在使用 YMatrix 数据库以前,使用的是 MySQL + 时序数据库 + Greenplum + Spark 等多种数据产品集成的形式;使用 YMatrix 数据库,硬件节俭一半,机能晋升 6 倍以上。
    客户经过 YMatrix 所做的查问清单如下:
    装备数据明细预测?泥泵机是不是发?堵管统计最?频排量预测最好油? vs 转速臂架异样:泄露,发卡摹拟泵?(有多节机械臂)?作形态摹拟泵??作形态衍?,常?姿势统计泵?异样检测


    03
    工厂大脑
    1. 工厂大脑简介
    ①第四次?业?命曾经开启


    第四次?业?命曾经开启,其中心就是智能化;而智能化离不开数据、模型和软件。


    上表将智能化分红了不同的等级,最简略的等级是数字孪生,即在数字世界创立物理世界的孪生提体;接着是 CPS(赛博物理零碎),在数字孪生的根底上完成人机交互,而智能制作就是将 CPS 运用到更高维的生态中;工业互联网则是诸多智能制作的串连,将供给链、上上游整个买通,完成全部工厂的智能制作。
    能够看出,不论哪个层级,都离不开数据+模型+软件;因此数据+模型+软件是第四次?业?命的根底。
    ②工厂大脑
    数据 + 模型算法构成为了工厂大脑;在工业 4.0 时期,工厂大脑是智能制作的中枢。
    下图呈现了一站式的工业大数据平台。传统制作业企业包孕 ERP 零碎、MES 零碎、数据库等多种零碎,往往会针对某一项特定的业务构建一套零碎;因此,针对多项业务,往往会建设多套零碎,例如人力零碎、财务零碎等多种多样的零碎。
    SAP 的 ERP 零碎完成了经营零碎的整合,但是依然无奈防止数据孤岛的存在。跟着万物互联的到来以及信息化的深化,数字化将深化到装备域这一层,将会波及得多装备的数据;如斯多的数据假如散落到各个角落,智能完成“片断式”的建模,将很难完成全量的数据模型,也就很难完成真实的工厂大脑。
    经过 YMatrix 零碎,能够使用通用的基于 SQL 的形式,将碎片化的数据汇总到 YMatrix 中运转。关于大型企业,ERP 零碎或 MES 零碎的数据能够经过 ETL/CDC 办法汇总,而装备数据能够经过 IoT 网关等伎俩汇总;关于中小型企业或者新兴的企业中,特别是数字化原生的企业,会将企业的一切数据存入一个数据库中,节俭了 ETL、CDC 等进程。而 YMatrix 数据库自身就是基于 PostgresSQL 产品开发的一款散布式数据库,具备了瓜葛型数据库的一切功用。


    2. 数据建模
    数据建模次要分红两大类:瓜葛数据和装备相干数据。
    (1)瓜葛数据:包罗 ERP、MES 等零碎的数据,采?经典的二维表?式存储。
    (2)装备相干数据
    动态信息:使用瓜葛表存储。目标数据:使用公用时序引擎存储,将?类装备存储成?张表。培修数据:使用瓜葛表存储。数据查问包孕诸多类的查问:
    (1)最新值查问
    (2)明细查问
    (3)聚合查问
    (4)多维查问
    (5)?级查问(譬如窗?函数)
    (6)多表关联类型查问
    另外,愈来愈多的客户采取 in-database-machine-learning 的形式,即在数据库内间接完成机器学习模型。传统的完成形式是用 Python 或 Spark 完成机器学习模型,但是 Python 和 Spark 都无奈存储数据,需求到远端(如数据库)拉取数据;假如数据量较大,效力会十分低。YMatrix 零碎的完成形式“反其道而行之”,将 Python/R 等算法下推到数据库中执?,经过 SQL 调用算法相干代码以完成 ML,大大晋升了开发效力和运转效力。
    3. 计划成果
    经过 YMatrix 零碎,完成了数据从下到上的买通:最上层是装备,经过 DCS\SCADA 等形式获得时序数据,间接存入 YMatrix;管制层和履行层的数据以构造化的 MES 数据为主,存入 YMatrix。关于监控数据,因为此类数据因为占用内存较大,假如仅作可视化用,不倡议存入数据库,而是存到散布式存储中;该数据的 Metadata 能够存入数据库。经营管控层以 ERP 数据为主,将数据存入 YMatrix 中。由此能够看出,一套 YMatrix 零碎完成了全部制作业的买通,能够呈现全部工厂的全貌数据。


    总体成果:
    ①经营数据(TB)+ ???产数据(GB)+ 装备数据(10万点/秒时序数据)
    ②数据库内完成模型训练和剖析,疾速部署、低本钱实行和可复制推?。
    ③All-in-One:MySQL + 时序库 + Hive + Spark → YMatrix,本钱节俭 60%+,机能晋升 6 倍。
    04
    Q&A环节
    Q:YMatrix 的 SQL 是依靠于 PostgreSQL 完成的吗?
    A:是的。YMatrix 的内核是 PostgreSQL 十二;目前 PostgreSQL 反对的规范 YMatrix 根本上都反对。
    Q:YMatrix 的时序数据是反对散布式的吗?是开源的吗?
    A:YMatrix 是反对散布式的。精确讲,YMatrix 未显著区别单机版和散布式版本,间接使用便可。至于开源方面,目前尚无开源,正在方案开源。另外,目前社区版能够进入 http://ymatrix.cn/download 收费下载使用。
    Q:文中提到 YMatrix 反对 OLTP、OLAP、时序和内存等引擎,并可完成 Acid,是如何完成的?同一份数据要存多少份?
    A:首先,内存引擎目前并未完成,是未来会完成的一项功用。至于完成形式,底层使用了不同的存储器。类比于 Redis,完成了内核的存储引擎,下层包装了履行器(有些乃至没有履行器,相似于 RPC);MongoDB 也完成了存储引擎,以及下层履行器。因此,每个数据库都使用其特定的存储引擎,然而这些存储引擎的底层共用代码可能超过 80%,因此针对每个数据库都建设一个独自的存储引擎显然是不敷经济的。YMatrix 反其道而行之,建设通用的底层框架,在外部经过可插拔技术完成不同的存储引擎。举个例子,假定有 100 张表格,80 张表格使用TP引擎存储,10 张表使用 AP 引擎存储,10 张表使历时序引擎存储;表格之间能够完成 Join 等操作。关于 Acid 的存储,目前曾经完成存储引擎和 Acid 解耦,不同的存储引擎均可以经过 Xlog、Transaction 反对 Acid。
    Q:文中提到数据以宽表方式存储,关于数据的字段有哪些好的理论教训?例如假如数据字段始终增长,YMatrix 会不会不反对?
    A:数据建模包罗宽表、窄表和树形模式。宽表模式,关于罕用的目标,用相应的字段保留;关于不罕用的目标,能够经过 JSON 字段来保留;假如两个装备的大部份的字段都不相反,倡议存成两张表格,假如波及对比剖析,经过 SQL 的 Union 的形式便可完成合并。
    Q:YMatrix 对 JSON 的反对,是反对到 String 类型,仍是能够下钻到 JSON 外部的数据类型?
    A:得益于 PostgreSQL 社区关于 Json 的弱小反对才能,JSON 目前曾经造成了一套 SQL 规范——SQL-JSON,作为 PostgreSQL 2016 规范的一项新增特性;因此,YMatrix 对 JSON 的反对也是相对于完美的:使用 Binary 的形式存储 JSON,能够间接经过字段进行 JSON 拜候(而非传统的 String 形式),包罗该字段的子属性,另外还能够对 JSON 中的常见属性做索引。SQL-JSON 共包孕超过 20 种操作符,包孕近 30 种罕用函数。
    Q:如果运用层但愿将其余类型的数据库(例如 MySQL 数据库)切换成 YMatrix,切换本钱如何?
    A:切换本钱相对于较小,总体上可分为下列几类:第一类是 Schema 迁徙:Schema 大可能是规范的 SQL;不外因为 PostgreSQL 不包孕 Auto-Increment 属性,能够经过 Serial 伎俩完成相应的措施。第二类是数据导入:业内存在得多成熟的工具能够完成。第三类是特殊函数的完成:常见的函数个别都会有相应的完成;关于特殊函数、自定义函数等,在 YMatrix 中经过 Procedural language(如 C、Java、Python)等完成相应功用。整体来看,切换代价较小,本钱较低。
    Q:数字工厂案例中提到的为客户升高 60% 的本钱,这个是 60% 如何计算的?
    A:该案例是将客户原本的 MySQL + 时序库 + Hive + Spark 的计划,经过一套 YMatrix 零碎整个完成。原计划中,MySQL 使用的高可用集群包孕 2 个节点;时序库使用的 OpenTSDB 大约用到 6 个节点;Hive + Spark 又耗用若干个节点。但从硬件角度看,曾经超过 10 个节点;而改换成 YMatrix 零碎,仅需 2-4 个节点便可完成。本钱的升高次要来自技术栈的精简,详细升高水平可能会视详细状况有所不同。
    Q:请简略比较 YMatrix 的 OLAP 的内核,和 Doris 以及 StarRocks 等剖析型引擎的优劣。
    A:YMatrix 的底层是 PostgreSQL 零碎(PG十二),其散布式使用 Greenplum;Greenplum 是十分弱小的 MPP 数据库;CK、Doris、StarRocks 等都是新兴产品,各有优缺陷。CK 的典型运用场景是互联网畛域的用户画像场景;Greenplum 以及 YMatrix 合用于更繁杂的场景,例如银行业、制作业的报表等场景,可能会有十几张表进行 Join 的情景;此时需求履行器以及优化器足够弱小,在此方面 Greenplum 以及 YMatrix 具有显著的劣势。固然,详细要结合客户的使用场景进行选择。
    Q:YMatrix 做 OLTP 数据库方面,理论机能如何?
    A:在大众号以前发了一篇文章,是与 Intel 试验室联结协作;在 Intel 办事器上,完成 TPC-B,一个集群,主键查问超过百万 TPS,这是十分弱小的才能。上月刚刚在 十二8 核的集群上从新做了测试和优化,完成 TPC-B 主键查问超过 160 万 TPS;INSERT 和 UPDATE 大约在二三十万 TPS,TPC-B 默许 Transaction(4条SQL),大约几万 TPS 的程度。
    另外,YMatrix 产品定位并非做 TP 数据库,并非交换 Oracle 在银行业务中去 IOE,而是更多看重将来的物联网和数字化场景,更多运用于融会场景。
    明天的分享就到这里,谢谢大家。
    分享佳宾:姚延栋 四维纵横 开创人&CEO
    编纂整顿:王吉东 昆仑数据
    出品平台:DataFunTalk
    01/分享佳宾


    姚延栋|四维纵横开创人&CEO
    北京四维纵横数据无限公司开创人&CEO。原 Greenplum 北京研发核心总经理,Greenplum 中国开源社区开创人,PostgreSQL 中文社区常委,壹零贰肆数字基金会(非营利组织)联结发动人,清华大学产教融会课程《散布式数据零碎根底及运用》产业方担任人、讲师,新动力汽车国度大数据同盟理事。
    02/对于咱们
    DataFun:专一于大数据、人工智能技术运用的分享与交流。发动于2017年,在北京、上海、深圳、杭州等城市举行超过100+线下和100+线上沙龙、论坛及峰会,已约请超过2000位专家和学者参预分享。其大众号 DataFunTalk 累计出产原创文章800+,百万+浏览,15万+精准粉丝。

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题33

    帖子42

    积分190

    图文推荐