华人澳洲中文论坛

热图推荐

    字节跳动杨震原:抖音电商是如何完成数据驱动的

    [复制链接]

    2022-7-21 06:47:03 17 0

    技术和业务是一个互构的瓜葛,相互折腾,制作“费事”,独特生长。
    7月20日,火山引擎原能源大会在京举行,字节跳动副总裁杨震原以抖音电商为例,分享了火山引擎是如何反对公司外部业务做好数据驱动的。
    杨震原表现,抖音电商业务在生长过程当中对技术部门提出了得多需要,给数据产品形成了得多“费事”。恰是由于这些“费事”,数据产品能力更好地改进。反过去说,优秀的数据产品也让抖音电商的效力进步。技术和业务互构,相互塑造、独特生长。
    火山引擎是字节跳动技术中台才能的对外输入。此次原能源大会上,火山引擎公布全新Slogan“云上增长新能源”,并推出了一系列云上增长解决计划。这些计划结合字节最好理论和行业开展趋向,以矫捷迭代、体验翻新和数据驱举措为增长三因素,由火山引擎与不同行业标杆客户共创打磨造成。
    杨震原说,“数据驱动理念在抖音电商上的理论,这些教训、这些技术才能,都曾经积淀到了火山引擎数据产品上。我但愿火山引擎也可以帮忙企业客户获取增长的新能源”。
    下列为杨震原演讲全文:
    大家好,我叫杨震原,很快乐大家有时间来加入火山引擎的公布会。
    大家都知道,火山引擎是字节跳动技术中台才能的对外输入。方才谭待(火山引擎总裁)讲了火山引擎更新了 Slogan ,要为更多企业提供“云上增长新能源”,数据驱动是增长能源中十分首要的一个要素。接上去,我会为大家分享字节跳动外部业务是怎么做到数据驱动的。
    首先要说的是,数据驱动并非无数据就可以驱动,而是要从解决一个一个的业务问题运行起来:咱们需求明白业务的指标是甚么,这个指标要可以量化,由于有了量化,能力优化;优化的成果一定不是凭觉得,而是要用A/B测试等主观的剖析评价办法;业务进程的数字化也是十分首要的,数字化越充沛,对业务的形容就越精准;还无数字化的协同任务,包罗数据治理等伎俩让底层数据失掉标准、一致的表白,经过数据可视化等工具让更多的业务角色使用起来。
    在环抱业务指标继续的优化和评价过程当中,数据驱动会成为外部协同的日常习气,终究使产品失掉更无效的改进,这就是数据驱动根本的办法。这里我分享下抖音电商在数据驱动上的一些理论教训。


    简略引见一下抖音电商 ,大略是在2020年的6月份成立的。 大家能够看到,咱们数据产品对抖音电商反对的一些首要节点,还有电商业务给数据产品的NPS(净保举值)打分状况。 2020年十一月,数据产品曾经可以反对抖音电商外面的中心业务,获取了一个对比好的NPS反馈, 到明天NPS值应该曾经达到70%摆布了,这两头咱们也做了各种各样的任务,得多的改进,也能够说是随着抖音电商一路生长过去。
    生意转化时间以秒计算,如何高效开发少量实时工作?
    反对一项全新的业务,数据产品会见临各种各样的应战。第一大应战是,实时。
    抖音电商转化门路很短,转化时间经常以分乃至以秒来计算。大家能够想象,在直播卖货的过程当中,不论是主播仍是经营,他们对数据实时性的要求是十分高的。明天主播讲一件商品,可能在接上去的 5 秒钟,就有几万单乃至几十万单的定单发生,所以需求有十分实时的数据反馈,可以让主播、让经营人员更快更精确地做选品调剂,或者及时制订一些营销战略,这样能力够让业务更好地开展。
    这和得多传统的货架电商模式是纷歧样的。实时需要场景十分多,业务流动的频次又很高。如安在这样不停发作的需要之下,还可以包管数据反对可以很实时地实现,咱们的做法是实时数仓。
    实时数仓看起来并非一个新的概念,得多公司都在做实时数仓,想做出来也其实不很难,然而真的去业务里运用实时数仓的时分,遇到的应战仍是十分多的。我举一个例子,好比说数据的统一性问题,明天直播能够很快收到数据实时的剖析。然而当过了两三天之后,当你去看一些统计数据,发现先后纷歧致怎么办?这就是很大的问题。
    再好比在十分快的需要迭代过程当中,全部链路的全流程办理是否能做好。数据的公布,是否有适合的工具,测试是否有适合的工具,以及数据监控是否可以到位?实时数据一旦出问题,它修复的代价是很大的。它不像离线的数据,大不了重跑一遍就能了。
    所以从全部流程来看,做好实时仍是颇有应战的。咱们的数据产品通过了得多业务、很长期的迭代,实时数仓曾经做得对比完美了。对抖音电商来讲,咱们当初曾经可以提供对比全套的实时数据。


    实时大屏,能够给经营人员、主播实时反馈各项核 心 目标; 实时候析,是指假如现有的实时目标不敷,能够在实时候 析的平台暂时性地做一些剖析查问,好比说你忽然想剖析某一个指标人群,或者你想做一个暂时的漏斗剖析等等,这里提供了十分灵敏的 SQL 的查问,而且对实时数据流做处置; 实时预警能够配置各种规定,当业务状况产生变动,好比以后的流量忽然下滑,它就能提供报警的功用,或者配置自动触发一些操作; 实时营销也给经营人员提供了工具,好比经营发现 “ 创单到胜利购买 ” 的转化低,能够剖析出未胜利购买的人群是否对价钱敏感,或者是其余要素影响,从而制订一些对应的营销战略,让业务有更好的转化。
    大促频率高、新弄法多,如何矫捷反对各项业务诉求?
    第二大应战是矫捷的需要。
    如今电商大促的频率很高,电商这个业务又有个特征,新弄法多。要做好矫捷反对,有得多技术的办法。我明天想给大家分享一个组织模式,就是数据BP。
    数据BP其实是一种分工的办法。咱们有做公共产品的团队,叫做数据平台,就是去做一些通用的功用,做通用的数据产品,可以在根底上提供反对。数据BP则是嵌入到每一个个业务外面去的,好比说抖音电商就有一个数据BP团队,他们彻底和抖音电商的业务指标去对齐,为抖音电商的指标而致力。同时他们也对数据平台外部十分理解,可以充沛天时用数据平台的产品。同时,抖音电商的数据BP还会把业务需要引入到数据平台,帮忙数据平台生长,这个机制咱们以为是胜利无效的。
    咱们总结了几个数字阐明数据BP的办事规范,叫0987。


    0是做到零数据变乱。这看起来是一个很根本的要求,然而在业务繁杂多变的状况下,完成零数据变乱其实不容易,它对技术的才能、对运维、对治理都提出了很高的要求。
    第二个数字是9,指的是90%的需要知足。从这个数字中,大家也能够看到数据BP是一个办事型团队,它要能把业务的需要转化出来,知足好。这要求团队对业务很相熟,可以和产品、和业务的人员有深化的互动,可以一同探讨需要,去帮忙业务修正乃至提出需要,这样能力真正完成90%的需要知足。
    第三个数字是8,指的是80%的剖析,要可以经过主题表、两头表的形式来掩盖,这对两头数据的建立提出了一个很高的要求。80%这个尺度咱们本人权衡了很久,以为是一个适合的值。当这个数字很大,好比说但愿一切数据都可以经过两头表掩盖,实际上是不用要的,由于可能适度笼统得多两头数据,或许需要刚刚提完,两头数据表刚建立完,业务就变了。但这个数字过低的时分,也就象征着有少量的剖析是间接基于原始数据来做的,这就会带来得多问题,好比一些目标类似而不相反,口径纷歧致,一些剖析跑得很慢等等。从少量业务虚践来看,80%的剖析掩盖是一个相对于公道的指标。
    最初这个7,指的是70%的NPS,这外行业里是一个很高的规范,代表业务满意度的一个评估。咱们要可以经过这个目标,去发现数据办事环节中的各个问题,来进步业务的满意度。
    数据BP的机制在字节外部是颇有效的。我举一个例子,不久前抖音电商的618大促流动,业务提了得多弄法需要,都需求定制的数据反对。这外面有10个需要在5月17日才实现数据详评,上线开发时间十分紧迫。但由于有以前积淀的模型,数据BP判别能够复用4个,部份可复用3个,10个任务日内就做了100%的交付,并积淀新的弄法模型,能够运用到下次的大促中。我感觉假如没无数据BP的组织模式,想反对好这样紧急的流动是很难做到的。
    如安在知足实时、矫捷的同时确保不乱?
    电商业务与钱相干,数据一定要算对,容错率极低。同时,业务经营重度依赖数据,天天都需求按照数据来做决策,数据必需准时产出。这就带来了第三大应战,就是不乱。
    要想稳,实际上有一些根底的任务,好比监控、运维品质等。我这里想讲的一点是数据治理,在实时、矫捷的同时包管不乱,治理是一个特别首要的问题。由于假如不做好数据治理这件事,业务的繁杂度,其中冗余的问题以及一些凌乱的要素,是没有方法经过监控和运维机制就可以解决的。
    咱们提到几个做法,一个叫散布式治理,一个叫教训复用,一个叫教训积淀到工具(DataLeap)。
    为何提散布式治理呢?咱们初期实际上并非散布式治理,而是专职团队治理,就担任数据治理任务。然而当咱们作为数据团队去反对泛滥业务的时分,这个模式就难认为继了,我不成能让一个专门的治理团队去治理各个业务。
    所以咱们提出了散布式治理,就是要有治理委员会去制订各种规范,这些规范也都是从业务上传,在每个业务中也会有专人担任治理任务,让治理任务自下而上发生出来。
    教训复用,就是咱们在一个成熟产品积攒了得多教训,当咱们再去反对一个新的产品,可以疾速地把成熟产品的教训鉴戒起来,不要再走一遍先净化后治理的老路。除了教训复用以外,还要把教训积淀在工具中去,这才是能进一步扩张杠杆的办法。
    DataLeap数据产品提供了一整套的数据治理工具。这源于在长时间以来的数据处置中,咱们会把一些通用的才能积淀到工具中,当新业务间接使用这些工具时,就不会在早期挖得多坑,能够间接达到一个对比高的数据治理水准。
    让数据驱动成为习气
    方才聊了抖音电商在数据驱动理论过程当中的三个应战。接上去我再简略引见一下业务不同角色如何做好数据化的经营和决策。
    数据产品绝对不是只给办理者用的,它要可以给公司各个角色各个层级的人去用,帮忙每集体都可以有更好的决策。然而不同的角色需求有不同的数据产品,这样能力够进步效力,更有针对性。


    好比说对办理层,咱们提供了办理驾驶舱,办理者可以间接看到一些微观的目标,看到一些趋向的变动,辅佐办理者做出更及时无效的决策。关于一线Leader,对经营和风控等一耳目员,他们可能需求看业务数据,好比罗盘,同时他们也可能需求 BI(矫捷剖析平台),可能需求人群画像、行动剖析等等可以指点一线任务的工具。因此咱们针对不同的业务角色,也会去专门地定制不同的产品来知足各个角色的需求。
    在字节跳动外部,每个月有超过10万员工间接使用BI产品,能够说数据驱动曾经成为大家日常任务的一种习气,不得人心。


    这是字节跳动全部数据产品体系的架构图,下面是各种业务,咱们经过数据BP的机制反对不同业务。而后是一些是数据运用产品,间接给公司的不同角色使用。底下有一些偏根底的产品,好比说数据建立、数据引擎等,可以反对咱们下层的运用。这样一套体系,既可以反对不同业务共性化的需要,也可以教训复用,把一些底层才能复用。这些才能和工具也都在火山引擎上造成了对应的产品,提供应内部客户使用。
    技术与业务相互塑造、独特生长
    我始终有一个理念,技术和业务是一个互构的瓜葛,相互折腾,制作费事,独特生长。就像方才我分享的抖音电商的例子,这个业务在生长过程当中对技术部门提出了得多需要,给数据产品形成了得多“费事”。恰是由于这些“费事”,数据产品能力更好地改进。反过去说,优秀的数据产品也让抖音电商的效力进步。技术和业务互构,相互塑造、独特生长。
    以上就是我的分享。字节跳动技术中台反对公司业务的这些教训、这些技术才能,都曾经积淀到了火山引擎上。我但愿火山引擎也可以帮忙咱们的客户晋升业务价值,获取新的增长能源。谢谢大家。

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题32

    帖子42

    积分189

    图文推荐