# 15 | 数据中台在网易电商业务的最佳实践 你好,我是郭忆。 从OneData 到 OneService、从方法论到支撑技术、从宏观架构到微观实现,我已经带你系统地了解了建设数据中台的所有核心知识点。你可以看到,虽然人人都在讨论数据中台,但是真的实战起来,还是不简单吧? 而且建数据中台是一项系统性的工程,涉及人员组织架构的变动,需要研发大量的系统支撑工具,更要和业务部门达成密切的合作,形成双赢,反之会有失败的风险。还是分享一件我见过的事儿。 甄英俊是某零售企业IT部门的老大,最近他也想在企业中建数据中台。设想一番后,他亲自操刀,组建了新的数据中台部门,还亲自规划了十个业务场景(包括会员看板、商品运营、供应链管理、售后管理、毛利分析、类目管理、门店管理、仓储管理、渠道分析、辅助选品)。 但数据中台团队没有和业务部门达成一致的KPI,在具体工作推进过程中,中台团队与业务部门脱节,业务部门也没有资源支撑中台的推进(例如指标的梳理)。 最后,虽然基于原先规划的十个场景,数据中台确实做出了一些报表,但很少有人查看。于是,尴尬的一幕发生了:在年终总结汇报中,甄英俊自信地向CEO汇报了数据建设的成果(输出了多个报表,覆盖了多少业务场景)。可当CEO问业务老大是否感觉到数据的作用?业务老大摇了摇头,他们并没有认可数据中台的成果。 这是一个很典型的失败项目,而问题的根源就在于数据中台团队虽然独立于业务,但是并不能脱离业务。 甄英俊最大的失误就是没有深入调研业务问题,也没有和业务达成一致的KPI,更没有根据业务的反馈,不断完善数据应用。 所以,如果你要建中台,要做到这样几点: * 问问自己为什么要建中台,与业务达成一致的目标; * 把数据中台作为一个公司级别的顶级项目来推进,而不是一个数据部门自己的KPI; * 数据中台必须要有清晰的、可量化的价值来衡量(从主观上也要得到业务部门的认可)。 而今天这节课,我会从项目立项、到项目推进,最后到项目总结,带你看一下网易电商数据中台的构建过程。这样一来,你会明白如何在企业一步一步落地数据中台,这对想要建设数据中台的你来说,非常有借鉴意义。 ## 立项数据中台项目 我认为,立项是建数据中台最关键的一步,因为它的核心就是挖掘业务的痛点,跟业务达成一致的建设目标。**如果能达成一个一致的、可量化的目标,数据中台的项目就成功了一半。** 所以在网易电商数据中台构建之前,我们(数据部门)对业务方(包括市场、商品、供应链、仓配、售后、会员等)进行了密集的调研,尤其是跟各个部门的老大了解了这样两个方面: * 当前数据使用过程中存在哪些痛点; * 当前业务部门最关注的业绩目标。 这里我多说几句,对一些传统企业来说,业务部门的数据思维能力比较薄弱,数据使用水平还比较初级,根本讲不出什么痛点。如果遇到这种情况,你要多关注一下业绩目标(比如,如何让数据帮助企业达成KPI)。 如果谈论这种话题,业务部门的老大一定很感兴趣。 经过调研,我总结了这样几个痛点。 **第一,指标业务口径不一致。** 在建数据中台前,网易电商已经有20多款数据产品,它们涉及800多个指标,存在大量业务口径不一致的情况,导致了数据不可信、无法用。你看,虽然数据产品不少,但是真正发挥价值的却寥寥无几。其实这还没算数据报表,如果把报表算进来,就更夸张了。 **第二,需求响应速度慢。** 在电商平台中,业务部门运营活动的规模和频率大大提高,原先可能一个月才一次促销活动,现在是一天一次,甚至还有小时级别的。淘宝上一双NewBalance的鞋子,前一个小时还是599,下一个小时就成了429,而这背后其实是大量的商品运营策略在发挥作用。 活动一开始,运营人员就需要分析大量的数据,从而不断优化运营策略。此时,数据部门会收到大量的数据研发需求。而我们统计后发现,数据部门一个需求的平均交付时间是一周(数据来源于项目管理工具JIRA),根本没办法满足业务部门的需求,可以这么说,数据研发的速度已经无法支撑业务高频的运营活动。 **第三,取数效率低。** 我们问了很多的分析师、运营,他们集中认为取数效率太低,原因有两个。 一个是他们不知道有哪些数据,也不知道到哪里去找数据。当时整个电商团队存在三个小数仓(供应链、市场和仓配客)加起来有近4W张表,对他们来说,找到并准确理解数据,其实是非常困难的事情。 另一个是,基于SQL取数,对于非技术人员来说,门槛比较高。分析师经常遇到一个SQL异常就不知所措,更不要说不懂SQL的运营。 正是因为这两个原因,取数要靠数据开发帮助完成,效率很低。有多低呢?平均取数需求从提出到交付,需要一周(数据来源于项目管理工具JIRA)。而这也抑制了数据的大规模使用,与此同时,临时取数的需求,占据了数据开发的大量时间(来自JIRA的数据统计,数据开发50%的时间都被临时性的取数需求占据)。 **第四,数据经常违反常识。** 糟糕的数据质量也是各个业务部门对数据最为不满的地方,经过POPO群统计(网易内部办公协作通讯工具),平均每周,我们就有10个数据质量问题被业务方投诉。 更为可怕的是,这些问题中,90%都是由业务方先于数据提供方发现的问题,然后50%都是因为数据研发的BUG导致。在当时,我们经常出现数据经常无法按时产出,数据修复需要花费一天的时间! **第五,数据成本指数级增长。** 2018年,电商业务的大数据资源从一年4000CU(1 CU = 1 Core + 4 memory) 增长到12000CU,并且还在持续高速增长。当时正好是2018年底,公司对业务毛利这块儿管控得非常严格,精简成本作为了各个业务推进的优先级,大数据这块也不例外。 为了优化大数据的成本,我们排查后发现,至少有20%的数据在当时都属于废弃数据,这些数据每天仍在产生,却没有人访问,浪费着资源。 除了现有数据是否用得好以外,我们也对各个部门的业务目标进行了调研,目的就是让数据帮助解决更多的业务问题。 * **商品部门:**主要目标是优化商品结构、降低滞销商品比例、提高商品库存周转,从而达到控制毛利水平的目标。所以他们最紧急的就是监控平台上滞销的商品。 * **供应链部门:**主要目标是尽可能保证商品的供货充足,尽量避免缺货商品出现。所以及时发现缺货商品,制订更精准的采购计划是最紧急的事儿。 * **仓配客部门:**最重要的业务目标是保障商品及时送达,优化物流成本。所以,基于各个仓库的数据和物流公司的报价,制订最合理的配送计划,是他们最重要的事儿。 有了这两方面的调研之后,我们下一步的目标制订就会顺利很多,最后,我们从效率、质量和成本三个方面,和业务部门制订了共同的KPI。同时又因为当时整个电商业务的核心方向是控制毛利水平,提高商品周转,所以在业务目标上,我们选择了与之最相关的商品和供应链部门进行合作,共背业绩KPI。 这里我提供给你一份数据中台KPI考核表格,希望你能参考一下,数据中台部门考核KPI应该包括哪些内容。 ![](https://static001.geekbang.org/resource/image/e2/45/e2cd612d3eee288530efc8bdf16d5d45.jpg "数据中台 业绩KPI 目标(参考)") 你看,这个表里包含中台建设和业务支撑两部分,前者对应的是业务痛点,后者对应的是业务目标。更为关键的是,我们都是从业务出发制订的这两部分内容,我认为这是业务愿意和中台团队达成共建KPI的基础。 后来,在CTO的推动下,供应链、仓配以及市场部门把指标梳理、自助取数、数据模型迁移中台纳入了KPI考核。当然,对数据中台的支撑工作,这部分在业务部门的KPI中比例不会很高,一般最多20%,但是却很重要,因为只有这样,业务部门才有压力去做这个事情。 以上就是立项阶段了,在这个阶段里,我们从挖掘业务痛点,到输出共建目标,接下来,我们就来看一看这个目标是怎么落地的。 ## 推进数据中台项目落地 我会从四个方面带你了解数据中台的落地过程,这部分内容,会帮你把前面12讲串起来,并形成企业落地执行方案。 **第一步,调整团队组织架构,明确各个团队的职责。** 在数据中台构建之前,电商业务主要存在3个独立的数仓:市场、供应链和仓配客。这些业务部门中有数据开发、数据产品还有分析师。 而我们首先要做的,就是成立数据中台团队,这个团队是在原有市场数仓(除了服务市场,还服务于管理层)的基础上建起来的。 而对供应链和仓配客,我们并没有立即把他们的数据开发团队并入中台团队,而是调整了团队职责,把他们的数据开发的职责调整成,基于数据中台数据,加工私有的集市层和应用层。 这样处理的话,各方比较容易接受,不然业务部门会觉得中台团队在抢他们的人,对于员工个人,也可能因为团队定位、福利等原因不愿意转部门。 建立数据中台团队之后(主要由3名数据产品和15个数据开发构成),接下来就是明确团队的职责。数据中台主要负责DW层公共数据,以及跨部门共享的集市层和应用层的数据建设。 ![](https://static001.geekbang.org/resource/image/62/1c/62199242b5b44685c912ae22fca96f1c.jpg "数据中台团队与业务部门分工示意图") **第二步,数据整合。** 中台团队成立后,首先面对的是混乱的指标业务口径,所以团队要先梳理指标,建立全局的指标管理规范(对应咱们的05讲)。这项工作由1名数据产品牵头,2名数据产品辅助,对电商分布在各个业务线的20多个数据产品,800多个指标进行了梳理,去除了冗余指标,对齐口径不一致的指标。 最后,我们把指标梳理成400个,其中,原子指标127个,这个过程花了1个月的时间,不过大部分时间都是在理解业务,和业务的分析师、数据产品对口径。 接下来,中台团队还要对模型进行重构、整合和迁移(对应咱们的06讲),而这部分工作可以分为设计阶段和实施阶段。 设计阶段,由一名数据架构师牵头,根据梳理好的指标,构建主题域,然后在原有模型的基础上进行重新设计,构建一致性维度。**这里需要强调的是,**中台团队必须要完全接管ODS层数据,这可以强迫业务部门必须要基于中台数据进行再加工。当然,中台团队会肩负着巨大的压力,但是只有熬过最痛苦的时期,这种中台的机制才能建立起来,**一旦原始数据没有管住,那中台就会功亏一篑。** 实施阶段需要投入大量的人力,但是中台团队还承担着公共数据需求的研发,所以为了保证模型重构和迁移的进度,我们从15个数据开发中拆出了5个人,专门进行模型的重构和迁移。最终,我们完成了200多张表的基础数据的迁移重构,而这个过程花费了近5个月的时间。 **第三步,研发工具产品。** 在数据中台构建过程中,我们积累了很多规范和经验,但数据中台如果要形成落地、长久的运行机制,就必须把这些规范和经验沉淀到产品中,通过产品化的方式实现。 ![](https://static001.geekbang.org/resource/image/a0/d7/a0604418589bb759adf3dd89000ef9d7.jpg "网易数据中台支撑技术工具产品架构图") 所以在原有数据研发、数据产品团队的基础上,我们开始构思数据平台(工具产品)研发团队。因为考虑到网易集团存在公共技术研发部门(杭州研究院),可以实现工具产品在集团内不同业务线之间复用,所以选择了与公技合作的方式,由公技承担数据中台支撑技术产品的研发。 我们研发了20多个数据中台支撑技术产品,总结了四个产品设计的经验,对你设计这些产品有很大的借鉴价值。 * 正交化产品设计。每个产品聚焦一个应用场景,构建产品矩阵,简化了系统使用的复杂度。 ![](https://static001.geekbang.org/resource/image/31/1d/314391dc67b377bdyy1c83036fbb7e1d.jpg "EasyData 数据中台支撑技术工具列表") * 全链路打通,形成产品闭环。比如任务运维中心与有数报告打通,可以看到一个任务影响了哪些下游报表。 * 组件式产品架构,允许业务根据场景搭配产品使用,形成面向不同场景的解决方案能力,例如数据质量解决方案、成本优化解决方案。 * 轻型易用、降低用户门槛,尤其注重非技术人员的交互体验。 我们研发这些工具产品,投入了20多个系统研发人力,因为公技可以把这些工具产品复用给其他的业务,所以对于单个业务来说,成本还是可以接受的。 **第四,数据产品构建。** 最后,就是业务支撑。我们通过构建数据产品,帮助业务达成业绩目标。我们的重点是商品和供应链。分别研发了商品运营系统和供应链辅助决策系统,大幅度提升了业务决策的效率。数据产品团队,我们有10个人的团队规模,主要负责数据产品研发。 ## 总结数据中台项目成果 耗时一年半(实际执行一年的时间),我们完成了电商数据中台的搭建,并产出了一些阶段性的成果,对于成果这部分,你可以重点参考一下,因为你也可以通过这种方式,说服你的老板启动数据中台的建设。 ![](https://static001.geekbang.org/resource/image/fc/99/fcceb84f1c5bd69d8efb7c4b33b68299.jpg "网易电商数据中台成果汇报") 数据产品深入到业务运营,商品运营实现了滞销商品下降60%,大幅提高了库存周转,降低了业务的成本。供应链辅助决策系统,每周有70%的订单由系统自动生成,推动给采购系统。用了一年时间,我们基本达成了在2018年底我们设定的中台建设目标。 ## 课堂小结 这节课,我用网易电商建设数据中台的案例,从项目立项、推进、成果总结,让你看到了数据中台在企业落地的完整过程。**最后,我想用一句话来总结今天的内容,那就是:数据中台从业务中来,到业务中去!同时我还想送给要建设数据中台的人一句话,“建设数据中台,不仅需要技术的思维,更需要管理者的视角”。** ![](https://static001.geekbang.org/resource/image/cf/07/cf934a2f72617bdeed632ca0e77ffd07.jpg) ## 思考时间 学完最后一节课,你可以看到,所有关于数据中台的建设规范,我们最终都沉淀到了工具产品中,形成了产品化的解决方案,你知道这是为什么吗? 最后,感谢你的阅读,如果这节课让你有所收获,也欢迎你将它分享给更多的朋友。