数据中台建设与架构
持续让数据用起来的价值框架
数据中台的使命就是持续让数据用起来,它的一个根本性创新就是把“数据资产”作为一个基础要素独立出来,让成为资产的数据作为生产资料融入业务价值创造过程,持续产生价值。数据中台要迅速提供数据服务(服务业务化),从而敏捷地响应企业的创新
业务 -- 业务数据化 -- 数据 -- 数据资产化 -- 资产 -- 资产服务化 -- 服务 -- 服务业务化 -- 业务
- 数据中台不是单纯的技术叠加,不是一个技术化的大数据平台,二者有本质区别;
- 大数据平台更关心技术层面的事情,包括研发效率、平台的数据处理能力,针对的是技术人员;
- 数据中台的核心是数据服务能力,要结合场景,通过服务直接赋能业务应用,不仅仅面向技术人员,面向多个部门的业务人员。
数据中台建设方法论
1种战略行动
把数据中台驱动业务发展定位为企业级战略,全局谋划,只有企业“一把手”能推送企业数据中台的建设,需要有相应的组织、制度、流程、资源的保障;数据中台要求整个企业共用一个数据技术平台、共建数据体系、共享数据服务能力;数据中台目标是实现企业经营的数据化、精细化、智能化、本质是建设一套可持续让企业数据用起来的机制;2项保障条件
中台战略实施需要有组织保障(建设团队、运维团队、运营团队、产品团队);中台战略实施需要提升全企业的数据意识(数据采集意识、数据标准化意识、数据使用意识、数据安全意识)3条目标准则
数据可见(指标管理可用性、元数据管理可用性、数据资产目录的可视化、数据源的可视化、数据集成的可视化、数据ETL的可视化、数据建模的可视化、数据消费者的可视化、算法模型的可视化);数据可用(数据内容可用性、数据服务可用性、数据任务可用性、数据指标化、数据标签化、资产的易阅读性);数据可运营(质量量化管理、价值量化管理、数据运营角色)4套建设内容(数据中台建设的核心)
技术体系:基础支撑,包括大数据存储计算技术(Hadoop、Spark、Flink、Greenplun、Elasticsearch、Redis、Phoenix等)和工具技术组件(数据汇聚、数据开发、数据资产管理、数据服务管控等); 数据体系:核心要素(全企业的数据通过各种方式汇聚到数据中台,按照一定的建模方式进行加工,形成企业的数据资产体系); 服务体系:机制所在(通过服务组件能力,把数据变为一种服务能力,让业务决策通过数据而不是仅凭经验。通过提供数据生成、发布、监控、管理功能,帮助企业逐步建立数据服务,完成企业数据服务体系的构建);运营体系:中台守护者,包括平台流程规范执行监督、平台资源占用的监管及优化推动、数据质量的监督及改进推进、数据价值评估、数据服务的推广、稽查排名等。-
5个关键步骤
理现状(组织现状、业务现状、数据现状、技术现状); b. 立架构:4A架构(业务架构、技术架构、应用架构、组织结构)业务架构:保障中台能适用于企业的业务运营模型和流程体系; 技术架构:对数据存储和计算进行统一选型; 应用架构:即中台应用架构,后续应用的工具主要由数据中台最为应用平台来承接; 组织结构:保证中台项目顺利落地需要企业考虑的组织保障。
建资产:涉及数据汇聚、数据仓库建设、标签体系建设(最关键)、应用数据建设; 标签体系:面向具体对象构建的全维度数据标签,通过标签体系可以支撑应用,大数据的核心魅力和服务能力主要体现在标签体系的服务能力上;用数据:数据资产服务化过程;做运营:中台架构基本稳定的情况下,不断循环第3-5步,多方不断挖掘业务场景的结合点,逐步形成企业特有的数据认知,这是企业在数字化转型中国非常重要但很难跨越的点。
数据中台架构
- 数据汇聚:数据接入的入口,数据来源于业务系统、日志、文件、网络等;汇聚方式包含数据同步、埋点、爬虫、消息队列等;从时效性又分为离线批量汇聚和实时采集;
- 数据开发:主要面向开发人员、分析人员,提供离线、实时、算法开发工具,以及任务的管理、代码发布、运维、监控、告警等一系列集成工具、方便使用,提升效率;
- 数据体系:按照贴源数据、统一数仓、标签数据、应用数据的标准统一建设;
- 数据资产管理:包括对数据资产目录、元数据、数据质量、数据血缘、数据生命周期等进行管理和展示,以一种更直观的方式展示企业的数据资产、提升企业的数据意识;
- 数据服务体系:没有很多自带服务,而是提供快速的服务生成能力以及服务的管控、鉴权、计量等功能;
- 运营体系和安全管理:数据中台得以健康、持续运转的基础。