数据治理治什么?在哪治?怎么治?

数据标准化、数据分析、大数据等数据相关的原创和经典摘录文章分享!

本文摘自石秀峰先生的文章。

今天我们来探讨一下关于数据治理的灵魂三问:

1、数据治理治什么,治的是数据吗?

2、数据治理在哪里治,中台还是后台?

3、数据治理到底怎么治?

数据治理治的是“数据”吗?

数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。其实在我看来,数据可以分为两个部分,一是数字,二是文字。数字是没有意义的抽象符号,数据是有意义的数字。文字表意,数字表量,当两者结合起来,数据就产生了。

在我们的生活和工作当中,数据无处不在。对企业来讲,有很多数据是无关企业重大利益的数据,是没有治理的必要的。数据治理的对象必须是重要的数据资源,是关乎企业重大商业利益的数据资源,这样的数据资源可以称其为“数据资产”。正如北大教授王汉生先生所说:“数据治理不是对“数据”的治理,而是对“数据资产”的治理,是对数据资产所有相关方利益的协调与规范。”

我们需要分开来理解这句话:

①什么是数据资产?

②数据资产的相关利益方是谁?

③协调与规范什么?

先说一说什么是数据资产。我们说不是所有数据都是数据资产,那到底什么才是数据资产呢?

《企业会计准则-基本准则》第20条规定:“资产是指企业过去的交易或者事项形成的、由企业拥有或者控制的、预期会给企业带来经济利益的资源。” 如果照猫画虎修改一下,不难获得一个关于数据资产的定义:“数据资产是指企业过去的交易或者事项形成的,由企业拥有或者控制的,预期会给企业带来经济利益的数据资源。”由此可见,数据要成为数据资产,至少要满足3个核心必要条件:

①数据资产应该是企业的交易或者事项形成的;

②企业拥有或者控制;

③预期会给企业带来经济利益。

数据资产的利益相关方是谁?

根据数据资产的定义,数据资产的利益相关方,包括:

①数据的生产者,即通过业务交易或事项产生数据的人或组织。

②数据的拥有或控制者,生产数据的人不一定是拥有数据,就像我们天天上网的各种数据都不归我们自己所有,而是落在了各个互联网公司的数据库中。

③数据价值和经济利益的收益者。数据治理就是对数据生产者、拥有或控制者,数据价值获益者的规范和协调。

都什么是需要协调和规范?

首先是数据的标准化,定义统一的数据标准,“写中国字、说普通话”让数据资产的相关利益方在同一个“频道”沟通。数据的标准化包含几个层面:①数据模型标准化。②核心数据实体的标准化(主数据的标准化)。③关键指标的标准化。

其次是数据的确权。数据一旦成为资产,就一定有拥有方,或者实际控制人,可以把他们统称产权人。与实物不同的是,实物的产权是比较明确的,数据则比较复杂。产品在生产制造过程中,并没有与消费者交易之前,制造商拥有完全产权。产品生产出来后,消费者通过购买支付相应的货币,便拥有了产品的产权。而数据的生产过程就不一样了,我们的各种上网行为每天都会产生大量的数据,例如:网上购物、浏览网页、使用地图、评论/评价……。这些数据到底归谁所有?控制权该如何治理?这是摆在面前的一个难题!我们看到近几年一些不良商家,利用我们的上网数据,导致安全隐私泄密的事件也层出不穷。希望随着技术和商业的进步,尽快能够找到解决方案!

第三是流程的优化。数据治理的两个目标:一个是提质量,一个是控安全。互联网数据的确权目前已经是一个世界级难题,做好企业业务流程的优化可能会对隐私保护起到一定的作用。通过业务流程优化,规范数据从产生、处理、使用到销毁的整个生命周期,使得数据在各阶段、各流程环节安全可控,合规使用。另外,通过一定的流程优化,通过对相关流程进行监管,按照数据的质量规则进行数据校验,符合“垃圾进、垃圾出”的数据采集、处理、存储原则,提升数据治理,赋能业务应用。

数据治理到底在哪里治?

关于数据中台到底应该在中台治理还是应该在后台治理,这个话题在笔者所在的数据圈子中引起了激烈的讨论。群里参与讨论的都是业界的大咖,讨论内容也十分精彩,我截了部分的截图,先看看大咖们的观点:

数据治理到底应该放在中台,还是后台,我个人的理解是:小数据标准化治理靠人工、大数据预测性分析靠智能,将两者结合起来:“人工+智能”形成了完整的数据治理技术体系。一个企业的数据治理既离不开小数据的标准化治理,也离不开大数据的预测性分析。

这里的小数据,是在承载事物实体的数据,例如:人、财、物等,是企业所有业务开展的载体。其实说白了就是主数据管理。对于主数据的治理笔者认为是一个后台行为,治理核心是“唯一数据源、统一数据标准”,而要达到这一目标是需要从数据的源头抓起的,并且需要大量的人为干预,比如:数据标准的制定和落实,数据质量的清洗,数据的申请审批,数据的分发和共享等。从这里也能够看出小数据的治理,追求的是标准化、精确化,应该是一个后台行为。

而在大数据时代,得益于大数据技术的突破,大量的结构化、非结构化、异构化的数据能够得到储存、处理、计算和分析,这一方面提升了我们从海量数据中获取知识和洞见的能力。对于大数据,传统的一味追求精确的思维受到了挑战。而对于大数据的治理,允许一定程度上的容错,反而可以在宏观层面拥有更好的知识和洞察力。对于大数据的治理更多的是采用AI技术,例如:知识图谱、语音识别等,对大数据的采集、处理、使用过程加以控制,使其能够合规使用。所以,大数据的治理放在中台似乎更为合适。

数据治理到底应该怎么治?

数据到底怎么治,这确实是一个宽泛的话题,首先是要明确治理的内容。针对不同的治理内容采取不同的数据治理策略。关于小数据和大数据的治理侧重点上文已经说明。以下为笔者在数据治理领域总结的数据治理十大关键实践:

1、成立组织,育人才

数据治理的根本目标的是提升数据质量,控制数据安全和合规使用。数据治理涉及范围广,参与人员多,需要一定的组织和制度的保障才可能获得成功。首先,依据行业经验来看,不论是基于后台的小数据治理,还是基于中台的大数据治理,“一把手”工程是数据治理组织建设的最佳实践。尤其是中台数据治理更是上升至企业战略层面,自下而上的治理几乎不太可能成功。其次,数据治理组织的建立并是组建一个非临时团队,而是要能够支撑企业数据化业务的一个完整体系,包括:组织体系、管理体系、执行体系、技术体系等。第三,数据治理组织的人员选拔和人才培养,不同企业应有不同的策略。一般来说,建立数据治理组织从企业内部进行选拔相应的技术专家、业务专家更为合适,要比从外部招聘更能够快速上手。不过,对于传统企业,其内部更偏管理,数据治理团队建设更多需要借助外部力量。

2、需求调研,摸家底

与数据项目一样,详细需求调研是开展数据治理工作的第一阶段的重要工作。本阶段主要是理解企业的战略,并按照从上而下的策略进行开展企业数据管理的现状调研,摸清楚企业数据资产的分布、数据的质量、数据的管理现状、数据应用需求等情况。该阶段的工作目标是确定数据治理项目的目标和范围,评估数据治理成熟度,确定改进内容和方向并与客户达成共识。

3、梳理数据,建标准

按照业务主题进行数据资产的梳理,并制定数据资产的标准。首先,定义数据资产元模型标准,包括:数据资产的数据含义、业务规则、质量规则、数据来源、存储路径、管理部门、管理人等,即数据资产的元数据标准,定义好数据模型是数据治理成功落地的重要前提;其次,重点对企业的核心数据资产——主数据进行标准化,包括:主数据标准化定义、参照字典的标准化、数据清洗、数据服务共享等;第三,对业务指标的属性的标准化,指标的属性分为“业务属性”和“技术属性”两类,业务属性包含业务人员通常认识的指标分类、名称、计算公式、展现方式和查询权限等;技术属性包含技术运维人员所关心的系统来源、取数字段、取数频率、加工规则等,其核心也是元数据管理。

4、优化流程,定制度

对于企业而言,数据来源于很多方面,内部数据如财务、人力、供应链、生产、销售等;外部数据如政治、经济、社会、科技、行业、市场、竞争对手等。虽然数据来源广、数据量大是优点,但如果不加以整理和关联,杂乱无章的数据不仅不利于分析应用,还将带来不必要的人财物的消耗。所以,非常有必要对数据产生、采集、处理、加工、使用等过程进行规范。通过统一数据标准,制定合理的数据管理流程和制度,规范数据生产供应的过程。

5、搭建平台,接数据

数据治理平台的搭建要根据不同的客户需求搭建不同模块,数据治理平台主要涵盖功能模块有:元数据管理、主数据管理、数据质量管理、数据标准管理、数据安全管理、数据模型工具、ETL工具等。数据接入是将各种来源、各种类型的数据,通过数据集成工具将这些零散的数据整合在一起,纳入统一的大数据平平台或数据仓库中,这一过程需要符合数据治理平台定义各种数据标准、质量规则、安全指标。所以,我们说数据治理项目不是为了治理数据而建设的,而是配合大数据平台、数据仓库、数据分析挖掘等项目,通过提升数据质量、控制数据安全,让数据发挥出最大的效益。

6、建立指标,提质量

提升数据质量是企业数据治理的重要目标,也是企业进行数据分析挖掘、业务管理和决策的重要基础,只有建立完整的数据质量体系,才能有效提升企业数据整体质量,从而更好的为业务服务。从技术面上讲,定义完整全面的数据质量的评估维度,包括完整性、时效性等,并按照已定义的维度,在系统建设的各个阶段都应该根据标准进行数据质量检测和规范,及时进行治理,避免事后的清洗工作。

7、优化模型,控安全

数据安全治理,始于数据资产梳理。通过对数据资产的梳理,可以确定敏感数据在系统内部的分布、确定敏感数据是如何被访问的、确定当前的账号和授权的状况。根据企业的数据价值和特征,梳理出企业的核心数据资产,对其分级分类,通过数据治理工具进行建模,定义敏感数据位置、描述和处理方式,保证数据的合规合法使用。

8、开放服务,促应用

数据的治理是为促进数据更好的应用,一切不以应用为目的数据治理都是耍流氓。通过数据资产目录、微服务等技术将数据进行开发共享,促进数据在企业中的应用,使得数据作为企业的宝贵资产应用于业务、管理和战略决策中,发挥数据资产价值。

9、赋能业务,抓创新

数据赋能是在管理和业务应用中发挥数据更大的价值,以数据驱动业务的落地。数据赋能核心是,①汇聚数据:完善企业内部信息数据化,采集外部数据;②治理数据:整合数据,清洗、转换、分析、服务;③应用数据:以数据为驱动将洞察结果应用到实际业务中去,推动企业业务和管理的创新。

10、持续优化,再出发

笔者认为企业的数据治理是一个螺旋上升模型,需要不断的迭代和优化。数据治理不能一蹴而就,需要建立起长效的持续运营机制,要将数据治理变成企业的一种机制、一种文化、一种习惯,而数据治理每一次迭代优化都预示着企业数据战略目标的再出发!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,098评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,213评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,960评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,519评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,512评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,533评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,914评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,574评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,804评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,563评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,644评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,350评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,933评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,908评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,146评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,847评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,361评论 2 342

推荐阅读更多精彩内容