如何理解数据资产目录和数据资产标签
资产目录和资产标签的作用
《数据资产管理实践白皮书》中对数据资产管理的定义、重要性、管理范围以及项目落地实施的步骤作了全面的指导性说明,白皮书中汇集了国内各行业数据资产管理专家的智慧结晶,对完善国内数据资产管理相关理论体系起到了非常大的促进作用。
白皮书中也明确说明了数据资产管理是为了解决企业在释放数据价值过程中面临的诸多问题,通过系统化的管理方式实现数据的可得、可用、好用的目的,从而实现数据资产价值的最大化。而在实施落地过程中,要实现数据资产“可得”这个目标,首先就需要明确如何实现数据资产管理的全面性,也就是要优先解决企业中有哪些数据资产,以及这些数据资产在哪里的问题。
同时,数据资产管理系统的用户涵盖了企业中对数据资产进行管理和使用在内的多种多样的角色,而不同的角色,关心的内容也不同,因此,数据资产管理系统中需要从不同的角度来描述数据资产,并对数据资产从类型、用途等多种角度进行分类,以满足不同工作岗位的不同角色对企业数据资产进行查找和使用的问题。为了满足用户对数据资产分类管理和便捷查询的目的,数据资产管理系统中引入了资产目录和资产标签这两个概念。
资产目录和资产标签的区别
虽然,资产目录和资产标签这两个概念的目的都是为了对数据资产进行归类,但是,在实践的过程中,会遇到对这两个概念定义不清,导致大家都知道这两个概念,又无法对两者的区别给出明确定义的问题。并且,对于这两者的概念和区别,很少能在哪个资料中明确地给出一个标准统一的说明,也导致在数据资产系统建设的初期会出现一定程度概念不清晰,需求沟通过程中效率低下的问题。
那么,数据资产目录和数据资产标签的区别是什么呢?
在说明这两个概念的差别之前,可以想一下目录和标签的区别,在生活中的很多场景中都使用了这两个概念。
例如,每一本书都会有目录,目录中描述了整本书的内容体系框架,也明确标注了不同章节内容的页码,方便读者快速定位。那么,目录其实至少包含了两个方面的作用,第一个是为了让读者快速了解书中包含的内容,第二个是为了让读者根据内容的体系框架快速定位到页数,方便快速查找。有很多专业书籍中,不仅会有目录,在书籍的最后还会有专业术语表或者是参考文献表等。而这些,都是为了满足读者从某一个专业术语角度或是某一篇参考文献为出发点,找到书中相对应内容的需求。
再举一个例子,市面上有很多云笔记软件,国内比较著名的有印象笔记、有道云笔记和为知笔记等,在这些云笔记软件中也能够找到目录和标签的概念。例如,云笔记软件中可以创建笔记本组、笔记本或是笔记的文件夹结构用于对用户记录的笔记进行归类,同时,又会有一个标签管理的功能,用户可以定义不同的标签组和标签,并且可以对笔记本中的笔记打上多个标签。这样又实现了可以从目录中定位到笔记,又可以从某个标签找到与标签相关笔记的目的。
从这两个例子阐述的目录和标签的特征,比较之后可以归结出几个特点:
- 无论是书中的目录还是云笔记软件中笔记本的目录,都是一套知识体系的主干结构。书目录中的某个标题是唯一的,其指向的页码中的内容也是唯一的,在书中只有那一部分。云笔记软件中的一篇笔记,也只能放到一个笔记本中,不会存在于不同的笔记本中。因此,目录是对信息分类和管理的主分类,应该具备完整性、全面性和不可重复性。
- 而书中专业术语表中的某一个专业术语所对应的页码,可能会出现好几个,因为,在书中不同页中引用了这个专业术语。云笔记软件中的标签也同样,一个标签可以标注在不同笔记本中的多篇笔记中,同一篇笔记也可以标注多个不同的标签。书中的专业术语表可以按照字母进行分组和排序,云笔记中的标签也可以如此,或者按用户自己的分组进行归类。这样就形成了标签目录体系。因此,标签是为了从其他不同角度对目录中管理的信息进行分类和索引,而使用的辅助分类,根据使用的目的不同,可以存在不同的多套标签体系。
结论
根据以上例子中所描述的场景,进而总结出的目录和标签的差别,再结合数据资产管理的业务场景,基本可以总结出数据资产目录和数据资产标签的特征和构建的方式。
- 数据资产目录是企业数据资产的主分类,其中的资产不能同时归属于不同的目录中,保证资产在目录中的唯一性。并且,数据资产目录构建的角度应该是管理的角度,根据不同数据资产管理范围的划分,由不同的角色进行管理。例如,白皮书描述的数据资产管理范围包含:数据标准、数据模型、元数据、主数据、数据质量等,这些都属于资产的范围,包含了不同类型的数据资产,以数据资产的类型和管理范围为主要维度,可以涵盖企业所有的数据资产。因此,在数据资产的主分类下,根据管理内容的不同可以划分为多个不同的子目录,例如,数据标准主题目录、数据模型目录、元数据资源目录等,分别散落在不同的管理模块中进行维护。
- 数据资产标签是从多个不同角度对资产的描述,一个标签可以标注到不同的资产上,而一个资产也可以同时被标注多个不同的标签,数据资产标签也可以以分组或目录的形式进行归类管理。因此,标签体系的构建应该考虑对数据资产进行查询、盘点、推荐等不同的应用角度。例如,白皮书中谈到了数据安全管理,可以从数据安全级别角度来定义标签目录和标签,并标注到各类资产上,标注完成后就可以从不同的标签体系中,查找数据资产。也可以考虑从业务条线、数据生命周期等角度来定义标签目录体系。
数据资产目录和数据资产标签的概念是在建设数据资产管理系统中,必需要考虑和设计的前提条件,甚至是在整体规划和咨询的必需产出物。目录和标签的构建,体现出的不仅仅是企业资产的种类和范围,还体现了对业务场景中数据资产的应用程度,同时也是赋能业务和数据资产价值最大化的体现。