麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践
556
2023-06-09
数据治理≠数据管理≠数据资产管理,落地时才发现全理解错了……
数据治理、数据管理、数据资产管理,有什么不同?这是一个我被问的最多的问题。
如果要用一张图来描述它们三者之间的关系,你跟赞成以下两幅图的哪个?
如上图1所示,数据治理包含数据管理,数据治理提出了数据管理的目标、架构和蓝图,数据管理是数据治理的技术实现,而数据资产管理是面向数据应用和数据价值的数据管理,属于数据管理的一部分。
如上图2所示,数据资产管理的范畴更大,数据资产管理是数据管理的延伸,而数据治理是确保数据能够被管好的策略。
你认为这两幅图,哪个描述三者关系更准确呢?
如果三个不好比较,那我们把它拆开,两两比较,看一看数据治理、数据管理、数据资产管理,到底有何不同?
一、数据治理 VS 数据管理
观点一:数据管理包含数据治理
业内主流观点认为数据管理包含数据治理。以DAMA为代表,在DAMA-DMBOK2的数据管理框架(车轮图)中,数据治理只是数据管理11个知识领域中的其中之一,如下图:
来源:DAMA-DMBOK2
DAMA关于数据管理和数据治理的定义如下:
数据管理(Data Management)是为了交付、控制、保护并提升数据和信息资产的价值,在其整个生命周期中制订计划、制度、规程和实践活动,并执行和监督的过程。
数据治理(Data Governance, DG)是指对数据资产管理行使权力和控制的活动集合(规划、监督和执行)。
DAMA认为数据管理是管理从数据的获取到数据的消除整个生命周期过程,而数据治理是为了确保组织对数据作出合理、一致的决策,也就是说数据治理是为了更好的管理数据,是数据管理的策略、规程或标准。
观点二:数据治理包含数据管理
另一种不同的观点则是认为数据治理包含数据管理。数据治理是为了实现数据资产价值最大化所开展的一系列持续工作过程,而数据管理是为了实现这一目标而开展的具体技术和业务活动。
数据治理为数据管理指明方向,指导、评估和监督数据管理的有效性;数据管理则通过计划、建设、运营、监督来反馈管理的成效和问题。
笔者的观点
如果我们用简单的包含和被包含关系来理解数据治理和数据管理,确实会有一些争议。笔者更喜欢用一个“金字塔”结构来理解它们:
金字塔顶层的应该是数据治理。与“治理”相关,我们还会经常看到、听到国家治理、公司治理的概念,从某种意义上讲,治理是一种自顶向下的策略或活动。如果我们将国家治理说成国家管理,把公司治理说成公司管控是不是有点怪怪的?因此,数据治理应该是顶层设计、战略规划方面的内容,是数据管理活动的总纲和指导,指明数据管理过程中哪些决策要被制定,以及由“谁”来负责,更强调数据战略、组织模式、职责分工和标准规范。
数据管理是实现数据治理提出的决策,并给予反馈,强调管理流程和机制。数据管理涵盖不同的领域,诸如:元数据管理、主数据管理、数据标准管理、数据质量管理、数据安全管理、数据服务管理等。数据管理是确保数据被管理和监控,从而让数据得到更好的利用。
因此,数据治理强调顶层的策略,管理是侧重于流程和执行,两种相互作用、相辅相成的。而如今,我们听到的更多的“数据治理”这个词,似乎只要涉及与数据管理相关的,都在说自己在搞数据治理。出现这个问题,主要是企业越来越意识到传统IT驱动或者说技术驱动的专项数据管理项目,在实施过程中很难推进、困难重重,并且很难解决业务和管理上的用数难的问题。而从战略、组织入手的数据治理顶层设计,更有利于推动数据管理目标的实现。
二、数据、数据资源、数据资产
如果我们想更加深刻的理解数据资产管理与数据治理到底有啥不同,就必须先拎清楚“数据、数据资源、数据资产”的概念。
1、先说说数据
这里的数据是指“原始数据”,即:记录事实的结果,用来描述事实的未经加工的素材。
数据有两个特征:一是可以描述事实,二是未经加工。例如:开车时,车速传感器记录下来的你的车速;监控摄像头录下的一段视频;气温计显示的温度;企业ERP系统的销售订单记录等等,都属于数据。
有人说:“未经加工的原始数据没有任何意义”。这点我是不认同的,我认为原始数据并不是没有意义,而是原始数据能发挥出价值是有限的(起码它能够描述事实)。但由于原始数据可能存在不能被人所识别,不能被计算机所保存,或者数据本身有质量缺陷等问题,因此,要让数据产生更大的价值,就需要对其进行加工处理,形成更高价值的“信息”。
就像铁矿石——它是有价值吧,但如果你不懂冶炼,不对它进行炼化和提纯,那么从价值的角度,铁矿石和普通的石头也没有太大差别。
2、数据资源
大数据领域首次提出了“数据资源”的概念,但是“数据资源”这个词在很多材料中并没有一个标准的定义。我理解的“数据资源”就是指数据本身,只不过这个数据是按照一定的目标,经过了一定的规划设计,对数据进行采集、汇聚、存储或处理后,形成了能够被再次利用的数据。
例如:企业建设一个信息系统,需要设计系统的数据模型、结构、类型、存储方式等,然后通过人们对系统的流程表单或页面的各种操作,数据就被记录和保存到了信息系统的数据库中,成为了企业的数据资源。从这个层面讲,企业过去的几十年的所有“信息化”工作,都只是在做一件事情——实现数据“资源化”。
数据资源在一定程度上有“量大”的内涵,例如:我们经常听新闻说XX地,矿产资源丰富,一定是说这个地方有大量矿产,而不是只有一块矿石。如果只有一块铁矿石,即使你懂冶金,能够对其进行炼化和提纯,那它产生的价值也是有限的。
同样,一条数据也不能称为数据资源,数据资源必须有一定的量。例如:如果T宝、拼夕夕等电商平台只对你的一次购物记录进行分析的话,其实意义并不大,但如果把你每次的购物数据都被汇聚起来,进行融合性分析,就能轻松知道你的购物偏好,然后给你进行产品推荐,以实现他们所谓的“精准营销”。
3、数据资产
数据资产的概念我们在之前文章中多次提到过:数据资产的是由企业合法拥有或控制并且能够给企业带来经济效益和社会效益的数据资源。
数据资产管理研究的就是如何将数据资源转化为数据资产的过程。
那么,数据资产之后呢,数据又将转化成什么?
数据资产管理促进了数据的交易和流通,当数据交易和流通所需要市场环境、技术环境、法律环境都相应成熟的时候,数据资产就会转为为企业的资本——数据资本。
三、从数据管理到数据资产管理
下面的这幅图是我在厦门大学大数据百家讲坛数据治理公益分享课中用的一张图,它其实反应了从数据资源到数据资产转化的过程。
1)数据资源化
通过数据管理对企业各个数据源进行采集、汇聚和处理,形成企业的统一数据资源库。企业管理数据资源的目的在于数据应用,但在使用数据资源的时候,经常会发现有的数据业务无法识别,有的数据存在大量的质量问题,导致业务无法有效使用。这个时候就需要对数据进行治理。因此,数据治理是为了解决企业数据的质量问题而生!
2)数据资产化
由于数据从创建到消亡的整个生命周期中,从业务到技术,从管理到使用,每个环节都可能发生数据质量的问题。所以,数据治理就不再是简单的技术问题了。也因此,数据治理更加注重对数据资源的整体规划和与之相适应的保障体系的建设,例如数据战略、数据架构、管理组织、管理流程、管理制度等。通过数据治理,打通数据孤岛、提升数据质量,实现了数据为业务赋能,满足了企业内部使用。这个时候企业的数据资源在一定程度上勉强可以称为企业的资产了。
3)数据资本化
严格来讲,数据资产的价值是应该具备可衡量性的,而满足企业内部使用虽然体现了它的使用价值,但这个价值并不好衡量。因此,数据资产管理在数据治理和数据管理的基础上进行了扩展,以价值为驱动,通过对数据资产进行有效管理和估值,促进数据资产交易和流通。
四、数据管理、数据治理、数据资产管理,到底有何不同?
业内的相关数据管理体系中,无论是数据管理,还是数据治理,亦或是数据资源管理、数据资产管理,基本都包含了元数据管理、数据标准管理、数据质量管理、数据安全管理等内容。
所以很多人都很疑惑,那这三个数据管理的相关概念到底有什么不同?
其实,在上文中基本也都交代了,如果您还觉得没说清楚,我们再总结一下,笔者认为:从技术的角度,这几个概念之间差别不大,主要的区别在于它们管理数据的目的和驱动力上。
数据管理是日常的数据管理相关操作和行为,为的就是把数据管起来,让企业知道有哪些数据并确保数据不丢失,至于对如何使用这些数据,目的和需求似乎不是特别强烈。例如:有些大型企业很早设置的DBA岗位,而DBA的职责更多是管理系统的数据库,如数据备份、还原等,还有就是数据集成。
数据资源管理与数据管理比较相似,但数据资源管理的目的性很强,它是应用驱动的,更加贴近业务。数据资源管理以业务的视角,对不同结构、不同类型、不同来源的数据进行归纳、整合和管理,让业务人员也能容易识别和找到想要数据。
数据治理更多的是问题驱动的,根本目的就是为了提升数据质量和控制数据安全,侧重于标准规范和保障体系的建设,促进企业内部的数据利用和交换共享。
数据资产管理是价值驱动,在数据管理、数据治理的基础之上,更多的关注数据的确权问题、估值问题以及交易和流通问题。
以上就是笔者对数据管理、数据治理以及数据资产管理三个概念的一些浅薄理解。有不正确的地方,欢迎各位大佬批评指正。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。