数据治理体系综合介绍
01
数据治理定义
数据治理是一个系统,用于定义组织内谁有权和控制数据资产以及如何使用这些数据资产。它包含管理和保护数据资产所需的人员、流程和技术。
数据治理研究所将其定义为“信息相关流程的决策权和责任系统,根据商定的模型执行,该模型描述了谁可以对什么信息采取什么行动,以及何时、在什么情况下、使用什么方法。”
国际数据管理协会 (DAMA) 将其定义为“对数据管理以及数据和数据相关来源的使用进行规划、监督和控制”。
02
数据治理与数据管理
数据治理只是数据管理整个学科的一部分,尽管很重要。数据治理是关于确保数据资产的问责制和所有权的角色、职责和流程,而 DAMA 将数据管理定义为“一个总体术语,描述用于规划、指定、启用、创建、获取、维护、使用、存档、检索、控制和清除数据。”
虽然数据管理已成为该学科的通用术语,但有时也称为数据资源管理或企业信息管理 (EIM)。Gartner 将 EIM 描述为“跨组织和技术边界构建、描述和管理信息资产以提高效率、提高透明度和实现业务洞察力的综合学科。”
03
数据治理框架
最好将数据治理视为支持组织总体数据管理策略的功能。这样的框架为您的组织提供了一种收集、管理、保护和存储数据的整体方法。为了帮助理解框架应涵盖的内容,DAMA 将数据管理设想为一个轮子,以数据治理为中心,辐射出以下 10 个数据管理知识领域:
数据架构
数据和数据相关资源的整体结构,作为企业架构的一个组成部分
数据建模和设计
分析、设计、构建、测试和维护
数据存储与运营
结构化物理数据资产存储部署与管理
数据安全
确保隐私、机密性和适当的访问
数据集成和互操作性
获取、提取、转换、移动、交付、复制、联合、虚拟化和操作支持
文档和内容
存储、保护、索引和访问非结构化来源中的数据,并使这些数据可用于与结构化数据的集成和互操作性
参考和主数据
管理共享数据以通过标准化定义和使用数据值来减少冗余并确保更好的数据质量
数据仓库和商业智能 (BI)
管理分析数据处理并允许访问决策支持数据以进行报告和分析
元数据
收集、分类、维护、集成、控制、管理和交付元数据
数据质量
定义、监控、维护数据完整性和提高数据质量
在制定策略时,应考虑数据收集、管理、存档和使用的上述各个方面。
商业应用研究中心 (BARC) 警告说,这不是一个“大爆炸计划”。作为一个高度复杂的、持续的项目,数据治理冒着参与者随着时间的推移失去信任和兴趣的风险。为了解决这个问题,BARC 建议从一个可管理的或特定于应用程序的原型项目开始,然后根据经验教训在整个公司范围内扩展。
BARC 建议执行以下步骤:
01
定义目标并了解收益
02
分析当前状态和增量分析
03
导出路线图
04
说服利益相关者参与预算项目
05
制定和规划数据治理计划
06
实施数据治理计划
07
实现监控
04
数据治理的目标
目标是建立标准化、集成、保护和存储企业数据的方法、职责和流程。根据 BARC,一个组织的主要目标应该是:
01
最小化风险
02
建立内部数据使用规则
03
实施合规要求
04
改善内部和外部沟通
05
增加数据的价值
06
促进上述管理
07
减少开支
08
通过风险管理和优化帮助确保公司的持续存在
BARC 指出,此类计划始终跨越企业的战略、战术和运营层面,必须将它们视为持续的、迭代的过程。
05
数据治理的好处
大多数公司已经对单个应用程序、业务单元或功能进行了某种形式的治理,即使流程和职责是非正式的。作为一种实践,它是关于对这些流程和责任建立系统的、正式的控制。这样做可以帮助公司保持响应能力,尤其是当公司规模扩大到个人执行跨职能任务不再有效时。数据管理的几个整体效益只有在企业建立系统的数据治理后才能实现。其中一些好处包括:
01
来自整个组织一致、统一的数据的更好、更全面的决策支持
02
更改流程和数据的明确规则,帮助业务和 IT 变得更加敏捷和可扩展
03
通过提供中央控制机制降低其他数据管理领域的成本
04
通过重用流程和数据的能力提高效率
05
提高对数据质量和数据过程文档的信心
06
更好地遵守数据法规
06
数据治理原则
根据数据治理研究所的说法,八项原则是所有成功的数据治理和管理计划的核心:
01
所有参与者在与对方打交道时都必须保持诚信。在讨论与数据相关的决策的驱动因素、约束、选项和影响时,他们必须真实和坦率。
02
数据治理和管理流程需要透明度。所有参与者和审计员都必须清楚如何以及何时将与数据相关的决策和控制引入流程中。
03
受数据治理约束的与数据相关的决策、流程和控制必须是可审计的。它们必须附有文件以支持基于合规性和操作的审计要求。
04
必须定义谁对跨职能数据相关的决策、流程和控制负责。
05
定义谁对管理活动负责,这些活动是个人贡献者和数据管理员组的职责。
06
程序必须以一种在业务和技术团队之间、创建/收集信息的人员、管理信息的人员、使用信息的人员以及引入标准和合规要求的人员之间建立制衡的方式定义责任。
07
该计划必须引入和支持企业数据的标准化。
08
计划必须支持针对参考数据值以及主数据和元数据的结构/使用的主动和被动变更管理活动。
07
数据治理角色
每个企业都以不同的方式构建其数据治理,但存在一些共性。
01
指导委员会
治理计划跨越整个企业,通常从一个由高级管理人员组成的指导委员会开始,通常是 C 级个人或负责业务线的副总裁。Morgan Templar 是Get Governed: Building World Class Data Governance Programs 的作者,他说指导委员会成员的职责包括制定具有特定结果的整体治理策略、支持数据管理员的工作以及让治理组织对时间表和结果负责。
02
数据拥有者
Templar 表示,数据所有者是负责确保特定数据域中的信息跨系统和业务线进行管理的个人。他们通常是指导委员会的成员,但可能不是投票成员。数据所有者负责:
01
批准数据词汇表和其他数据定义
02
确保整个企业信息的准确性
03
直接的数据质量活动
04
审查和批准主数据管理方法、结果和活动
05
与其他数据所有者合作解决数据问题
06
对数据管理员发现的问题进行二级审查
07
向指导委员会提供有关其数据领域的软件解决方案、政策或监管要求的意见
03
数据管家
数据管理员负责数据的日常管理。Templar 说,他们是主题专家 (SME),了解和传达信息的含义和使用,并且他们与整个组织的其他数据管理员合作,作为大多数数据决策的管理机构。数据管理员负责:
01
成为数据领域的中小企业
02
识别数据问题并与其他数据管理员合作解决这些问题
03
作为数据管家委员会的成员
04
数据政策和委员会活动的提议、讨论和投票
05
向数据所有者和数据域内的其他利益相关者报告
06
跨业务线跨职能工作,以确保管理和理解其域的数据
08
数据治理工具
数据治理是一个持续的计划而不是技术解决方案,但有一些工具可以帮助支持该计划。适合您企业的工具取决于您的需求、数据量和预算。根据IT Central Station 的说法,一些比较流行的解决方案包括:
Collibra 治理
Collibra 是一种企业范围的解决方案,可自动执行许多治理和管理任务。它包括一个策略管理器、数据帮助台、数据字典和业务词汇表。
SAS 数据管理
SAS 数据管理基于 SAS 平台构建,提供基于角色的 GUI 来管理流程,包括集成的业务词汇表、SAS 和第三方元数据管理以及沿袭可视化。
用于数据治理的 erwin 数据智能 (DI)
erwin DI 结合了数据目录和数据素养功能,以提供对可用数据资产的感知和访问。它提供有关使用这些数据资产的指导,并确保遵循数据政策和最佳实践。
Informatica Axon
Informatica Axon 是支持程序的收集中心和数据市场。主要功能包括协作业务词汇表、可视化数据沿袭的能力以及根据业务定义生成数据质量度量。
SAP Data Hub
SAP Data Hub 是一种数据编排解决方案,旨在帮助您发现、优化、丰富和管理整个数据环境中的所有类型、种类和数量的数据。它帮助组织为用户、组和角色建立安全设置和身份控制策略,并简化策略管理和安全日志记录的最佳实践和流程。
Alation
Alation 是一个企业数据目录,可按源自动索引数据。TrustCheck 是其关键功能之一,可为工作流程提供实时“护栏”。TrustCheck 专门用于支持自助式分析,为数据资产附加了指导方针和规则。
Varonis 数据治理套件
Varonis 的解决方案利用可扩展的元数据框架自动执行数据保护和管理任务,该框架使组织能够管理数据访问、查看每个文件和电子邮件事件的审计跟踪、识别不同业务部门的数据所有权以及查找和分类敏感数据和文件。
IBM 数据治理
IBM 数据治理利用机器学习来收集和管理数据资产。集成数据目录可帮助企业查找、管理、分析、准备和共享数据。
09
数据治理认证
数据治理是一个系统,但有一些认证可以帮助您的组织获得优势,包括:
01
DAMA 认证数据管理专家 (CDMP)
02
数据治理和管理专业人员 (DGSP)
03
EDX 企业数据管理
04
SAP 认证应用程序助理
|