睿象云智能告警平台的分派策略
767
2023-02-27
本文目录一览:
从技术实施角度看,数据治理包含“理”“采”“存”“管”“用”这五个步骤,即业务和数据资源梳理、数据采集清洗、数据库设计和存储、数据管理、数据使用。
数据资源梳理:数据治理的第一个步骤是从业务的视角厘清组织的数据资源环境和数据资源清单,包含组织机构、业务事项、信息系统,以及以数据库、网页、文件和 API 接口形式存在的数据项资源,本步骤的输出物为分门别类的数据资源清单。
数据采集清洗:通过可视化的 ETL 工具将数据从来源端经过抽取 (extract)、转换 (transform)、加载 (load) 至目的端的过程,目的是将散落和零乱的数据集中存储起来。
基础库主题库建设:一般情况下,可以将数据分为基础数据、业务主题数据和分析数据。基础数据一般指的是核心实体数据,或称主数据,例如智慧城市中的人口、法人、地理信息、信用、电子证照等数据。主题数据一般指的是某个业务主题数据,例如市场监督管理局的食品监管、质量监督检查、企业综合监管等数据。而分析数据指的是基于业务主题数据综合分析而得的分析结果数据,例如市场监督管理局的企业综合评价、产业区域分布、高危企业分布等。那么基础库和主题库的建设就是在对业务理解的基础上,基于易存储、易管理、易使用的原则抽像数据存储结构,说白了,就是基于一定的原则设计数据库表结构,然后再根据数据资源清单设计数据采集清洗流程,将整洁干净的数据存储到数据库或数据仓库中。
元数据管理:元数据管理是对基础库和主题库中的数据项属性的管理,同时,将数据项的业务含义与数据项进行了关联,便于业务人员也能够理解数据库中的数据字段含义,并且,元数据是后面提到的自动化数据共享、数据交换和商业智能(BI)的基础。需要注意的是,元数据管理一般是对基础库和主题库中(即核心数据资产)的数据项属性的管理,而数据资源清单是对各类数据来源的数据项的管理。
血缘追踪:数据被业务场景使用时,发现数据错误,数据治理团队需要快速定位数据来源,修复数据错误。那么数据治理团队需要知道业务团队的数据来自于哪个核心库,核心库的数据又来自于哪个数据源头。我们的实践是在元数据和数据资源清单之间建立关联关系,且业务团队使用的数据项由元数据组合配置而来,这样,就建立了数据使用场景与数据源头之间的血缘关系。 数据资源目录:数据资源目录一般应用于数据共享的场景,例如政府部门之间的数据共享,数据资源目录是基于业务场景和行业规范而创建,同时依托于元数据和基础库主题而实现自动化的数据申请和使用。
质量管理:数据价值的成功发掘必须依托于高质量的数据,唯有准确、完整、一致的数据才有使用价值。因此,需要从多维度来分析数据的质量,例如:偏移量、非空检查、值域检查、规范性检查、重复性检查、关联关系检查、离群值检查、波动检查等等。需要注意的是,优秀的数据质量模型的设计必须依赖于对业务的深刻理解,在技术上也推荐使用大数据相关技术来保障检测性能和降低对业务系统的性能影响,例如 Hadoop,MapReduce,HBase 等。
商业智能(BI):数据治理的目的是使用,对于一个大型的数据仓库来说,数据使用的场景和需求是多变的,那么可以使用 BI 类的产品快速获取需要的数据,并分析形成报表,像派可数据就属于专业的BI厂商。
数据共享交换:数据共享包括组织内部和组织之间的数据共享,共享方式也分为库表、文件和 API 接口三种共享方式,库表共享比较直接粗暴,文件共享方式通过 ETL 工具做一个反向的数据交换也就可以实现。我们比较推荐的是 API 接口共享方式,在这种方式下,能够让中心数据仓库保留数据所有权,把数据使用权通过 API 接口的形式进行了转移。API 接口共享可以使用 API 网关实现,常见的功能是自动化的接口生成、申请审核、限流、限并发、多用户隔离、调用统计、调用审计、黑白名单、调用监控、质量监控等等。
数据治理包括以下几个方面:
1、数据集中存储与管理:为降低数据治理的难度、成本和复杂度,通过建立数据集中管理的制度减少数据复制和分散存储,提高数据的集中度和集成度。
2、数据存储有合理的期限和方式:数据存储有明确的生命周期管理,并且能够根据数据的重要性和数据用户的访问情况,在数据存储生命周期的不同阶段采用有针对性和差异化的存储策略。
3、数据进行统一的加工和整合:为了能够达到数据治理组织制定的数据标准和质量要求,数据需要采用统一的工具和规则进行处理和整合。
4、数据是易访问的:数据要能够非常方便的为数据用户获取和使用,但是要在满足数据治理要求的数据标准、数据质量和信息安全的情况下。
5、数据访问有安全控制:因为数据资产的重要性和可复制性,就必然要求数据的访问、获取和存储需要有安全的管控,避免企业的核心资产泄露,造成无法挽回的损失
简介:
数据治理是20世纪90年代兴起的概念,起初数据治理的主要目标是进行客户数据的清理、完善数据标注,确保组织数据的完整性。伴随着企业规模的不断扩大,数据技术管理的相关理论不断成熟和完善,企业数据治理的重要性也在业界达成了广泛的共识,即数据不但有价值而且还是企业有竞争价值的资产。
为了能够让数据一致、准确和及时的提供给数字化建设的使用者,让数据能够被使用者更容易理解,发挥数据资产的最大价值,企业需要对现有数据进行治理。
什么是数据治理?
数据治理是流程、角色、政策、标准和指标的集合,可确保有效和高效地使用信息,使组织能够实现其目标。它建立了流程和职责,以确保整个企业或组织中使用的数据的质量和安全性。数据治理定义了谁可以对什么数据、在什么情况下、使用什么方法采取什么行动。
精心设计的数据治理策略对于任何处理大数据的组织来说都是基础,它将解释业务如何从一致、通用的流程和职责中受益。业务驱动因素强调在数据治理策略中需要谨慎控制哪些数据以及从这项工作中获得的预期收益。此策略将成为数据治理框架的基础。
例如,如果数据治理策略的业务驱动因素是确保医疗保健相关数据的隐私,则需要在患者数据流经业务时对其进行安全管理。将定义保留要求(例如,谁更改了哪些信息以及何时更改的历史记录)以确保符合相关政府要求,例如GDPR。
数据治理可确保明确定义与数据相关的角色,并在整个企业内就责任和问责制达成一致。精心规划的数据治理框架涵盖战略、战术和运营角色和职责。
数据治理不是什么
数据治理经常与其他密切相关的术语和概念混淆,包括数据管理和主数据管理。
数据治理不是数据管理
数据管理是指对组织全数据生命周期需求的管理。数据治理是数据管理的核心组成部分,将其他九个学科联系在一起,例如数据质量、参考和主数据管理、数据安全、数据库操作、元数据管理和数据仓库。
数据治理不是主数据管理
主数据管理 (MDM) 侧重于识别组织的关键实体,然后提高这些数据的质量。它确保拥有有关客户、供应商、服务提供者等关键实体的最完整和准确的可用信息。由于这些实体在整个组织中共享,因此主数据管理是将这些实体的碎片化视图整合到一个视图中——超越数据治理的纪律。
但是,没有适当的治理就没有成功的 MDM。例如,数据治理计划将定义主数据模型(客户、产品等的定义是什么),详细说明数据的保留策略,并定义数据创作、数据管理和访问的角色和职责.
数据治理不是数据管理
数据治理可确保为合适的人员分配合适的数据职责。数据管理是指为确保数据准确、可控且易于被相关方发现和处理的必要活动。数据治理主要是关于战略、角色、组织和政策,而数据管理则是关于执行和运营。
数据管理员负责数据资产,确保实际数据与数据治理计划一致,与其他数据资产相关联,并在数据质量、合规性或安全性方面受到控制。
数据治理的好处
有效的数据治理策略可为组织带来许多好处,包括:
对数据的共同理解——数据治理为数据提供了一致的视图和通用术语,同时各个业务部门保留了适当的灵活性。
提高数据质量——数据治理创建了一个确保数据准确性、完整性和一致性的计划。
数据地图——数据治理提供了一种高级能力来了解与关键实体相关的所有数据的位置,这对于就像GPS可以代表物理景观并帮助人们在未知景观中找到方向一样,数据治理使数据资产变得可用并且更容易与业务成果联系起来。
每个客户和其他业务实体的360 度视图——数据治理建立了一个框架,以便组织可以就关键业务实体的“单一版本真相”达成一致,并在实体和业务活动之间建立适当的一致性级别。
一致的合规性— 数据治理提供了一个平台来满足政府法规的要求,例如数据安全法、个人信息保护法欧盟通用数据保护条例 (GDPR)和行业要求,例如 PCI DSS(支付卡行业数据安全标准)。
改进数据管理——数据治理将人的维度带入高度自动化、数据驱动的世界。它建立了数据管理的行为准则和最佳实践,确保传统数据和技术领域(包括法律、安全和合规等领域)以外的问题和需求得到一致解决。
数据治理分为四个阶段数据治理:
第一阶段数据治理,梳理企业信息,构建企业的数据资产库。首先要清楚企业的数据模型、数据关系,对企业资产形成业务视图、技术视图等针对不同用户视角的展示。
第二阶段,建立管理流程,落地数据标准,提升数据质量。从企业角度梳理质量问题,紧抓标准落地。
第三阶段,直接为用户提供价值。本阶段依赖于前两个阶段的建设,为用户提供方便的获取数据的途径。
第四阶段,为企业提供数据价值。通过多种手段对多种来源的数据进行分析,形成企业知识图谱,体现数据的深层价值。
通过这4个阶段的建设,建立起全企业的数据质量管控平台,以用户为中心,由用户使用数据并通过用户的使用优化数据质量,既达到数据治理了数据治理的目标,也最大限度的发挥了数据的价值。
数据治理方案:
有关数据治理的问题并不能在企业的单一部门得到解决。这需要IT与业务部门进行协作,而且必须始终如一地进行协作,以改善数据的可靠性和质量,从而为关键业务方案提供支持,并确保遵守法规。
Informatica能够提供企业级数据治理解决方案,该解决方案可以在本地或云中使用,在传统数据或大数据中均有使用案例,可以满足业务和IT部门的需求。
Informatica可提供功能齐全而又稳健可靠的数据治理解决方案,具备交付可信、安全的数据和启动成功的元数据管理方案所需的全部精确功能。
Informatica Axon提供端到端智能数据治理解决方案,以整体、协作的方法将员工、流程和系统流畅融合,从而实现战略业务成果。Axon Data Governance作为协作中心,为成功实施数据治理计划提供支持。
发表评论
暂时没有评论,来抢沙发吧~