作者:陈剑冬  历史版本:1  最后编辑:陈剑冬  更新时间:2024-11-14 10:57

概述

元数据管理分为采集和维护两个功能模块:

  • 元数据采集:从已创建的数据源中采集数据表,可以跨schema采表。
  • 元数据维护:将采集后的数据进行维护,为数据表添加血缘关系,使得元数据之间的关系一目了然,提高数据分析的效率。

名词解释

  • 元数据:元数据最简单的定义就是“描述数据的数据”,企业一般能管理的数据有业务元数据(数据定义)、技术元数据(数据物理化)、操作元数据(数据处理过程)、管理元数据(数据管理归属)。例如,一本书的封面展示了这样的元数据:图书名称、作者姓名、出版商和版权等。
  • 数据源:配置元数据的采集源。
  • 血缘关系:血缘关系是从某一个元数据作为起点,往回追溯数据处理过程。血缘分析建立在元数据整合的基础上,记录数据治理过程中的血缘关系,基于这些血缘关系信息,可以往回追溯其数据处理过程,并通过图形化的方式展示数据从哪里来,经历了哪些加工。
  • 全链分析:全链分析是以某个元数据为目标节点,其前后与其有关系的所有元数据,其前反应数据的来源,其后反应数据的处理过程。