元数据的概念

元数据被定义为描述数据的数据,其本质仍是数据,但可以看作是一种电子式目录,描述数据及信息资源的属性或内容,协助用户检索、使用数据。

  元数据的分类

元数据可根据存储内容的不同可分为技术元数据、业务元数据、管理元数据三大类,在数据湖平台中则根据元数据的各属性特点,详细的列出了相关信息,便于查询及修改。

  元数据管理的使用方式

  • 元数据生成

数据湖支持自动抓取、手工注册、ER 模型、标准创建、复制、SQL 创建的方式获取元数据。

  • 元数据详情

在元数据管理页面中,通过点击【数据名称】或【操作栏】中的【详情】,均可查看【数据资源详细信息】。详细信息包括基本属性、分类属性、数据结构、数据服务、数据质量、安全属性、分析属性、数据关系、存储属性、示例数据、更新日志、使用说明、申请记录、评论、数据统计、扩展属性等信息。

  • 元数据发布

在元数据页面对需要发布的资源点击【发布】按钮,发布成功后,其他用户可在【大数据开放中台】点击【数据】查看共享列表,进行数据资源的申请。如需下架,点击【下架】按钮即可。

  • 元数据统计

元数据分析监控的数据指标包括名称重复数、无主键字段数、无中文名称数、空表数、临时表数等。以列表的形式列出了符合各条件的数据资源名称,点击数据资源名称即可查看数据资源详细信息。

  元数据管理的意义

“元数据管理是企业数据治理的基础。”

元数据管理的目标是实现企业数据的一致性定义、数据间清晰明确的关系和数据信息的共享。在企业信息化建设中,元数据管理是必不可少的一环。

  • 收集企业分散的元数据,提供完整的企业数据现状的视图 ,增加信息共享程度,关联数据上下文,提高数据价值。
  • 集中管理和控制元数据,确保企业数据的准确性、一致性、完整性,提升企业的数据质量,避免无效数据的使用。
  • 提供系统开发、维护、改造与升级的支持,最大限度地降低信息的复杂性,提高系统建设各环节的效率。
  • 有利于业务人员对数据的理解和数据标准的完善,为业务人员管理、维护与业务数据相关的元数据管理提供工具。
  • 减少因人员流动而导致知识流失的风险,增加了向业务用户报告的数据交付的信心。