元数据工程师考试试卷及答案_第1页
元数据工程师考试试卷及答案_第2页
元数据工程师考试试卷及答案_第3页
元数据工程师考试试卷及答案_第4页
元数据工程师考试试卷及答案_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

元数据工程师考试试卷及答案一、填空题(每题1分,共10分)1.元数据是描述____的数据,也被称为“数据的数据”。2.按应用场景分类,元数据可分为业务元数据、技术元数据和____元数据。3.开源元数据管理工具包括ApacheAtlas和____。4.CDMI是____数据管理接口的缩写。5.数据血缘描述数据从产生到消费的____关系。6.元数据治理核心目标是确保元数据的准确性、____和可用性。7.ApacheAtlas支持的元数据类型包括实体、关系和____。8.业务元数据通常包含业务定义、____和归属部门。9.元数据生命周期包括采集、存储、____、应用和退役。10.数据目录的核心功能是元数据的____和检索。二、单项选择题(每题2分,共20分)1.以下哪项不属于元数据核心价值?A.数据可观测性B.数据资产化C.数据加密D.血缘跟踪2.ApacheAtlas核心组件不包括?A.元数据存储B.类型系统C.数据湖引擎D.实体模型3.关注数据存储结构和性能的元数据类型是?A.业务元数据B.技术元数据C.操作元数据D.元模型4.数据血缘分析的主要作用是?A.提升存储效率B.排查数据问题根源C.优化查询速度D.降低存储成本5.专注数据目录和元数据搜索的工具是?A.SparkB.AmundsenC.HadoopD.Kafka6.数据血缘质量属于元数据治理的哪类维度?A.准确性B.完整性C.一致性D.时效性7.元数据采集的常见来源是?A.业务报表B.数据库表结构C.考勤记录D.服务器日志8.元模型是描述____的元数据?A.数据本身B.元数据C.业务规则D.数据血缘9.用于元数据交换格式的标准是?A.XMLB.JSONC.RDFD.CSV10.元数据工程师核心职责不包括?A.采集配置B.血缘分析C.数据库性能优化D.治理落地三、多项选择题(每题2分,共20分)1.元数据主要类型包括(多选):A.业务元数据B.技术元数据C.操作元数据D.元模型2.元数据管理工具功能包括(多选):A.采集B.血缘分析C.数据加密D.搜索3.元数据治理关键维度包括(多选):A.准确性B.一致性C.完整性D.时效性4.ApacheAtlas支持的采集源包括(多选):A.Hive表B.MySQLC.KafkaTopicD.业务报表5.数据目录核心功能包括(多选):A.发现B.血缘可视化C.业务定义管理D.数据备份6.元数据应用场景包括(多选):A.资产盘点B.问题排查C.合规检查D.数据迁移7.关于数据血缘的正确描述(多选):A.描述流转路径B.支持影响分析C.仅横向血缘D.含纵向血缘8.元数据采集方式包括(多选):A.主动采集B.被动采集C.手动录入D.自动扫描9.属于元数据标准的是(多选):A.CDMIB.RDFC.OWLD.CSV10.元数据工程师需掌握的技能(多选):A.Atlas/AmundsenB.数据库知识C.治理框架D.机器学习算法四、判断题(每题2分,共20分)1.元数据仅包含技术信息,不涉及业务。()2.ApacheAtlas支持自动采集Hive、Spark元数据。()3.数据血缘分横向(表间)和纵向(字段间)。()4.元数据治理无需业务部门参与。()5.Amundsen是LinkedIn开源工具。()6.元数据生命周期不含退役阶段。()7.业务元数据含归属部门、业务定义。()8.元数据交换仅支持同工具交互。()9.数据目录核心是检索和可视化。()10.元数据工程师无需了解数据仓库架构。()五、简答题(每题5分,共20分)1.简述元数据的核心价值。2.说明ApacheAtlas的核心架构。3.简述元数据采集的常见方式及适用场景。4.说明数据血缘分析的主要应用场景。六、讨论题(每题5分,共10分)1.讨论元数据治理在企业数据战略中的作用及落地步骤。2.讨论开源元数据工具(Atlas、Amundsen)的优缺点及企业选择策略。答案部分一、填空题答案1.数据本身2.操作3.Amundsen4.云5.依赖(或流转)6.一致性7.分类8.业务规则9.治理(或维护)10.发现二、单项选择题答案1.C2.C3.B4.B5.B6.B7.B8.B9.C10.C三、多项选择题答案1.ABC2.ABD3.ABCD4.ABC5.ABC6.ABCD7.ABD8.ABCD9.ABC10.ABC四、判断题答案1.×2.√3.√4.×5.√6.×7.√8.×9.√10.×五、简答题答案1.元数据核心价值:①数据资产化:明确数据归属、定义,转化为可管理资产;②可观测性:通过血缘跟踪数据流转,快速定位错误;③合规治理:支撑GDPR、分类分级等要求;④效率提升:减少数据查找成本,加速开发分析。是数据价值释放的基础。2.Atlas核心架构:四层结构:①元数据模型层(实体、关系、分类);②存储层(HBase存储);③采集层(Hook主动采集、API被动集成);④服务层(RESTAPI、UI,支持搜索、血缘分析)。支持插件扩展对接其他组件。3.采集方式及场景:①自动扫描:结构化数据(数据库表),效率高;②Hook采集:计算引擎(Hive/Spark),实时捕获血缘;③API采集:SaaS工具(BI/CRM),拉取元数据;④手动录入:业务元数据(定义/规则),补自动采集不足。4.血缘分析应用:①问题排查:回溯上游数据源定位错误;②影响分析:评估表变更对下游作业的影响;③合规审计:支撑数据溯源(GDPR);④资产盘点:明确数据关联,避免孤岛。六、讨论题答案1.元数据治理的作用与落地:作用是数据战略的基础支撑(资产化、合规、效率)。落地步骤:①组织保障(跨部门小组);②工具选型(开源/商业);③标准制定(采集规范、治理规则);④试点推广(核心业务域先落地);⑤持续优化(定期审计迭代)。需平衡技术与业务参与。2.开源工具优缺点及选择:优点:成本低、灵活

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论