下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
站名:站名:年级专业:姓名:学号:凡年级专业、姓名、学号错写、漏写或字迹不清者,成绩按零分记。…………密………………封………………线…………第1页,共1页丽江师范学院《大数据分析及应用》2025-2026学年第二学期期末试卷(A卷)注意事项:1.请考生在下列横线上填写姓名、学号和年级专业。2.请仔细阅读各种题目的回答要求,在规定的位置填写答案。3.不要在试卷上乱写乱画,不要在装订线内填写无关的内容。4.考试时间120分钟专业学号姓名题号一二三四五六七八总分统分人复查人得分得分评分人一、单项选择题(每题1分,共20分)1.以下哪个不是大数据分析中的数据预处理步骤?A.数据清洗B.数据集成C.数据归一化D.数据加密2.在Hadoop生态系统中,哪个组件负责存储数据?A.HDFSB.YARNC.MapReduceD.Hive3.以下哪个不是数据挖掘中的分类算法?A.决策树B.K-meansC.支持向量机D.聚类分析4.在大数据分析中,以下哪个不是数据可视化工具?A.TableauB.PowerBIC.ExcelD.Python5.以下哪个不是大数据分析中的数据挖掘任务?A.聚类B.关联规则挖掘C.文本挖掘D.数据预处理6.在Hadoop生态系统中,哪个组件负责资源管理和作业调度?A.HDFSB.YARNC.MapReduceD.Hive7.以下哪个不是数据挖掘中的聚类算法?A.K-meansB.KNNC.决策树D.支持向量机8.在大数据分析中,以下哪个不是数据预处理步骤?A.数据清洗B.数据集成C.数据归一化D.数据脱敏9.以下哪个不是数据挖掘中的关联规则挖掘算法?A.AprioriB.FP-growthC.决策树D.支持向量机10.在大数据分析中,以下哪个不是数据可视化工具?A.TableauB.PowerBIC.ExcelD.R11.以下哪个不是大数据分析中的数据挖掘任务?A.聚类B.关联规则挖掘C.文本挖掘D.数据清洗12.在Hadoop生态系统中,哪个组件负责资源管理和作业调度?A.HDFSB.YARNC.MapReduceD.Hive13.以下哪个不是数据挖掘中的聚类算法?A.K-meansB.KNNC.决策树D.支持向量机14.在大数据分析中,以下哪个不是数据预处理步骤?A.数据清洗B.数据集成C.数据归一化D.数据脱敏15.以下哪个不是数据挖掘中的关联规则挖掘算法?A.AprioriB.FP-growthC.决策树D.支持向量机16.在大数据分析中,以下哪个不是数据可视化工具?A.TableauB.PowerBIC.ExcelD.R17.以下哪个不是大数据分析中的数据挖掘任务?A.聚类B.关联规则挖掘C.文本挖掘D.数据清洗18.在Hadoop生态系统中,哪个组件负责资源管理和作业调度?A.HDFSB.YARNC.MapReduceD.Hive19.以下哪个不是数据挖掘中的聚类算法?A.K-meansB.KNNC.决策树D.支持向量机20.在大数据分析中,以下哪个不是数据预处理步骤?A.数据清洗B.数据集成C.数据归一化D.数据脱敏二、多项选择题(每题2分,共20分)1.以下哪些是大数据分析中的数据预处理步骤?A.数据清洗B.数据集成C.数据归一化D.数据脱敏2.以下哪些是Hadoop生态系统的组件?A.HDFSB.YARNC.MapReduceD.Hive3.以下哪些是数据挖掘中的分类算法?A.决策树B.K-meansC.支持向量机D.聚类分析4.以下哪些是数据可视化工具?A.TableauB.PowerBIC.ExcelD.R5.以下哪些是大数据分析中的数据挖掘任务?A.聚类B.关联规则挖掘C.文本挖掘D.数据预处理6.以下哪些是Hadoop生态系统的组件?A.HDFSB.YARNC.MapReduceD.Hive7.以下哪些是数据挖掘中的聚类算法?A.K-meansB.KNNC.决策树D.支持向量机8.以下哪些是大数据分析中的数据预处理步骤?A.数据清洗B.数据集成C.数据归一化D.数据脱敏9.以下哪些是数据挖掘中的关联规则挖掘算法?A.AprioriB.FP-growthC.决策树D.支持向量机10.以下哪些是数据可视化工具?A.TableauB.PowerBIC.ExcelD.R三、判断题(每题1分,共10分)1.大数据分析中的数据预处理步骤包括数据清洗、数据集成、数据归一化和数据脱敏。()2.Hadoop生态系统中,HDFS负责存储数据,YARN负责资源管理和作业调度。()3.数据挖掘中的分类算法包括K-means、支持向量机和聚类分析。()4.Tableau和PowerBI是数据可视化工具,Excel和R不是。()5.大数据分析中的数据挖掘任务包括聚类、关联规则挖掘、文本挖掘和数据预处理。()6.Hadoop生态系统中,MapReduce负责资源管理和作业调度,YARN负责存储数据。()7.数据挖掘中的聚类算法包括K-means、KNN、决策树和聚类分析。()8.数据预处理步骤包括数据清洗、数据集成、数据归一化和数据脱敏。()9.Apriori和FP-growth是数据挖掘中的关联规则挖掘算法,决策树和支持向量机不是。()10.Tableau和PowerBI是数据可视化工具,Excel和R不是。()四、名词解释(每题4分,共20分)1.大数据分析2.Hadoop3.数据挖掘4.数据可视化5.聚类分析五、简答题(每题6分,共18分)1.简述大数据分析中的数据预处理步骤。2.简述Hadoop生态系统中各个组件的作用。3.简述数据挖掘中的分类算法和聚类算法的区别。六、案例分析
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度中广视资产管理有限公司社会招聘笔试历年参考题库附带答案详解
- 2025年度中国南水北调集团水网智慧科技有限公司春招后续公开招聘笔试历年参考题库附带答案详解
- 2025年广东龙门县园区产业投资有限公司下属企业招聘两名职工笔试历年参考题库附带答案详解
- 2025年山东铁投集团春季社会公开招聘46人笔试历年参考题库附带答案详解
- 2025年安徽铜陵阳光电力维修工程有限公司招聘6人(第二批次)笔试历年参考题库附带答案详解
- 2025年公开选聘达州国鑫产业发展有限责任公司专业技术人员笔试历年参考题库附带答案详解
- 2025山东威海广安城投物业管理有限公司招聘工作人员10人笔试历年参考题库附带答案详解
- 2025安徽诚信项目管理有限公司造价人员招聘5人笔试历年参考题库附带答案详解
- 2025安徽芜湖市南陵县工业投资有限公司招聘1人笔试历年参考题库附带答案详解
- 桥东区胜利北街道招聘社区网格员备考题库附答案详解
- YS/T 583-2016热锻水暖管件用黄铜棒
- GB/Z 13800-2021手动轮椅车
- 2023年沅陵县水利系统事业单位招聘笔试题库及答案
- GB/T 24919-2010工业阀门安装使用维护一般要求
- GB/T 17492-2019工业用金属丝编织网技术要求和检验
- 化验室安全培训课件
- 最新合同法课件
- 夏季高温施工专项方案17P
- Java教案5面向对象编程技术
- 建筑工程脚手架安全施工培训ppt
- 内蒙古自治区专业技术人员年考核表
评论
0/150
提交评论