云南民族大学《大数据分析与应用(澜湄经济项目评估)》2024-2025 学年第一学期期末试卷(数据科学核心课)_第1页
云南民族大学《大数据分析与应用(澜湄经济项目评估)》2024-2025 学年第一学期期末试卷(数据科学核心课)_第2页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

班级班级学号姓名本科..............................密..............................封..............................线..............................试卷说明:1、试卷满分100分,120分钟完成试卷;2、钢笔或圆珠笔直接答在试题中(除题目有特殊规定外);3、答卷前将密封线内的项目填写清楚。题号一二三四五总分合分人复核人满分100得分一、精心选一选(本大题总共15小题,每题2分,共30分)1.大数据的特点不包括以下哪一项?A.大量化B.多样化C.低价值密度D.快速化2.以下哪种数据类型不属于结构化数据?A.数字B.日期C.图像D.布尔值3.在数据清洗中,处理缺失值的方法不包括?A.删除含有缺失值的记录B.用平均值填充C.用随机值填充D.忽略缺失值4.以下哪个算法常用于数据分类?A.聚类算法B.回归算法C.决策树算法D.关联规则算法5.大数据分析中,数据集成的目的是?A.减少数据量B.提高数据质量C.合并多个数据源的数据D.以上都是6.对于时间序列数据,常用的分析方法是?A.分类算法B.回归分析C.时间序列分析D.聚类分析7.以下哪种技术可用于数据降维?A.主成分分析B.支持向量机C.神经网络D.决策树8.数据挖掘中的频繁项集挖掘是为了发现?A.经常同时出现的项集B.最大的项集C.最小的项集D.随机的项集9.以下哪个不是大数据分析的应用领域?A.金融B.医疗C.教育D.传统制造业10.对于文本数据,常用的预处理步骤不包括?A.分词B.词性标注C.图像识别D.去停用词11.监督学习中的训练数据需要?A.有标签B.无标签C.部分有标签D.以上都可以12.以下哪种数据库适合存储大数据?A.关系型数据库B.非关系型数据库C.两者都适合D.两者都不适合13.数据可视化的主要目的是?A.使数据更美观B.便于理解和分析数据C.展示数据的准确性D.以上都不是14.大数据分析中的模型评估指标不包括?A.准确率B.召回率C.复杂度D.F1值15.以下哪个是大数据分析的常用工具?A.ExcelB.PythonC.WordD.Photoshop二、谨慎填一填(本大题总共5题,每题4分,共20分)1.大数据分析的基本流程包括数据采集、数据清洗、____、数据分析和数据可视化。2.数据挖掘的主要任务包括分类、聚类、关联规则挖掘、____等。3.常用的机器学习算法可分为监督学习、无监督学习和____。4.在数据预处理中,数据标准化的方法有____、Z-score标准化等。5.大数据分析中,数据安全的主要措施包括数据加密、____、访问控制等。三、准确判一判(本大题总共6题,每题4分,共24分)1.大数据就是海量的数据,没有其他特殊含义。()2.所有的数据都适合进行大数据分析。()3.数据挖掘算法只能处理数值型数据。()4.监督学习的目标是预测未知数据的标签。()5.数据可视化只是一种展示数据的方式,对数据分析没有实际作用。()6.大数据分析中的模型一旦建立就不需要再调整。()四、深度想一想(本大题总共2题,每题6分,共12分)1.请简述数据清洗的重要性以及常见的清洗方法。2.举例说明大

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论