数据分析与可视化 第4套_第1页
数据分析与可视化 第4套_第2页
数据分析与可视化 第4套_第3页
数据分析与可视化 第4套_第4页
数据分析与可视化 第4套_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

厦门电子职业中专学校期末考试试卷(2024~2025学年度第二学期23高数据可视化)第14页共15页级班号姓名成绩出卷日期:年月日考试日期:年月日下午出卷人:考试时间:分钟选择题(每题2分,共30分)1、数据可视化是将数据转换为哪种形式的过程?()A.文本 B.图形或视觉表现形式C.音频 D.视频2、以下哪个不是数据可视化的主要意义?()A.增强理解 B.揭示趋势C.简化数据复杂性 D.促进决策3、Tableau是一款什么类型的工具?()A.文本编辑器 B.可视化商业智能工具C.数据库管理系统 D.编程语言4、在数据清洗过程中,处理缺失值常用的方法不包括以下哪项?()A.删除缺失值 B.使用均值填充C.使用模型预测填充 D.保留缺失值不做处理5、描述性统计分析中,极差表示的是?()A.数据集中最大值与最小值的差B.数据集的平均数C.数据集的中位数D.数据集的众数6、哪种图表最适合展示不同分类变量下的数据大小比较?()A.折线图 B.柱状图 C.散点图 D.饼图7、在Python中,哪个库常用于处理时间序列数据?()A.Pandas B.NumPy C.Matplotlib D.Seaborn8、RFM模型中,R代表什么?()A.最近一次消费时间 B.消费频率C.消费金额 D.客户年龄9、在数据可视化中,哪种图表用于展示数据的构成比例?()A.直方图 B.饼图 C.散点图 D.折线图10、PowerBI是哪个公司开发的商业智能工具?()A.Google B.Microsoft C.Apple D.IBM11、在进行数据分析时,EDA代表什么?()A.探索性数据分析 B.描述性数据分析C.实验性数据分析 D.预测性数据分析12、使用pandas库读取Excel文件时,默认使用哪个库来读取xls文件?A.Openpyxl B.xlrd C.NumPy D.Matplotlib13、在SQL中,哪种数据类型常用于存储日期和时间信息?()A.INT B.DATE C.VARCHAR D.BLOB14、以下哪种方法不是处理异常值的方法?()A.删除异常值B.替换异常值为平均值C.保留异常值D.将异常值转换为NaN15、在进行多表数据连接时,哪种连接会返回左表(第一个表)的所有记录以及右表(第二个表)与之匹配的记录?()A.内连接 B.左连接 C.右连接 D.全外连接多选题(每题2分,共10分)1、数据可视化的主要作用包括哪些?()A.增强理解 B.揭示趋势C.促进决策 D.隐藏数据细节2、常见的可视化工具包括哪些?()A.Tableau B.PowerBIC.Excel D.Python的Matplotlib和Seaborn3、描述性统计分析中常用的统计量有哪些?()A.算术平均数 B.中位数C.众数 D.极差4、RFM客户细分模型中,三个核心指标是什么?()A.最近一次消费时间(Recency)B.消费频率(Frequency)C.消费金额(Monetary)D.客户年龄5、数据清洗中处理缺失值的方法有哪些?()A.删除缺失值所在的记录B.使用均值、中位数或众数填充C.使用模型预测填充D.忽略缺失值不做处理判断题(每题2分,共10分)1、数据可视化只适用于专业人员,非专业人士难以理解。()2、在Pandas中,dropna()函数用于删除包含缺失值的行或列。()3、箱线图特别适合于发现数据中的异常值。()4、RFM模型中,重要价值客户在三个维度(Recency,Frequency,Monetary)上的表现都很低。()5、在进行数据可视化时,不需要考虑观众的背景和需求。()填空题(每空1分,共10分)1、数据可视化是将数据转换为_________或___________的过程。2、在数据清洗中,________、_________和_________是常见的数据质量问题。3、描述性统计分析中,_________表示数据集中最大值与最小值的差。RFM模型中,M代表_____________。在Python中,用于绘制图表的常用库包____________和___________。Pandas库中的________函数用于数据表的合并操作。简答题(每题5分,共10分)简述数据可视化的意义。2、解释RFM客户细分模型,并说明其三个核心指标的含义。编程题(每题10分,共30分)1、案例试题-欧洲城市人口普查分析(共9小题,总分30分)1)导入数据集,探查数据,使用head函数显示数据前8行(2分)2)使用合适的函数确认数据集中是否有缺失情况,如果存在,处理缺失值。(3分)3)使用合适的函数确认数据集中是否有重复值情况,如果存在,处理重复值。(3分)4)数据集字段重命名(2分)要求:按以下映射关系对字段进行重命名:修改前字段名称修改后字段名称Rank排名City城市State州Population人口Dateofcensus/estimate调查日期5)找出“城市”字段中的问题,描述具体问题(2分)6)找出“人口”字段中的问题,描述具体问题(2分)7)将“调查日期”字段中的数据格式改为datatime类型(2分)8)统计各国的城市数量,降序展示结果,只显示前5个结果(2分)9)使用合适的图形展示上题的分析结果(12分)图形要求为:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论