《Python数据可视化》模拟考试题1_第1页
《Python数据可视化》模拟考试题1_第2页
《Python数据可视化》模拟考试题1_第3页
《Python数据可视化》模拟考试题1_第4页
《Python数据可视化》模拟考试题1_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《Python数据可视化》模拟考试卷(中文)总分:100分考试时间:120分钟闭卷范围提示:数据可视化概述、Matplotlib/Seaborn等库、数据读取与处理、时间/关系/比例/文本/复杂数据可视化。说明:单选/判断/填空请将答案写在题目后;简答与应用题可使用要点或画简图。答案统一放在文末。一、单项选择题(20题×2分=40分)每题只有一个正确答案。1.数据可视化的主要目标是:A.仅使图形更美观B.通过图形表达帮助理解数据规律与信息C.将数据全部加密D.将数据转换为语音2.常见的数据可视化流程一般不包括:A.数据获取B.数据清洗与处理C.可视化编码与呈现D.删除原始数据以节省空间3.以下哪一项更符合“可视化设计原则”中的一致性要求?A.同一类别在不同图中使用不同颜色且无说明B.同一变量在不同图中使用相同单位与编码方式C.每张图都用不同坐标轴尺度D.图例随机放置4.Matplotlib中最常用来绘制折线图的函数是:A.plt.bar()B.plt.plot()C.plt.scatter()D.plt.pie()5.Seaborn相比Matplotlib的常见特点是:A.不支持统计图形B.默认主题更美观且更偏向统计可视化C.不能与Pandas配合D.只能绘制3D图6.以下哪种图形最适合展示两个连续变量之间的相关关系?A.饼图B.散点图C.词云D.旭日图7.当需要同时展示“分布形态+离群点”时,通常优先选择:A.箱线图(Boxplot)B.折线图C.面积图D.雷达图8.直方图主要用于展示:A.类别占比B.连续变量的频数/频率分布C.网络关系结构D.时间序列趋势9.热图(Heatmap)常用于:A.展示矩阵/相关系数或时空密度变化B.绘制3D曲面C.生成词云D.替代数据库查询10.南丁格尔玫瑰图更适合表现:A.时间序列连续变化B.类别数据在不同扇区的对比(极坐标)C.三维空间曲面D.词语共现关系11.堆叠柱形图主要用于:A.展示每个类别的组成结构及总量对比B.展示单变量分布C.展示网络拓扑D.展示3D点云12.散点图矩阵了解变量两两关系的常见函数/思想是:A.pairplot(或类似矩阵布局)B.pie()C.wordcloud()D.treemap()13.读取CSV文件到Pandas的常用函数是:A.pd.read_csv()B.pd.to_csv()C.np.loadtxt()D.plt.imread()14.对缺失值进行处理时,下列哪项不是常见策略?A.删除缺失记录B.用统计量填补C.标记缺失并建模D.将所有缺失值替换为随机噪声且不说明15.NumPy的核心数据结构通常是:A.字典B.列表C.ndarray(多维数组)D.集合16.下列哪种图形最适合展示“部分与整体”的占比关系?A.饼图/环形图B.散点图C.直方图D.茎叶图17.矩形树图(Treemap)最适合展示:A.逐日温度变化B.层级结构下各部分大小占比C.两变量相关性D.文本主题演变18.词云(Wordcloud)通常用于:A.展示词频或关键词权重的直观分布B.精确展示时间序列C.展示网络路由D.展示三维地形19.在网络关系可视化中,NetworkX常用于:A.仅绘制柱状图B.构建与分析图(节点-边)结构并进行可视化C.仅做图像识别D.仅做数据库备份20.当需要制作可交互的数据大屏或交互图表时,较常用的Python库是:A.Pyecharts/Plotly/HoloViews(任一)B.sqlite3C.pickleD.random二、判断题(10题×1分=10分)正确填“√”,错误填“×”。1.数据可视化能帮助发现趋势、异常与关联,但并不能替代对数据的正确理解与统计分析。()2.折线图适合展示时间序列或连续变化趋势。()3.饼图在类别很多且数值相近时仍然是最佳选择。()4.箱线图可以反映中位数、四分位距以及离群点等信息。()5.Seaborn可以在底层调用Matplotlib来绘制图形。()6.热图无法用于展示相关系数矩阵。()7.在绘图前进行数据清洗(缺失、异常、格式统一)通常有助于提升可视化质量。()8.Wordcloud适合用于表达词频概览,但不适合用于精确数值比较。()9.NetworkX只能绘制无向图,不能绘制有向图。()10.交互式图表常见优势之一是支持缩放、悬浮提示与筛选等操作。()三、填空题(10空×1分=10分)1.Matplotlib中常用的绘图状态接口模块是________。2.用于读取CSV文件到DataFrame的函数是pd.________。3.展示两个连续变量关系的典型图形是________图。4.能够同时反映分布形态与离群点的图形是________图。5.直方图通常将数据划分为多个________(bin)并统计频数。6.热图常通过颜色深浅表示数值大小,常用函数之一是seaborn.________。7.用于生成标签云的Python库常见名称为________。8.在关系网络可视化中,节点之间的连接关系通常用________表示。9.“Schema-on-read”更常见于________(数据湖/数据仓库)场景。10.制作交互式可视化大屏时常用库之一是________(写出一个即可)。四、简答题(4题×5分=20分)1.简述数据可视化的一般流程,并说明每一步的目标(至少写出4步)。(作答区)【评分要点提示】要点:数据获取→清洗处理→选择图形/编码→布局与标注→解释与迭代。2.比较Matplotlib与Seaborn的定位与优缺点(至少写出3点)。(作答区)【评分要点提示】要点:底层与生态、默认美观与统计图、灵活性、学习成本、与Pandas配合等。3.结合时间数据可视化,说明折线图、阶梯图、热图各自适用的场景(各写1个)。(作答区)【评分要点提示】要点:趋势、离散变化、时段密度/周期性等。4.什么是可视化中的“误导风险”?请列举两种常见误导方式并给出规避建议。(作答区)【评分要点提示】要点:坐标轴截断、比例尺不一致、颜色编码不当、样本偏差;建议:标注清晰、统一尺度、给出来源与范围等。五、应用题(2题×10分=20分)1.给定某电商平台30天的订单数据(字段:date、order_cnt、pay_amt、channel、province)。

任务:①选择合适图形展示订单量与支付金额的时间趋势;②比较不同渠道的贡献占比;③找出订单量异常的日期并说明可能原因;④给出可视化结果需要注意的标注与说明。

请给出你的可视化方案(图形选择+理由+关键步骤)。(作答区,可附简要草图)【评分要点提示】要点:折线/双轴或分面;堆叠柱/环形/矩形树图;异常检测(z-score/箱线/阈值)+注释;标题/单位/数据来源/缺失处理说明。2.你需要对某城市12个月的空气质量数据做分析(字段:month、PM2.5、PM10、NO2、SO2、O3)。

任务:①展示各指标随月份变化趋势;②展示指标之间相关性;③选择一种“分布性”图形展示PM2.5的分布与离群点;④如果要做交互式展示(缩放/提示/筛选),推荐工具/库并说明原因。

请给出方案与关键实现思路。(作答区,可附简要草图)【评分要点提示】要点:多折线/小多图;相关矩阵热图/散点矩阵;箱线图/密度图;Plotly/Pyecharts/HoloViews;交互优势与部署方式。

参考答案(放在最后)一、单项选择题1.B2.D3.B4.B5.B6.B7.A8.B9.A10.B11.A12.A13.A14.D15.C16.A17.B18.A19.B20.A二、判断题1.√2.√3.×4.√5.√6.×7.√8.√9.×10.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论