版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
项目一走进数据分析世界习题检测一、选择题 1、C2、B3、C4、C5、D6、D7、C8、B9、C10、C二、填空题 1、需求获取2、Numpy3、Anaconda4、实时代码5、markdown三、判断题 1、正确2、正确3、正确4、正确5、正确四、简答题(1)数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,在此基础上对数据加以研究及概括总结的过程。(2)数据分析是将抽象的数据和实际的业务相结合的过程,在实际的数据分析过程中需要了解业务情况,明晰行业知识,有目的地进行数据收集、整理、加工和分析工作,提炼出有价值的信息的一个过程。其整个流程包括需求获取、数据收集、数据预处理、数据分析、数据可视化。(3)Numpy、Pandas、Matplotlib、Scrapy等。五、操作题项目二碳排放数据统计分析2.2分析碳排放数据结构2.2.1Series一维数组1、A2、B3、错误2.2.2DataFrame二维数组1、B2、C3、正确2.3读写碳排放数据文件2.3.1读取CSV文件1、D2、D3、逗号2.3.2读取Excel文件1、B2、C3、io2.3.3数据文件写入1、A2、B3、io2.4操作碳排放数据内容2.4.1访问数据1、D2、C3、错误2.4.2修改数据1、错误2、正确2.4.3添加数据1、正确2.4.4删除数据1、02、正确3、drop()2.5索引与排序碳排放数据2.5.1单级索引1、C2、set_index()2.5.2多级索引1、C2、set_index()2.5.3数据排序1、B2、B2.6统计与描述碳排放数据2.6.1数值特征统计分析1、D2、C2.6.2类别特征描述分析1、ABCD2、count()习题检测一、选择题 1、B2、B3、C4、C5、C6、C7、C8、C9、A10、D二、填空题 1、DataFrame2、索引数据3、Series,DataFrame4、按值排序,按索引排序5、head(5),tail(5)三、判断题 1、错误2、正确3、错误4、正确5、错误四、简答题1.(1)使用[]下标访问数据;(2)使用loc和iloc访问数据;2.添加和修改数据的基本方式(1)df.loc[新列索引名]=new_value(2)df.loc[列索引名称或条件,列索引名称]=new_value五、程序分析题项目三乡村振兴数据预处理分析3.2合并乡村振兴数据3.2.1数据连接 1、B2、C3、错误3.2.2数据追加 1、错误2、verify_integrity3、错误3.2.3数据合并 1、A2、C3.3清洗乡村振兴数据3.3.1检测处理重复值 1、城市名称新增确诊新增死亡0南京1001杭州302广州1804南京70 2、错误3.3.2检测处理空值和缺失值 1、C2、A3.3.3检测处理异常值 1、正确2、正确3、D3.3.4检测处理数据类型1、错误2、错误3、to_numeric()3.4标准化乡村振兴数据3.4.1最小-最大值标准化 1、错误2、正确3、正确3.4.2零-均值标准化 1、0,12、正确3、正确3.4.3小数定标标准化 1、B2、C3、错误3.5转换乡村振兴数据3.5.1重命名轴索引 1、正确2、键值对3.5.2离散化连续数据 1、cut(),qcut()2、正确3、正确习题检测一、选择题 1、A2、D3、B4、B5、C6、A7、A8、D9、B10、A二、填空题 1、concat()2、append()3、检测与处理异常值4、小数定标标准化5、字符串三、判断题 1、正确2、正确3、正确4、错误5、错误四、简答题1.简述数据预处理的常用方法合并数据、清洗数据、标准化数据、转换数据简述数据清洗的常用方法Pandas中常见的数据清洗操作有检测处理重复值、检测处理缺失值与空值、检测处理异常值三种方式.简述数据标准化的常用方法。最大最小值标准化、小数定标标准化、零-均值标准化五、数据分析题项目四运动员数据透视分析4.2分组运动员数据4.2.1单列数据分组 1、错误2、正确3、A4.2.2多列数据分组 1、C2、错误4.3聚合运动员数据4.3.1agg聚合数据 1、正确2、A4.3.2apply聚合数据 1、正确2、agg()支持对分组后的数据应用某函数,可以直接作用于DataFrame对象;apply函数类似于agg()函数,能够将函数应用于每一列。不同之处在于与agg()相比,apply()函数传入的函数只能作用于整个DataFrame或Series,在对分组后的数据进行聚合操作时,不能对不同的字段应用不同的函数来获取不同的结果4.3.3transform聚合数据 1、错误2、错误4.4透视运动员数据4.4.1pivot_table透视数据 1、A2、C4.4.2crosstab透视数据 1、正确2、正确习题检测一、选择题 1、C2、B3、A4、A5、A6、C7、A8、A9、D10、C二、填空题 1、分组,应用,合并2、agg3、形状5、DataFrameGroupBy5、crosstab()三、判断题 1、正确2、错误3、正确4、错误5、错误四、简答题
1.简述分组与聚合的过程Pandas中,分组是指使用特定的条件将原始数划分为多个组;聚合指对每个分组中的数据执行某些操作,最后将计算结果进行整合。分组与聚合的过程大概分可以分为三步,具体如下:(1)拆分(split):将数据集按照一些条件拆分为若干分组,需要注意的是拆分是在特定的轴上进行的,既可以对横轴方向的数据进行分组,也可以对纵轴上的数据进行分组。(2)应用(apply):将某个函数或方法应用到每个分组。(3)合并(combine):将产生的新值整合到结果对象中。2.简述数据分组的方式有哪些(1)agg分组;(2)apply分组;(3)transform分组3.简述透视表与交叉表的异同点透视表(pivottable)是各种电子表格程序和其他数据分析软件中一种常见的数据汇总工具,它根据一个或多个键对数据进行聚合,并根据行和列上的分组键将数据分配到各个矩形区域中;crosstab()生成一类特殊的透视表,将两个或多个列中的不重复的元素组成一个新的DataFrame;五、数据分析题项目五经济运行数据可视化分析5.2经济数据绘制与参数设置5.2.1绘图流程 1、B2、C3、正确5.2.2中文设置 1、错误2、B5.2.3创建子图 1、C2、subplots5.3经济数据特征间分布分析5.3.1绘制折线图 1、B2、linestyle,color5.3.2绘制散点图 1、C2、scatter,plot3、错误5.4经济数据特征内分布分析5.4.1绘制柱状图 1、A2、C3、正确5.4.2绘制饼图 1、C2、A3、pie5.4.3绘制箱线图 1、A2、B3、boxplot习题检测一、选择题 1、A2、B3、D4、C5、C6、B7、B8、D9、A10、D二、填空题 1、折线图,饼图,散点图2、pyplot3、bar4、分类,数据5、color三、判断题 1、正确2、正确3、错误4、正确5、错误四、简答题1.简述Matplotlib绘图流程(1)使用figure()函数创建画布;(2)添加画布内容;(3)显示或保存图形2.使用Matplotlib绘制子图有哪几种方式(1)通过subplot()函数创建子图;(2)通过subplots()函数创建子图五、编程题项目六金融数据时序分析6.2创建金融时序类型6.2.1创建时间戳对象 1、format2、C6.2.2创建时期对象 1、错误2、12*Month6.2.3创建时差对象 1、B2、错误6.3使用金融时序数据6.3.1创建时间序列 1、没有end参数2、A6.3.2时间序列偏移 1、D2、正确6.3.3时间序列移动 1、错误2、错误6.4采样金融时序数据6.4.1数据重采样 1、正确2、C6.4.2数据随机采样 1、B2、正确6.4.3数据频率转换 1、ffill,bfill2、D6.5金融数据窗口计算6.5.1移动窗口计算1、正确2、正确3、B6.5.2扩展窗口计算 1、正确2、正确3、A习题检测一、选择题 1、A2、B3、C4、D5、B6、D7、D8、C9、D10、A二、填空题 1、时间2、Timedelta3、基础频率4、asfreq5、Period三、判断题 1、正确2、正确3、错误4、错误5、正确四、简答题1.时间数据类型有哪几种,各有什么特性?在Pandas库中根据实际应用的时间序列的特点,将时序数据分为四种类型:(1)时间戳(Timestamp):表示具体的某个时间点,如2024年11月22日10点30分20秒。(2)时间差(Timedelta):两个
Timestamp做差就得到了时间差,可以不同的单位来表示。例如:日,小时,分钟,秒。
它们可以是正值,也可以
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026七年级道德与法治上册 学习中的苦与乐
- 健康宣教课程内容
- 消防安全投入与收益分析
- 健康预防指南
- 2024-2025学年高考联考语文试题
- 1+X集成电路理论试题(含答案)
- 2023年健康管理师之健康管理师三级综合检测试卷A卷含答案
- 2024保密观知识竞赛题库及答案(易错题)
- 2023届高考语文各省模拟试题卷(全国卷)
- 2023年会计从业资格考试会计电算化基础
- 山东省2025年春季高考技能测试医学技术类专业试题及答案
- GB/T 16267-2025包装材料试验方法气相缓蚀能力
- 中科大知识产权管理办法
- 2025北京海淀高二下学期期末语文试卷含答案
- 二类医疗器械管理制度
- 物料安全库存管理制度
- 2022《农产品质量安全法》全文解读与学习
- 《清洁剂清洁原理》课件
- 大宗商品交易居间服务协议
- 海洋灾害风险评估和区划技术导则第5部分:海平面上升 报批稿
- 2025-2030中国旅游保险行业发展分析及发展前景与趋势预测研究报告
评论
0/150
提交评论