Python基础与大数据应用(第2版)(微课版) 教案 单元 09 数据分析基础_第1页
Python基础与大数据应用(第2版)(微课版) 教案 单元 09 数据分析基础_第2页
Python基础与大数据应用(第2版)(微课版) 教案 单元 09 数据分析基础_第3页
Python基础与大数据应用(第2版)(微课版) 教案 单元 09 数据分析基础_第4页
Python基础与大数据应用(第2版)(微课版) 教案 单元 09 数据分析基础_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

单元09数据分析基础教案课程名称:Python基础与大数据应用课程类别:必修适用专业:大数据技术类相关专业总学时:64学时总学分:4.0学分本章学时:8学时一、材料清单《Python基础与大数据应用(第2版)(微课版)》教材numpy、pandas示例代码与课堂练习源码数据清洗、预处理、提取、筛选、汇总全套代码项目实战:水果数据分析完整程序二、教学目标与基本要求1.教学目标理解Python数据分析生态与常用扩展库;熟练掌握numpy多维数组创建、运算、索引与统计;掌握pandas核心数据结构Series与DataFrame;具备数据清洗、预处理、提取、筛选、分组汇总与统计分析能力;能独立完成完整数据分析项目,具备大数据基础分析思维。2.素质目标数据真实、客观、公正,培养实事求是、严谨治学的科学精神。强调数据分析要服务社会、服务决策,不造假、不误导,树立数据诚信。结合国家经济、民生、产业数据,增强国家认同、民族自豪感、社会责任感。3.基本要求了解numpy、pandas、matplotlib、scikit-learn等数据分析库用途。掌握numpyndarray数组创建、属性、索引、切片、运算与统计函数。理解numpy矩阵与数组的区别与运算规则。掌握pandasSeries、DataFrame创建与基本操作。熟练进行数据清洗:缺失值、重复值、空格、大小写、异常值处理。掌握数据合并、重塑、索引设置、排序、替换、分列。掌握loc/iloc数据提取、条件筛选、逻辑运算。掌握groupby分组汇总、数据透视表、描述统计、相关性分析。能完成完整实战项目:水果多维度数据分析。三、问题设计1.引导性提问Python常用数据分析库有哪些?numpy与pandas分工是什么?ndarray与列表相比有哪些优势?Series与DataFrame分别是什么结构?数据清洗主要处理哪些问题?pandas中loc与iloc区别是什么?groupby与pivot_table分别实现什么功能?2.探究性问题numpy数组运算为何比Python列表快?为什么要区分深复制与浅复制?处理缺失值时fillna与dropna如何选择?数据合并merge与concat区别与适用场景?相关性系数正负代表什么意义?3.拓展性问题如何处理超大型数据集避免内存溢出?如何批量处理多文件数据?如何将分析结果输出为Excel/CSV?企业真实数据分析流程是怎样的?四、主要知识点、重点与难点1.主要知识点数据分析扩展库:numpy、pandas、matplotlib、scikit-learnnumpy:ndarray属性、创建、索引、切片、运算、统计函数numpy矩阵matrix创建、运算、转置、求逆pandas:Series、DataFrame创建、属性、访问、增删改数据清洗:空值、重复值、空格、大小写、异常值、替换数据预处理:合并、索引、排序、分列、类型转换数据提取:loc、iloc、条件筛选数据筛选:与、或、非、query数据汇总:groupby、pivot_table数据统计:describe、std、cov、corr、采样综合实战:水果数据分析项目2.教学重点numpy数组创建、运算、索引切片pandasSeries、DataFrame操作数据清洗:缺失值、重复值、空格处理数据提取与条件筛选groupby分组统计与透视表3.教学难点numpy广播机制与矩阵运算pandas多级索引与数据对齐复杂条件筛选与数据规整分组聚合与多维度分析实战项目全流程设计五、教学过程设计(共8学时)第1–2学时:数据分析库+numpy基础数据分析生态与库介绍numpy安装与导入ndarray属性:size、dtype、ndim、shape、itemsize一维/多维数组创建:array、arange、reshape特殊数组:ones、zeros、empty、random、linspace第3–4学时:numpy运算、索引、矩阵数组索引与花式切片元素级运算、广播、数学函数统计函数:sum、mean、std、argmaxmatrix矩阵创建、运算、转置、求逆array与matrix区别第5–6学时:pandas基础+数据清洗Series创建、属性、操作DataFrame创建、查看、增删改列空值处理:isnull、fillna、dropna重复值处理:duplicated、drop_duplicates空格、大小写、数据类型、替换处理第7–8学时:数据预处理+提取筛选+汇总统计+实战数据合并:merge、concat索引设置、重命名、排序分列、条件填充、数据重塑loc/iloc提取、条件筛选、querygroupby分组、pivot_table透视表描述统计、相关性、采样项目实战:水果数据分析完整实现总结、作业、答疑六、教材与参考资料1.教材《Python基础与大数据应用(第2版)(微课版)》2.参考资料[1]丁辉,陈永.Python程序设计教程[M].北京:高等教育出版社.2019.[2]董付国.Python可以这样学[M].北京:清华大学出版社,2017.[3]林子雨,赵江声,陶继平.Python程序设计基础教程(微课版)[M].北京:人民邮电出版社,2022.七、教学反思与建议本单元实践性极强,代码量巨大,建议采用“演示—仿写—调试”模式。numpy偏数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论