《Pandas数据处理》教案 项目二 清洗数据_第1页
《Pandas数据处理》教案 项目二 清洗数据_第2页
《Pandas数据处理》教案 项目二 清洗数据_第3页
《Pandas数据处理》教案 项目二 清洗数据_第4页
《Pandas数据处理》教案 项目二 清洗数据_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《pandas程序设计》教案课题处理订单数据中的缺失值课时1课型新课教学目标能读取外部文件的内容能统计缺失值数量能将缺失值替换为指定数据教学重点及突破方法能统计缺失值数量并将缺失值替换为指定数据(微视频引领、学生操作尝试)教学难点及化解方法能将缺失值替换为指定数据(微视频引领、学生操作尝试)教学方法讲授法、演示法、操作法教学资源微视频、PPT教学过程教学环节(时长)教学内容教师活动学生活动设计意图创设情景5在统计数据的时候,有时会有一些缺失的数据,缺失会造成数据的不完整我们需要对这些缺失值的数值进行处理。下面我们就通过具体的案例来演示如何处理数据中的缺失值。创设情景,引导学生分析数据中缺失值对数据分析的影响思考订单数据中缺失值对数据分析的影响,是怎样处理创建情景,调动学生学习的积极性明确任务处理订单数据中的缺失值展示任务明确任务任务驱动实施任务读取数据5如何读取外部文件?order_data=pd.read_csv(r"D:\pydata\项目二\订单数据表.csv",encoding='utf-8')=1\*GB3①①使用pandas提供的read_csv()方法读取外部csv文件中的数据,并将数据保存到变量order_data。1.讲解读取外部csv文件的代码2.布置任务,让学生读取外部的csv文件1.聆听教师的讲解2.自行进行数据的读取教师以问题引导学生主动思考,体现学生在课堂上的主体地位实施任务查找重复数据行15cnum=order_data.query('choice_description.isnull()',engine='python').shape[0]=2\*GB3②②用isnull()方法找出【choice_description】中含有空值(NaN)的数据行,并统计出为空值(NaN)的行数。1.讲解统计缺失值数量的步骤2.拆分讲解代码的功能与含义3.布置任务,让学生统计缺失数据行1.聆听教师的讲解2.理解代码含义3.自行统计缺失数据的数量掌握统计缺失数据的操作流程实施任务缺失值替换15order_data.fillna({'choice_description':'banana'},inplace=True)=3\*GB3③=3\*GB3③使用fillna()将空值填充为指定数据“banana”1.讲解缺失值替换为指定数据的方法2.布置任务,让学生在数据表中进行数据替换1.聆听教师的讲解。2.完成任务,将数据表中缺失值替换为“banana”让学生在完成任务的过程中发现问题并想办法解决问题分享评价展示学生作品组织学生评价操作过程学生展示分享提高回顾总结31.统计缺失值数量的方法2.将缺失值替换为指定数据的步骤引导学生回顾教学内容说出统计缺失值数量的方法及将缺失值替换为指定数据的步骤温故而知新拓展提升2请用fillna()方法替换数据表中的缺失值。要求用该缺失值的下面一个非缺失值填充。布置拓展任务及强调任务要求完成缺失值的处理引导学生自己尝试操作教学反思《pandas程序设计》教案课题处理乐高天猫店销售数据中的重复值课时1课型新课教学目标能检测数据是否与前面的数据重复能将数据框中所有的重复数据删除教学重点及突破方法能将数据框中所有的重复数据删除(微视频引领、学生操作尝试)教学难点及化解方法能将数据框中所有的重复数据删除(微视频引领、学生操作尝试)教学方法讲授法、演示法、操作法教学资源微视频、PPT教学过程教学环节(时长)教学内容教师活动学生活动设计意图创设情景5在统计数据的时候,有时会有一些重复的数据,重复的数据会浪费空间且导致数据准确性下降。我们需要对这些重复的数值进行处理。下面我们就通过具体的案例来演示如何处理数据中的重复数值。创设情景,引导学生分析如何查找网店销售数据表中的重复信息,又该怎样处理?思考如何查找重复值,在pandas中又该怎样删除这些重复数据呢。创建情景,调动学生学习的积极性明确任务删除乐高天猫店销售数据中的重复值展示任务明确任务任务驱动实施任务读取数据5如何读取外部文件?data=pd.read_csv(r"D:\pydata\项目二\乐高天猫店销售数据.csv",sep=",",encoding='gb2312')=1\*GB3①①使用pandas提供的read_csv()函数从指定文件夹中读取扩展名为csv的数据文件,其中sep=”,”表示指定分隔符是逗号;encoding设置编码为gb2312。读取的结果保存到变量data。此时,打印data,数据行列数为393rows×5columns(393行×5列)1.讲解读取外部csv文件的代码2.布置任务,让学生读取外部的csv文件,并观察此时数据行列的数量1.聆听教师的讲解2.自行进行数据的读取,并记录读取的数据的行列数教师以问题引导学生主动思考,体现学生在课堂上的主体地位实施任务统计查找重复数据15print(data[data.duplicated()])=2\*GB3②②输出重复的行。data.duplicated()会对数据框的行从上往下依次扫描,如果某行与前面的行相同,则该行标示为True,反之标示为False,最后返回由这些逻辑值组成的序列。data[data.duplicated()]用data.duplicated()返回的逻辑值序列从data中选择数据行,若某行的值为True则该行会被选出。注意重复出现的多行中,不包括这行的第一次出现1.讲解查找重复数据的步骤2.拆分讲解代码的功能与含义3.布置任务,让学生查找重复数据行1.聆听教师的讲解2.理解代码含义3.自行查找重复数据行掌握查找重复数据的操作流程实施任务删除重复数据15data.drop_duplicates(keep="first",inplace=True)=3\*GB3③=3\*GB3③使用drop_duplicates()方法删除数据表中的重复数据。Keep参数用于指定删除的条件,这里“first”表示保留第一次出现的重复项,删除后面的重复项。inplace=True表示对原数据进行修改。再次打印data,结删除重复值后,行数减少18,行列数变为:375rows×5columns(374行×5列)1.讲解删除重复数据的方法2.布置任务,让学生将数据表中重复数据删除3.引导学生观察此时数据行列的变化1.聆听教师的讲解。2.完成任务,将将数据表中重复数据删除3.对比操作前的数据表,行列数的变化让学生在完成任务的过程中发现问题并想办法解决问题分享评价展示学生作品组织学生评价操作过程学生展示分享提高回顾总结31.查找重复数据的过方法2.删除重复数据的步骤引导学生回顾教学内容说出查找重复数据的过方法及删除重复数据的步骤温故而知新拓展提升2请按【一展身手】的要求自己创建数据表,使用drop_duplicates()方法,按要求删除表中的重复值布置拓展任务及强调任务要求完成练习引导学生自己尝试操作教学反思《pandas程序设计》教案课题规范化学生考试成绩课时1课型新课教学目标能按要求进行数据替换能按要求将原始成绩转换为其他分制的成绩教学重点及突破方法能将原始成绩转换为其他分制的成绩(微视频引领、学生操作尝试)教学难点及化解方法能将原始成绩转换为其他分制的成绩(微视频引领、学生操作尝试)教学方法讲授法、演示法、操作法教学资源微视频、PPT教学过程教学环节(时长)教学内容教师活动学生活动设计意图创设情景5现有某学期19级秋高计1班C语言成绩表,要求将学生成绩表规范化处理,将显示为“缺考”的成绩改为“0”;并将所有成绩转化为百分制。创设情景,引导学生分析学生成绩表中有哪些信息,又该怎样进行数制转换?观察学生成绩表中信息,思考老师提出的问题。创建情景,调动学生学习的积极性明确任务规范化学生考试成绩展示任务明确任务任务驱动实施任务读取外部excel文件5data=pd.read_excel(r"D:\pydata\项目二\19秋高计1班C语言平时成绩技能成绩.xlsx")=1\*GB3①

①使用pandas中的read_excel()函数从指定文件夹中读取扩展名为xlsx的文件,读取的文件名是包括路径和文件名的完整文件名称。读取的结果保存到变量data。1.讲解读取外部excel文件的方法2.布置任务,让学生读取文件1.聆听教师的讲解2.自行读取外部excel文件教师以问题引导学生主动思考,体现学生在课堂上的主体地位实施任务数据替换15data.replace("缺考",0,inplace=True)=2\*GB3②

=2\*GB3②使用replace()函数将表中“缺考”替换为0;inplace=True,直接在原数据上进行修改。1.讲解数据替换的步骤2.讲解replace中参数的含义3.布置任务,让学生练习1.聆听教师的讲解2.理解数据替换的方法及replace中参数的含义3.自行创建数据表.掌握数据替换的操作流程实施任务数制转换15data["3月"]=round(data["3月"]/60*100,2)=3\*GB3③

data["5月技能成绩"]=round(data["5月技能成绩"]/60*100,2)④

data["期末技能"]=round(data["期末技能"]/60*100,2)=5\*GB3⑤

=3\*GB3③表达式“data["3月"]/60*10”将60分制成绩转换为百分制成绩,再使用Python内置函数round()将所有数值四舍五入保留2位小数,最后再将结果保存到data["3月"]这一列。=4\*GB3④=5\*GB3⑤与=3\*GB3③方法一样。将成绩转化为百分制,四舍五入保留两位小数。1.讲解用数学公式转换数据的方法2.布置任务,让学生在按要求进行数制转换1.聆听教师的讲解。2.完成任务,将数据转换为百分制。让学生在完成任务的过程中发现问题并想办法解决问题分享评价展示学生作品组织学生评价操作过程学生展示分享提高回顾总结31.数据替换的方法2.将六十分制转换为百分制成绩的步骤引导学生回顾教学内容说出用数学公式将成绩转换为百分制方法温故而知新拓展提升2仍然对C语言成绩表进行操作,要求对缺考成绩进行替换,替换方式为用成绩表中“缺考”的前一个值替换,将成绩转换为120分制布置拓展任务及强调任务要求完成数据的规范处理引导学生自己尝试操作教学反思《python程序设计》教案课题为优秀学生评奖课时1课型新课教学目标能使用loc属性切片选取相关的数据列求和能使用cut()把数据进行离散化处理并设置等级教学重点及突破方法能使用loc属性切片选取相关的数据列求和能使用cut()把数据进行离散化处理并设置等级(微视频引领、学生操作尝试)教学难点及化解方法能使用loc属性切片选取相关的数据列求和(微视频引领、学生操作尝试)教学方法讲授法、演示法、操作法教学资源微视频、PPT教学过程教学环节(时长)教学内容教师活动学生活动设计意图创设情景5学校将2018级高职班各专业学生某次联考成绩进行了整理汇总,形成“高职班学生成绩”工作薄。工作簿中包含三个工作表:“划线标准”、“培优名单”、“全部学生名单”。现要求根据“联考文化总分”和“联考专业总分”的总成绩对高职班全部学生进行评奖,即将分数转换成等级奖。创设情景,引导学生分析学生联考成绩表中信息,又该怎样对不连续列进行求和?观察成绩表,思考老师提出的问题。创建情景,调动学生学习的积极性明确任务为优秀学生评奖展示任务明确任务任务驱动实施任务读取数据5data=pd.read_excel(r"D:\pydata\项目二\高职班学生成绩.xlsx",sheet_name="全部学生名单")=1\*GB3①①读取“高职班学生成绩.xlsx”工作簿中的"全部学生名单"工作表。参数sheet_name指定工作簿中要读取的工作表名称。1.讲解读取数据的代码2.布置任务,让学生读取外部数据表1.聆听教师的讲解2.自行读取数据表教师以问题引导学生主动思考,体现学生在课堂上的主体地位实施任务选取数据列求和15data["联考总分"]=data.loc[:,["联考专业总分","联考文化总分"]].apply(np.sum,axis=1)=2\*GB3②=2\*GB3②loc[:,["联考专业总分","联考文化总分"]]选取"联考专业总分"和"联考文化总分"列所有行的数据;其中“:”代表所有行。apply(np.sum,axis=1)对选出来的列执行np.sum求和。1.讲解loc函数的切片步骤2.讲解将切片数据列求和的方法3.布置任务,让学生自己操作1.聆听教师的讲解2.理解操作方法和步骤3.用loc切片进行指定数据列求和掌握选取数据列求和的操作流程实施任务数据进行离散化处理并设置等级15data["等级奖"]=pd.cut(data["联考总分"],bins=3,labels=["三等","二等","一等"])=3\*GB3③=3\*GB3③语句pd.cut(data["联考总分"],bins=3,labels=["三等","二等","一等"])把data[“联考总分”]数据分割成3个不同的分数段并打上等级标签,其中bins用来指定分割的区间个数,labels用于指定对应区间的等级。默认情况下,cut()函数会将第一个位置参数的值区间划分成bins个宽度尽量相同的连续子区间,再按区间为每个值打上参数labels指定的,所以bins必须等于列表labels的长度。1.讲解使用cut进行数据离散化处理并设置等级的方法2.布置任务,让学生进行操作1.聆听教师的讲解。2.完成任务,将成绩转化为等级奖让学生在完成任务的过程中发现问题并想办法解决问题分享评价展示学生作品组织学生评价操作过程学生展示分享提高回顾总结31.选取指定列进行求和2.对数据进行离散化处理并设置等级引导学生回顾教学内容说出选取指定列进行求和的过程及对数据进行离散化处理并设置等级的步骤温故而知新拓展提升2完成【一展身手】的任务布置拓展任务及强调任务要求完成练习引导学生自己尝试操作教学反思《pandas程序设计》教案课题规范化成绩表标题课时1课型新课教学目标能使用columns赋值可以修改列标题能按要求调整列顺序教学重点及突破方法能使用columns赋值可以修改列标题能按要求调整列顺序(微视频引领、学生操作尝试)教学难点及化解方法能按要求调整列顺序(微视频引领、学生操作尝试)教学方法讲授法、演示法、操作法教学资源微视频、PPT教学过程教学环节(时长)教学内容教师活动学生活动设计意图创设情景5学校对各专业培优班学生某学年联考成绩进行了汇总。由于统计人员不认真,将成绩表列标题用拼音缩写表示,不利于后期进行查阅和分析,现要求规范化成绩表列标题,将列标题修改为中文。并调整列顺序,将第一列(“专业类”列)移动到第五列(“文化平均”列)后面创设情景,引导学生观察成绩表列标题信息,该怎样对列标题进行规范呢?观察成绩表,思考老师提出的问题。创建情景,调动学生学习的积极性明确任务规范化成绩表标题展示任务明确任务任务驱动实施任务读取数据5data=pd.read_excel(r"D:\pydata\项目二\培优班学生成绩表.xlsx")=1\*GB3①=1\*GB3①使用read_excel()读取数据保存到变量data。1.讲解读取数据的代码2.布置任务,让学生读取外部数据表1.聆听教师的讲解2.自行读取数据表教师以问题引导学生主动思考,体现学生在课堂上的主体地位实施任务修改列标题10data.columns=["专业类","姓名","文化1","文化2","文化平均","专业1","专业2","专业平均","班级"]=2\*GB3②=2\*GB3②通过对data.columns属性赋值修改索引标签即列标题。1.讲解data.columns属性赋值的方法2.布置任务,让学生自己操作1.聆听教师的讲解,理解操作方法和步骤2.用属性赋值修改索引标签掌握修改列标题的操作流程实施任务提取列数据10major=data['专业类']=3\*GB3③=3\*GB3③data['专业类'],使用列索引获取“专业类”列所有数据,并将结果保存到变量major中。major序列的值如下所示。0电子技术类1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论