Python与机器学习(第2版)(微课版) 课件 2-05-结构分析任务实施_第1页
Python与机器学习(第2版)(微课版) 课件 2-05-结构分析任务实施_第2页
Python与机器学习(第2版)(微课版) 课件 2-05-结构分析任务实施_第3页
Python与机器学习(第2版)(微课版) 课件 2-05-结构分析任务实施_第4页
Python与机器学习(第2版)(微课版) 课件 2-05-结构分析任务实施_第5页
已阅读5页,还剩7页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

课程负责人:陈清华结构分析任务实施【数据挖掘应用】课程碳排放数据分析知识与能力目标理解结构分析的用途会区分结构分析与分组分析、交叉分析的异同会使用Pandas对碳排放数据进行结构分析会使用饼图展现结构分析结果碳排放数据结构分析主要内容任务工单引导问题任务评价标准任务解决方案代码解析tpf.xlsx教学难点分行业对碳排放量进行结构分析:分析不同行业碳排放量占比分别多少,并找出占比较大的行业,并采用可视化图表展现;分时期对原煤碳排放占比进行结构分析,分析不同时期原煤碳排放占比变化情况。任务概述

任务描述:基于获得的数据,我们可结合使用sum()和div()函数求出不同行业的比重,并用饼图展现数据分析结果。010010011001101010100100110110100101110101000100001011011101001010101101010011010010numyearitemRawCoalCleanedCoal...Scope1Total11997Farming,Forestry,AnimalHusbandry,FisheryandWaterConservancy30.897729120.416359042

74.3789848421997CoalMiningandDressing32.958534775.252869261

44.3459333231997PetroleumandNaturalGasExtraction5.2746735910.000619491

36.9702250641997FerrousMetalsMiningandDressing0.8354291580.002890957

3.81144775537889教学难点任务工单数据源tpf.xlsx显示结果

任务要求任务概述分行业分时期(1)什么是结构分析?与分组分析和交叉分析有何不同?(2)常用的结构分析工具有哪些?Python中如何实现结构分析?(3)如何展现结构分析的结果?Matplotlib或Seaborn中如何绘制该类型的图?”

问题引导:任务概述

任务评价:任务概述评价内容评价要点分值分数评定自我评价1.任务实施分组基础上的结构分析5分能得出分行业的碳排放占比数据得2分,能用图表正确展现占比情况得2分,能适当减少饼图中的扇形数量得1分

分布基础上的结构分析4分能按年份对数据进行分段得2分,能按时期统计占比情况得1分,能用图表正确展现分析结果得1分

2.任务总结依据任务实施情况总结结论1分总结内容切中本任务的重点要点得1分

合计10分

第1行:按“行业”进行分组item_re=df_detail.groupby('item')['Scope1Total'].mean()item_re=item_re.div(item_re.sum())item_re=pd.DataFrame(item_re).reset_index()任务解决方案步骤一:编写如下代码实现按行业分析占比情况。item_re=item_re.sort_values(by=['Scope1Total'],ascending=False)部分数据显示Item_re.head()第4行:排序,占比高的在前第6行:画图plt.pie(item_re['Scope1Total'],labels=item_re['item'],autopct='%.2f%%')plt.show()任务解决方案步骤二:使用饼图展现占比分析结果第7行:显示前九个数据进行展示item_re=item_re.head(9)new_row={"item":"MyOther","Scope1Total":1-item_re['Scope1Total'].sum()}任务解决方案步骤三:改进饼图展现占比结果item_re=item_re.append(new_row,ignore_index=True)bins=[1995,2000,2005,2010,2015,2020]labels=['九五','十五','十一五','十二五','十三五']练一练df_detail_year['时期']=pd.cut(df_detail_year['year'],bins,labels=labels)year_re=df_detail_year.pivot_table(values=['RawCoal'],index=['时期'],aggfunc=[np.mean])按时期分析碳排放量占比:分析原煤碳排放量在各个时期的占比情况。由于数据缺失,我们采用平均值替换总和占比分析。(1)统计每个时期的原煤平均碳排放量year_re1=year_re.div(year_re.sum(axis=0),axis=1)year_re1.head()(2)统计每个时期的占比情况year_re.plot(kind='pie',y

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论