《Pandas数据处理》课件 8.1.1 统计平均录取分数最高的前10所学校_第1页
《Pandas数据处理》课件 8.1.1 统计平均录取分数最高的前10所学校_第2页
《Pandas数据处理》课件 8.1.1 统计平均录取分数最高的前10所学校_第3页
《Pandas数据处理》课件 8.1.1 统计平均录取分数最高的前10所学校_第4页
《Pandas数据处理》课件 8.1.1 统计平均录取分数最高的前10所学校_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计平均录取分数最高的前10所学校主讲人:xx重庆市九龙坡职业教育中心问题描述利用2007年-2017年全国部分高校的录取数据(“school.csv”),统计表中各学校各年所有地区所有专业的录取平均分数,同时计算出各校11年的平均录取分数(即“历年平均“),对“历年平均“按降序排序,输出“历年平均“排名前10名高校的2016年和2017年录取分数,并使用柱状图对数据进行可视化,见表8.1.2和图8.1.1。问题描述表8.1.2排名前10名高校的2016年和2017年录取分数题前思考表8.1.2问题分析根据问题描述,填写以下表格importpandasaspdimportmatplotlib.pyplotasmp①mp.rcParams['font.sans-serif']=['SimHei']②data=pd.read_csv(r"D:\pydata\项目八\school.csv",engine='python')③school_score=pd.pivot_table(data=data,index='学校',columns='年份',values='平均分',aggfunc='mean',margins=True,margins_name='历年平均')④school_score_sort=school_score[:-1].sort_values(by='历年平均',ascending=False)[:10]⑤school_score_sort_2year=school_score_sort[[2016,2017]]⑥print(school_score_sort_2year)mp.figure("高校录取分数线TOP10")⑦school_score_sort_2year.plot(kind='bar',color=['magenta','blueviolet'],edgecolor='black')⑧mp.title("高校录取分数线TOP10",fontsize=16)⑨mp.xlabel("学校",fontsize=12)mp.ylabel("分数",fontsize=12)mp.ylim(0,850)mp.gcf().autofmt_xdate()⑩mp.show()程序代码importpandasaspdimportmatplotlib.pyplotasmp①mp.rcParams['font.sans-serif']=['SimHei']②data=pd.read_csv(r"D:\pydata\项目八\school.csv",engine='python')③school_score=pd.pivot_table(data=data,index='学校',columns='年份',values='平均分',aggfunc='mean',margins=True,margins_name='历年平均')④school_score_sort=school_score[:-1].sort_values(by='历年平均',ascending=False)[:10]⑤school_score_sort_2year=school_score_sort[[2016,2017]]⑥print(school_score_sort_2year)mp.figure("高校录取分数线TOP10")⑦school_score_sort_2year.plot(kind='bar',color=['magenta','blueviolet'],edgecolor='black')⑧mp.title("高校录取分数线TOP10",fontsize=16)⑨mp.xlabel("学校",fontsize=12)mp.ylabel("分数",fontsize=12)mp.ylim(0,850)mp.gcf().autofmt_xdate()⑩mp.show()程序代码importmatplotlib.pyplotasmp,导入绘图matplotlib模块的pythlot模块。importpandasaspdimportmatplotlib.pyplotasmp①mp.rcParams['font.sans-serif']=['SimHei']②data=pd.read_csv(r"D:\pydata\项目八\school.csv",engine='python')③school_score=pd.pivot_table(data=data,index='学校',columns='年份',values='平均分',aggfunc='mean',margins=True,margins_name='历年平均')④school_score_sort=school_score[:-1].sort_values(by='历年平均',ascending=False)[:10]⑤school_score_sort_2year=school_score_sort[[2016,2017]]⑥print(school_score_sort_2year)mp.figure("高校录取分数线TOP10")⑦school_score_sort_2year.plot(kind='bar',color=['magenta','blueviolet'],edgecolor='black')⑧mp.title("高校录取分数线TOP10",fontsize=16)⑨mp.xlabel("学校",fontsize=12)mp.ylabel("分数",fontsize=12)mp.ylim(0,850)mp.gcf().autofmt_xdate()⑩mp.show()程序代码修改图表中的字体为'SimHei',即微软雅黑。importpandasaspdimportmatplotlib.pyplotasmp①mp.rcParams['font.sans-serif']=['SimHei']②data=pd.read_csv(r"D:\pydata\项目八\school.csv",engine='python')③school_score=pd.pivot_table(data=data,index='学校',columns='年份',values='平均分',aggfunc='mean',margins=True,margins_name='历年平均')④school_score_sort=school_score[:-1].sort_values(by='历年平均',ascending=False)[:10]⑤school_score_sort_2year=school_score_sort[[2016,2017]]⑥print(school_score_sort_2year)mp.figure("高校录取分数线TOP10")⑦school_score_sort_2year.plot(kind='bar',color=['magenta','blueviolet'],edgecolor='black')⑧mp.title("高校录取分数线TOP10",fontsize=16)⑨mp.xlabel("学校",fontsize=12)mp.ylabel("分数",fontsize=12)mp.ylim(0,850)mp.gcf().autofmt_xdate()⑩mp.show()程序代码pd.read_csv(),读取scv格式的文件,保存到变量data中。程序代码年份学校200720082009...20162017历年平均上海交通大学646.889306629.036697632.233684...631.875000642.674419633.169404上海交通大学医学院NaNNaN616.873239...NaNNaN623.438735东北大学NaNNaNNaN...578.368852558.357143575.552047东南大学614.896175591.421806597.955086...617.122905610.714286605.567555中南大学NaNNaN573.813187...590.922515578.175799585.413828........................西北工业大学609.861194584.370717586.713650...596.427160585.677494594.821507西安交通大学NaNNaNNaN...621.912442615.031250616.226291重庆大学595.704776576.811665575.806564...595.470426584.288973584.892715总计622.189012605.856792596.173174...603.825497592.947777603.538463表8.1.4汇总数据后的统计表importpandasaspdimportmatplotlib.pyplotasmp①mp.rcParams['font.sans-serif']=['SimHei']②data=pd.read_csv(r"D:\pydata\项目八\school.csv",engine='python')③school_score=pd.pivot_table(data=data,index='学校',columns='年份',values='平均分',aggfunc='mean',margins=True,margins_name='历年平均')④school_score_sort=school_score[:-1].sort_values(by='历年平均',ascending=False)[:10]⑤school_score_sort_2year=school_score_sort[[2016,2017]]⑥print(school_score_sort_2year)mp.figure("高校录取分数线TOP10")⑦school_score_sort_2year.plot(kind='bar',color=['magenta','blueviolet'],edgecolor='black')⑧mp.title("高校录取分数线TOP10",fontsize=16)⑨mp.xlabel("学校",fontsize=12)mp.ylabel("分数",fontsize=12)mp.ylim(0,850)mp.gcf().autofmt_xdate()⑩mp.show()程序代码调用pivot_table()函数为数据框data建立数据透视表。school_score_sort=school_score[:-1].sort_values(by='历年平均',ascending=False)[:10]⑤school_score_sort_2year=school_score_sort[[2016,2017]]⑥print(school_score_sort_2year)mp.figure("高校录取分数线TOP10")⑦school_score_sort_2year.plot(kind='bar',color=['magenta','blueviolet'],edgecolor='black')⑧mp.title("高校录取分数线TOP10",fontsize=16)⑨mp.xlabel("学校",fontsize=12)mp.ylabel("分数",fontsize=12)mp.ylim(0,850)mp.gcf().autofmt_xdate()⑩mp.show()程序代码对数据school_score[:-1]进行排序。程序代码年份学校200720082009...20162017历年平均清华大学673.598291661.736264657.629167...675.017668669.352941664.742333北京大学662.169717653.086116646.217469...657.943231647.438272653.195701中国科学技术大学649.917553631.515873637.829016...648.400000633.673469642.332882浙江大学646.584775629.181495632.155280...638.600000653.500000635.590120表8.1.5排序后得到的数据school_score_sort=school_score[:-1].sort_values(by='历年平均',ascending=False)[:10]⑤school_score_sort_2year=school_score_sort[[2016,2017]]⑥print(school_score_sort_2year)mp.figure("高校录取分数线TOP10")⑦school_score_sort_2year.plot(kind='bar',color=['magenta','blueviolet'],edgecolor='black')⑧mp.title("高校录取分数线TOP10",fontsize=16)⑨mp.xlabel("学校",fontsize=12)mp.ylabel("分数",fontsize=12)mp.ylim(0,850)mp.gcf().autofmt_xdate()⑩mp.show()程序代码school_score_sort_2year.plot(),使用基本绘图函数plot()对数据school_score_sort_2year绘图。程序代码school_score_sort=school_score[:-1].sort_values(by='历年平均',ascending=False)[:10]⑤school_score_sort_2year=school_score_sort[[2016,2017]]⑥print(school_scor

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论