《Pandas数据处理》课件 3.1.3 统计各行业每年的上市公司数量(微课)_第1页
《Pandas数据处理》课件 3.1.3 统计各行业每年的上市公司数量(微课)_第2页
《Pandas数据处理》课件 3.1.3 统计各行业每年的上市公司数量(微课)_第3页
《Pandas数据处理》课件 3.1.3 统计各行业每年的上市公司数量(微课)_第4页
《Pandas数据处理》课件 3.1.3 统计各行业每年的上市公司数量(微课)_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计各行业每年的上市公司数量主讲人:刘学重庆市九龙坡职业教育中心问题描述根据提供的股票列表统计出各个行业每年的上市公司的数量,股票列表如图所示。代码名称行业上市年份1平安银行银行19910403.02万科A全国地产19910129.04国农科技生物制药19910114.05世纪星源环境保护19901210.06深振业A区域地产19920427.0............603327福蓉科技元器件0.0603697有友食品食品20190508.0603863松炀资源造纸0.0603967中创物流仓储物流20190429.0603982泉峰汽车汽车配件0.0输出结果行业上市年份

IT设备1990119941199611997320001…………黄金2003220041200712008220151问题分析问题描述问题解答如何得出上市年份?

本活动的需要根据什么对数据分组?取“上市年份”列的前4个字符行业和年份操作提示首先是通过上市年份这列字段进行处理得出年份,然后以行业和年份这两个键进行分组统计数据,最后再利用count()函数统计上市公司数量。程序代码importpandasdata=pd.read_excel(r"D:\pydata\项目三\股票列表.xlsx",usecols=['代码','名称','行业','上市年份'])data=data[data["上市年份"]>0]data["上市年份"]=data["上市年份"].astype(str).str[:4]data=data.groupby(["行业","上市年份"])["名称"].count()print(data)程序代码importpandasaspddata=pd.read_excel(r"D:\pydata\项目三\股票列表.xlsx",usecols=['代码','名称','行业','上市年份'])data=data[data["上市年份"]>0]data["上市年份"]=data["上市年份"].astype(str).str[:4]data=data.groupby(["行业","上市年份"])["名称"].count()print(data)程序代码pandas提供了大量能使我们快速便捷地处理数据的函数和方法。程序代码importpandasaspddata=pd.read_excel(r"D:\pydata\项目三\股票列表.xlsx",usecols=['代码','名称','行业','上市年份'])data=data[data["上市年份"]>0]data["上市年份"]=data["上市年份"].astype(str).str[:4]data=data.groupby(["行业","上市年份"])["名称"].count()print(data)程序代码ID代码地区流通股名称行业tradeID总股本上市年份类别总资产py已退市1000001深圳171.7平安银行银行118171.71991040310135301.8PAYX0002000002深圳97.15万科A全国地产16113.021991012910115511.66WK0003000004深圳0.83国农科技生物制药790.84199101141011.61GNKJ0004000005深圳10.58世纪星源环境保护7710.591990121010129.52SJXY0003860603697重庆0.8有友食品食品1203.0520190508110.56YYSP0003861603863广东0松炀资源造纸1090018.41SZZY0003862603967山东0.67中创物流仓储物流122.6720190429115.17ZCWL0003863603982江苏0泉峰汽车汽车配件7000118.94QFQC000程序代码ID代码地区流通股名称行业tradeID总股本上市年份类别总资产py已退市1000001深圳171.7平安银行银行118171.71991040310135301.8PAYX0002000002深圳97.15万科A全国地产16113.021991012910115511.66WK0003000004深圳0.83国农科技生物制药790.84199101141011.61GNKJ0004000005深圳10.58世纪星源环境保护7710.591990121010129.52SJXY0003860603697重庆0.8有友食品食品1203.0520190508110.56YYSP0003861603863广东0松炀资源造纸1090018.41SZZY0003862603967山东0.67中创物流仓储物流122.6720190429115.17ZCWL0003863603982江苏0泉峰汽车汽车配件7000118.94QFQC000程序代码importpandasaspddata=pd.read_excel(r"D:\pydata\项目三\股票列表.xlsx",usecols=['代码','名称','行业','上市年份'])data=data[data["上市年份"]>0]data["上市年份"]=data["上市年份"].astype(str).str[:4]data=data.groupby(["行业","上市年份"])["名称"].count()print(data)程序代码代码名称行业上市年份1平安银行银行19910403.02万科A全国地产19910129.04国农科技生物制药19910114.05世纪星源环境保护19901210.06深振业A区域地产19920427.0............603068博通集成半导体20190415.0603267鸿远电子元器件20190515.0603317天味食品食品20190416.0603697有友食品食品20190508.0603967中创物流仓储物流20190429.0data=data[data["上市年份"]>0]程序代码importpandasaspddata=pd.read_excel(r"D:\pydata\项目三\股票列表.xlsx",usecols=['代码','名称','行业','上市年份'])data=data[data["上市年份"]>0]data["上市年份"]=data["上市年份"].astype(str).str[:4]data=data.groupby(["行业","上市年份"])["名称"].count()print(data)程序代码float19910403.0data["上市年份"].astype(str).str19910403.0.str[:4]str1991data["上市年份"]=data["上市年份"].astype(str).str[:4]程序代码代码名称行业上市年份1平安银行银行19912万科A全国地产19914国农科技生物制药19915世纪星源环境保护19906深振业A区域地产1992............603068博通集成半导体2019603267鸿远电子元器件2019603317天味食品食品2019603697有友食品食品2019603967中创物流仓储物流2019程序代码importpandasaspddata=pd.read_excel(r"D:\pydata\项目三\股票列表.xlsx",usecols=['代码','名称','行业','上市年份'])data=data[data["上市年份"]>0]data["上市年份"]=data["上市年份"].astype(str).str[:4]data=data.groupby(["行业","上市年份"])["名称"].count()print(data)程序代码data=data.groupby(["行业","上市年份"])["名称"].count()程序代码importpandasaspddata=pd.read_excel(r"D:\pydata\项目三\股票列表.xlsx",usecols=['代码','名称','行业','上市年份'])data=data[data["上市年份"]>0]data["上市年份"]=data["上市年份"].astype(str).str[:4]data=data.groupby(["行业","上市年份"])["名称"].count()print(data)任务小结Python中groupby()方法主要的作用是进行数据的分组以及分组后对各分组进行统计,groupby()方法不仅可以根据单个键分组,还可以根据多个键分组。一展身手请根据提供

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论