《数据分析》课件-任务6.4 重采样_第1页
《数据分析》课件-任务6.4 重采样_第2页
《数据分析》课件-任务6.4 重采样_第3页
《数据分析》课件-任务6.4 重采样_第4页
《数据分析》课件-任务6.4 重采样_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

任务6.4重采样Python数据分析学习目标及重难点学习目标:掌握重采样,可以实现降采样和升采样素养目标:了解并使用重采样学习重点:掌握重采样,实现降采样和升采样目录学习内容1.重采样方法2.降采样3.升采样01重采样方法1.重采样方法Pandas中的resample()是一个对常规时间序列数据重新采样和频率转换的便捷的方法。resample(rule,

how=None,

axis=0,

fill_method=None,

closed=None,

label=None,

...)rule--表示重采样频率的字符串或DateOffset。fill_method--表示升采样时如何插值。closed--设置降采样哪一端是闭合的。1.重采样方法示例:创建一个时间序列类型的Series对象,然后进行重采样从输出结果可以看出,生成的Series对象的时间戳为每周一,数据为每周求得的平均值,相当于Pandas中的分组操作。1.重采样方法如果重采样时传入closed参数为left,则表示采样的范围是左闭右开型的。也就是说位于某范围的时间序列中,开头的时间戳包含在内,结尾的时间戳是不包含在内的。02降采样2.降采样降采样时间颗粒会变大,比如原来是按天统计的数据,现在要按周统计,数据量是减少的。为了避免有些时间戳对应的数据闲置,可以利用内置方法聚合数据。示例:金融股票数据比较常见的是OHLC重采样,包括开盘价(open)、最高价(high)、最低价(low)和收盘价(close)。可以通过降采样的方法统计每周的股票价格。2.降采样03升采样3.升采样升采样的时间颗粒是变小的,数据量会增多,这很有可能导致某些时间戳没有相应的数据。3.升采样重新按照天进行采样,使用resample和asfreq两个方法,没有指定数据的部分都被填充为NaN。通常的解决办法是插值:ffill(limit)或bfill(limit),取空值前面或后面的值填充,limit可限制填充的个数fillna(‘ffill’)或fillna(‘bfill’)进行填充,传入ffill表示用NaN前面的值填充

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论