版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
任务6.4重采样Python数据分析学习目标及重难点学习目标:掌握重采样,可以实现降采样和升采样素养目标:了解并使用重采样学习重点:掌握重采样,实现降采样和升采样目录学习内容1.重采样方法2.降采样3.升采样01重采样方法1.重采样方法Pandas中的resample()是一个对常规时间序列数据重新采样和频率转换的便捷的方法。resample(rule,
how=None,
axis=0,
fill_method=None,
closed=None,
label=None,
...)rule--表示重采样频率的字符串或DateOffset。fill_method--表示升采样时如何插值。closed--设置降采样哪一端是闭合的。1.重采样方法示例:创建一个时间序列类型的Series对象,然后进行重采样从输出结果可以看出,生成的Series对象的时间戳为每周一,数据为每周求得的平均值,相当于Pandas中的分组操作。1.重采样方法如果重采样时传入closed参数为left,则表示采样的范围是左闭右开型的。也就是说位于某范围的时间序列中,开头的时间戳包含在内,结尾的时间戳是不包含在内的。02降采样2.降采样降采样时间颗粒会变大,比如原来是按天统计的数据,现在要按周统计,数据量是减少的。为了避免有些时间戳对应的数据闲置,可以利用内置方法聚合数据。示例:金融股票数据比较常见的是OHLC重采样,包括开盘价(open)、最高价(high)、最低价(low)和收盘价(close)。可以通过降采样的方法统计每周的股票价格。2.降采样03升采样3.升采样升采样的时间颗粒是变小的,数据量会增多,这很有可能导致某些时间戳没有相应的数据。3.升采样重新按照天进行采样,使用resample和asfreq两个方法,没有指定数据的部分都被填充为NaN。通常的解决办法是插值:ffill(limit)或bfill(limit),取空值前面或后面的值填充,limit可限制填充的个数fillna(‘ffill’)或fillna(‘bfill’)进行填充,传入ffill表示用NaN前面的值填充
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2-keto-D-Gluconic-acid-生命科学试剂-MCE
- 常见的盐 第3课时 表格式教学设计(人教版九年级下册)
- 2026一年级数学上 加减法的合作学习
- 2025 印度在线外卖配送的效率提升课件
- 2025 六年级地理下册撒哈拉以南非洲的旅游景点课件
- 2026七年级上语文文言文道理感悟
- 2026六年级语文人教版下册语文园地一
- 今年五一策划活动方案(3篇)
- 天鹅节活动方案策划(3篇)
- 2026七年级下语文对偶修辞学习方法
- GB/T 27664.3-2026无损检测仪器超声检测设备的性能与检验第3部分:组合设备
- 函数的凹凸性
- 科学计算与数学建模课件
- 西周王朝的档案和档案工作
- 热处理工艺卡片
- 数控多工位钻床的设计
- 部编四年级语文下册 全册教案 (表格式)
- 创业引导-与企业名家面对面答案
- 《土地宝忏》2019版定稿
- 篆香-PPT精品课件
- 观光车项目立项申请报告
评论
0/150
提交评论