版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
时间序列数据处理9-2TimeSeriesDataProcessing内容概述本章学习目标财务数据分析财务数据分析(1)了解时间序列分析的应用场景;(5)熟悉时间偏置DateOffset对象和窗口函数;(4)掌握dt对象的属性和方法;(2)掌握Datetimes数据类型的属性和方法;(3)掌握Timedeltas数据类型的属性和方法;(6)利用Pandas进行简单的时间序列分析。目录CONTENTS财务数据分析财务数据分析9.2时间序列数据处理
1时间序列概述2时间点 3时间差 4时间偏置5窗口函数【Python财务数据分析】——财务数据的时间序列数据分析时间序列概述PartOne01财务数据分析财务数据分析财务数据分析财务数据分析时间序列概述时间序列是按时间顺序索引的一系列数据点。最常见的时间序列是在连续的等间隔时间点上获得的序列有关时间序列的应用场景,分为以下4种情况:(1)时间点。即特定的时刻,记录时间维度的具体一个位置。(2)时间差。两个时间点做差就得到了时间差。时间差可以是几年,几个月,几天,几分,几秒,甚至小到纳秒。因为是时间差值,因此既可以是正数,也可以是负数。(3)时间跨度。即以时间为计量的迭代单位,时间记录迭代步长,以时间为计量的规律变化的一种时间差。(4)时间偏置。日期偏置是一种和日历相关的特殊时间差,是与时间计量的不同单位进制造成的特殊时间差。时间点PartTwo02财务数据分析财务数据分析财务数据分析财务数据分析时间点时间点(Datetimes)问题,Pandas提供Timestamp、DatetimeIndex、datetime64[ns]3种数据类型。Timestamp对象是时间点元素类型,表示确切的一个时间点;由Timestamp对象组成的序列是DatetimeIndex对象;DatetimeIndex对象可以作为Pandans的一个Series或者DataFrame的一列,数据类型为datetime64[ns]。财务数据分析财务数据分析Timestamp的构造与属性Pandas提供Timestamp(时间戳)类构造时间戳对象。单个时间戳的生成利用pd.Timestamp()实现Timestamp由date(日期)和time(时间)组成;其中日期又由year、month和day组成;时间由hour、minute和second组成。财务数据分析财务数据分析Datetime序列一组时间戳可以组成时间序列DatetimeIndex。通过to_datetime()和date_range()函数生成时间序列,即把时间戳格式的对象转换成为datetime64[ns]类型的时间序列range()和np.arange()函数,pd.date_range()是一种生成连续间隔时间的一种方法语法格式:财务数据分析财务数据分析时序类型dt对象Pandas在时序类型的序列上定义了dt对象来完成时间序列的相关操作。这些操作可以大致分为3类:dt属性,时间戳判定,取整操作。1)dt属性dt对象时间分量值属性包括:date,time,year,month,day,hour,minute,second,microsecond,nanosecond,dayofweek,dayofyear,weekofyear,daysinmonth,quarter等2)时间戳判定dt对象时间戳判定包括主要用于测试是否为月/季/年的第一天或者最后一天等,如is_leap_year,is_month_end,is_month_start,is_quarter_end,is_quarter_start,is_year_end,is_year_start等3)dt取整操作dt取整操作包含round(),ceil(),floor()函数,他们的公共参数为freq,常用的值包括:H(小时),min(分钟),S(秒),即完成时间点的不同方式取整。财务数据分析财务数据分析dt索引和切片财务数据分析财务数据分析dt索引和切片时间差PartThere03财务数据分析财务数据分析财务数据分析财务数据分析时间差两个时间戳(Timestamp)做差就得到了时间差(Timedeltas),Pandas中利用Timedelta对象来表示。类似于DatatimeIndex,一系列的时间差就组成TimedeltaIndex,而TimedeltaIndex置于DataFrame或Series中,其类型为timedelta64[ns]。财务数据分析财务数据分析创建Timedelta对象时间差可以理解为两个时间戳的差,这里也可以通过pd.Timedelta()来构造pd.Timestamp('2020010208:00:00')-pd.Timestamp('2020010107:35:00')pd.Timedelta(days=1,minutes=25)#需要注意是minutes,不是minute。或pd.Timedelta('1days25minutes')#字符串生成财务数据分析财务数据分析Timedelta序列对于时间差序列的生成,需要pd.to_timedelta()方法,其类型为timedelta64[ns],示例代码如下。td1=pd.date_range('2023-1-1','2023-3-1',periods=10)td2=td1+pd.Timedelta(days=1,minutes=45)*np.random.randint(10,size=10)ts=pd.to_timedelta(pd.Series(td2-td1))时间差序列也可以用timedelta_range()方法,参数与date_range()类似,示例代码如下。pd.timedelta_range('1m','1000m',freq='1h')pd.timedelta_range('0h','1000h',periods=9)财务数据分析财务数据分析时间差dt对象对于Timedelta序列,同样也定义了dt对象,接上例代码。td_dt=(pd.Series(td2-td1)).dtTimedelta的dt对象定义了的属性包括days,seconds,mircroseconds,nanoseconds等,与DatatimeIndex的dt对象类似。财务数据分析财务数据分析Timedelta的运算时间点是定距类型数据,但是时间差却是比例类型数据,可以进行加、减、乘、除运算都有意义。时间偏置PartFour04财务数据分析财务数据分析财务数据分析财务数据分析Offset对象Offset对象通过pd.offsets定义。当使用加法(+)运算时获取离其最近的下一个日期,当使用减法(-)运算时获取离其最近的上一个日期。[in]pd.Timestamp('20231006')+pd.offsets.WeekOfMonth(week=0,weekday=0)[out]Timestamp('2023-11-0600:00:00')[in]
pd.Timestamp('20231001')-pd.offsets.WeekOfMonth(week=0,weekday=0)[out]Timestamp('2023-09-0400:00:00')财务数据分析财务数据分析偏置字符串pd.date_range()函数可以生成连续的日期时间序列语法格式:pd.date_range(start=None,end=None,periods=None,freq=None,tz=None,normalize=False,name=None,inclusive='both',*,unit=None,**kwargs)式中freq取值可用Offset对象,称为频率字符串,是
DateOffset
对象及其子类。窗口函数PartFive05财务数据分析财务数据分析财务数据分析财务数据分析窗口函数窗口函数可以为每行数据进行一次计算,因为窗口函数指定了数据窗口大小,可以在这个滑动窗口里进行计算并返回一个值。聚合函数只返回一行或对分组下的所有数据进行统计。财务数据分析财务数据分析滑动窗口函数窗口函数就是一个可以在滑动窗口实现各种统计操作的函数。一个滑动窗口是一个移动变化的小区间,所以窗口函数可以在不断变化的小区间里实现各种复杂的统计分析。Pandasrolling()函数的语法格式:财务数据分析财务数据分析时序的滑动窗口所谓时序的滑窗函数,即把滑动窗口用freq关键词代替。将偏移量传递给rolling()函数,并使其根据传递的时间窗口生成可变大小的窗口。函数作用于每个时间点,以及偏移量的时间增量内出现的所有先前值。财务数据分析财务数据分析时序的扩张窗口扩张窗口又称累计窗口,可以理解为一个动态长度的窗口,其窗口的大小就是从序列开始处到具体操作的对应位置,其使用的聚合函数会作用于这些逐步扩张的窗口上。【Python财务数据分析】——财务数据的时间序列数据分析PartPractice05财务数据分析财务数据分析财务数据分析财务数据分析【小结】本节主要介绍了时间序列的特殊数据处理。时间序列是财经数据分析的重要内容,因此Pandas对其有较丰
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 体医工作制度
- 三误工作制度
- 三合理工作制度
- 公务班工作制度
- 九小时工作制度
- 优服办工作制度
- 严管区工作制度
- 2026 年中职工程测量技术(水准测量)试题及答案
- TWI-JR工作关系培训
- 医院网络系统安全知识培训
- 信纸(A4横条直接打印版)
- 《多源图像融合技术及其遥感应用-图像融合技术》课件
- 2024年人力资源三级理论真题与答案
- 海伦公式与三角形面积的综合题
- 资产评估学教程(第八版)习题及答案 乔志敏
- 三效蒸发器操作规程
- 14 圆圈QCC成果发布
- 林城镇卫生院安全生产制度
- 设计构成PPT完整全套教学课件
- EIM Starter Unit 6 This is delicious单元知识听写单
- GB/T 42125.14-2023测量、控制和实验室用电气设备的安全要求第14部分:实验室用分析和其他目的自动和半自动设备的特殊要求
评论
0/150
提交评论