《人工智能通识与应用》课件-项目6:时间序列分析_第1页
《人工智能通识与应用》课件-项目6:时间序列分析_第2页
《人工智能通识与应用》课件-项目6:时间序列分析_第3页
《人工智能通识与应用》课件-项目6:时间序列分析_第4页
《人工智能通识与应用》课件-项目6:时间序列分析_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

任务6.1时间周期及计算Python数据分析学习目标及重难点学习目标:学会创建时期对象,并进行频率转换素养目标:了解并使用时期对象学习重点:创建及使用时期对象目录学习内容1.创建时期对象2.时期的频率转换01创建时期对象1.创建时期对象Pandas中,Period类表示一个标准的时间段或时期,比如某年、某月、某日、某小时等。创建Period对象只需要在Period类的构造方法中以字符串或整数的形式传入一个日期即可。2023-01-01至2023-12-31之间的时间段2023-11-01至2023-11-30之间的整月时间1.创建时期对象Period对象能够参与数学运算。如果Period对象加上或者减去一个整数,则会根据具体的时间单位进行位移操作。1.创建时期对象如果具有相同频率的两个Period对象进行数学运算,那么计算结果为它们的单位数量。1.创建时期对象如果希望创建多个Period对象,且它们是固定出现的,则可以通过period_range()函数实现。1.创建时期对象除了使用上述方式创建PeriodIndex外,还可以直接在PeriodIndex的构造方法中传入一组日期字符串。02时期的频率转换2.时期的频率转换Pandas中提供了一个asfreq()方法来转换时期的频率。asfreq(freq,method=None,how=None,normalize=False,fill_value=None

)freq--表示计时单位。how--可以取值为start或end,默认为end。normalize--表示是否将时间索引重置为午夜。fill_value--用于填充缺失值的值。2.时期的频率转换示例:如何将年度时期转换为年初或年末的月度时期任务6.2重采样Python数据分析学习目标及重难点学习目标:掌握重采样,可以实现降采样和升采样素养目标:了解并使用重采样学习重点:掌握重采样,实现降采样和升采样目录学习内容1.重采样方法2.降采样3.升采样01重采样方法1.重采样方法Pandas中的resample()是一个对常规时间序列数据重新采样和频率转换的便捷的方法。resample(rule,

how=None,

axis=0,

fill_method=None,

closed=None,

label=None,

...)rule--表示重采样频率的字符串或DateOffset。fill_method--表示升采样时如何插值。closed--设置降采样哪一端是闭合的。1.重采样方法示例:创建一个时间序列类型的Series对象,然后进行重采样从输出结果可以看出,生成的Series对象的时间戳为每周一,数据为每周求得的平均值,相当于Pandas中的分组操作。1.重采样方法如果重采样时传入closed参数为left,则表示采样的范围是左闭右开型的。也就是说位于某范围的时间序列中,开头的时间戳包含在内,结尾的时间戳是不包含在内的。02降采样2.降采样降采样时间颗粒会变大,比如原来是按天统计的数据,现在要按周统计,数据量是减少的。为了避免有些时间戳对应的数据闲置,可以利用内置方法聚合数据。示例:金融股票数据比较常见的是OHLC重采样,包括开盘价(open)、最高价(high)、最低价(low)和收盘价(close)。可以通过降采样的方法统计每周的股票价格。2.降采样03升采样3.升采样升采样的时间颗粒是变小的,数据量会增多,这很有可能导致某些时间戳没有相应的数据。3.升采样重新按照天进行采样,使用resample和asfreq两个方法,没有指定数据的部分都被填充为NaN。通常的解决办法是插值:ffill(limit)或bfill(limit),取空值前面或后面的值填充,limit可限制填充的个数fillna(‘ffill’)或fillna(‘bfill’)进行填充,传入ffill表示用NaN前面的值填充,传入bfill表示用后面的值填充使用interpolate()方法根据插值算法补全数据任务6.3事件模型—ARIMAPython数据分析学习目标及重难点学习目标:了解ARIMA模型素养目标:了解并使用ARIMA模型学习重点:使用ARIMA模型目录学习内容1.AR模型2.I模型3.MA模型01AR模型1.AR模型ARIMA的全称叫做差分整合移动平均自回归模型,又称作整合移动平均自回归模型,是一种用于时间序列预测的常见统计模型。ARIMA模型主要由AR、I与MA模型三个部分组成。ARIMA(p,d,q)AR(p)模型I模型MA(q)模型1.AR模型ARIMA(p,d,q)模型可以表示为:p--代表预测模型中采用的时序数据本身的滞后数,即自回归项数。d--代表时序数据需要进行几阶差分化,才是稳定的,即差分的阶数。q--代表预测模型中采用的预测误差的滞后数,即滑动平均项数。1.AR模型ARIMA模型的基本思想是:将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列,这个模型一旦被识别后,就可以从时间序列的过去值及现在值来预测未来值。ARIMA模型建立的基本步骤如下:第1步获取被观测的时间序列数据。第2步根据时间序列数据进行绘图,观测是否为平稳时间序列。从平稳的时间序列中求得自相关系数ACF和偏自相关系数PACF,得到最佳的阶层p和阶数q。第3步根据上述计算的d、q、p得到ARIMA模型,然后对模型进行检验。第4步1.AR模型AR模型为自回归模型,表示当前时间点的值等于过去若干个时间点的值的回归——因为不依赖于别的解释变量,只依赖于自己过去的历史值,故称为自回归。如果依赖过于最近的p个历史值,称阶数为p,记为AR(p)模型。整个公式可以用文字叙述为:X的当期值等于一个或数个落后期的线性组合,加上常数项,加上随机误差。02I模型2.I模型I模型表示的含义是模型对时间序列进行了查分。时间序列分析要求具有平稳性,对于不平稳的序列需要通过一定手段转化为平稳序列,一般采用的手段就是差分。d表示差分的阶数,t时刻的值减去t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论