本科经济统计学专业《时间序列分析(二):ARIMA模型与预测》教学设计_第1页
本科经济统计学专业《时间序列分析(二):ARIMA模型与预测》教学设计_第2页
本科经济统计学专业《时间序列分析(二):ARIMA模型与预测》教学设计_第3页
本科经济统计学专业《时间序列分析(二):ARIMA模型与预测》教学设计_第4页
本科经济统计学专业《时间序列分析(二):ARIMA模型与预测》教学设计_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本科经济统计学专业《时间序列分析(二):ARIMA模型与预测》教学设计【基础】、【核心概念】本节内容承接上一讲的时间序列平稳性检验与纯随机性检验,正式进入时间序列分析核心方法论的核心地带——ARIMA模型的构建与应用。ARIMA模型,全称为自回归积分移动平均模型,是现代时间序列分析中最为通用和重要的模型族之一。它将自回归模型(AR)与移动平均模型(MA)有机结合,并通过对非平稳序列进行差分处理,使其能够有效捕捉各种复杂的时间序列动态特征。本教学设计聚焦于BoxJenkins建模方法论,旨在引导学生掌握从模型识别、参数估计、诊断检验到预测应用的全流程,培养学生在经济、金融等领域的实战数据分析能力。【重要】、【学情精准分析】授课对象为大学本科二年级或三年级经济统计学专业学生。在知识储备上,学生已完成《概率论与数理统计》的学习,对随机变量、正态分布、假设检验、回归分析有基本理解,并在上一讲中掌握了时间序列的基本概念、平稳性定义(严平稳与宽平稳)、自相关函数(ACF)与偏自相关函数(PACF)的含义,以及单位根检验(ADF检验)的基本原理。在技能水平上,学生已初步接触EViews、R或Python等计量软件,能够进行简单的数据导入和描述性统计分析。然而,学生普遍存在的潜在困难在于:第一,对抽象的理论模型(如无限阶MA过程)缺乏直观感知;第二,面对具体的ACF/PACF图进行模型定阶时,容易产生误判和混淆;第三,对模型诊断中的残差白噪声检验的必要性理解不深,常会忽略模型改进的关键步骤;第四,在进行预测时,对预测值的置信区间随预测步长增大而发散的统计原理理解模糊。因此,本节课的教学设计将高度注重理论与案例实操的深度融合,通过“手算推导+软件演示+案例研讨”三位一体的方式,突破认知难点,实现从理论到实践的无缝衔接。【高阶】、【跨学科视野构建】时间序列分析不仅是经济统计学的核心工具,在气象学、金融工程、生物医学工程、社会网络分析等领域均有广泛应用。本节课在讲授过程中,将适时引入跨学科案例,如在讲到季节ARIMA模型时,提及电力负荷预测中的季节性因素;在讲到异方差性时,引申至金融资产收益率的波动率聚集现象(ARCH/GARCH模型的基础),为学生后续学习高阶金融计量或机器学习时序预测(如LSTM)埋下伏笔,培养学生的数据思维和跨领域迁移能力。【核心素养导向教学目标】(一)知识目标1.识记并复述ARIMA模型的基本结构,明确自回归(AR)、差分(I)、移动平均(MA)三个组成部分的数学含义与作用。2.解释BoxJenkins建模方法论的核心思想与三个主要阶段(识别、估计与诊断、预测)。3.能够根据给定的ACF图和PACF图,准确判断AR(p)模型、MA(q)模型及ARMA(p,q)模型的截尾与拖尾特征。4.熟练掌握差分阶数d的确定原则,理解过度差分的危害(导致序列方差增大)。5.阐明AIC、BIC等信息准则在模型比较与选择中的作用及计算方法。(二)能力目标1.【核心能力】能够独立运用EViews或Python等软件,对给定的经济时间序列数据(如GDP、CPI、股票价格)进行完整的ARIMA建模分析,包括平稳性检验、差分处理、模型定阶、参数估计、残差检验和最终预测。2.具备模型诊断与修正能力,能够根据残差的自相关检验结果(如Q统计量)判断模型的充分性,并提出改进方向(如增加AR或MA阶数)。3.培养批判性思维,能够比较不同ARIMA模型的拟合优度与预测精度,并合理解释其经济含义。4.提升团队协作与沟通表达能力,通过小组合作完成一个完整的案例分析报告。(三)情感态度与价值观目标1.通过对数据规律的探索,培养学生严谨求实、精益求精的科学精神,理解任何统计模型都是对现实的近似,避免盲目迷信模型结果。2.增强学生的社会责任感,理解准确的时间序列预测对于宏观经济政策制定、企业风险管理的重要意义,养成用数据说话的职业习惯。3.激发学生对统计学的学习兴趣,通过对未知数据的预测,体验数据科学带来的探索乐趣和成就感。【高频考点】、【教学重点与难点】(一)教学重点1.ARIMA(p,d,q)模型的数学表达式及其平稳性与可逆性条件。2.利用自相关函数(ACF)和偏自相关函数(PACF)的截尾性和拖尾性进行模型识别(定阶)。3.BoxJenkins建模方法论的操作流程,特别是模型诊断环节(残差白噪声检验)的重要性。4.ARIMA模型的点预测与区间预测方法,理解预测误差随步长增大的规律。(二)教学难点1.【难点】模型定阶的主观性与不确定性:ACF和PACF的样本估计值存在随机误差,导致理论上的截尾在实际图中呈现为逐渐衰减,学生难以区分真正的截尾与拖尾。教学中将引入“2倍标准差准则”和“巴特利特公式”辅助判断。2.【难点】AR与MA过程的相互转换与对偶性:理解一个低阶AR过程可以等价于一个无穷阶MA过程,反之亦然。这种对偶性是理解模型识别复杂性的关键。3.【难点】非平稳序列的差分处理:何时需要进行季节差分?如何处理含有确定性趋势的单位根过程?学生容易混淆差分与去势两种方法的应用场景。4.【难点】信息准则的底层逻辑:AIC与BIC如何平衡拟合优度与模型简洁性?为什么BIC更倾向于选择更简洁的模型?【教学准备清单】1.硬件环境:多媒体教室(配备投影仪、黑板)、计算机实验室(每生一台终端,预装EViews12或以上版本,或配置好Python环境【Anaconda】及statsmodels库)。2.软件资源:EViews软件操作指南(快捷键、常用命令)、PythonJupyterNotebook示例代码(包含数据导入、ACF/PACF绘图、ARIMA估计、预测代码段)。3.数据材料:精心准备的三个数据集——中国社会消费品零售总额月度数据(,含明显趋势和季节效应)、上证综指日度收益率数据(,平稳但存在波动聚集)、某公司季度销售数据(用于季节性ARIMA拓展)。数据均以Excel和CSV格式准备。4.教学资料:预习任务单(包含ARIMA模型预备知识回顾、阅读教材指定章节)、小组案例分析任务卡、课堂练习随堂测试题(含答案二维码)、课程评价量规。5.板书设计:主板书区划分为“模型结构区”、“ACF/PACF识别规则区”、“建模流程区”和“今日公式推导区”。【教学实施过程】总时长:90分钟一、导入与复习:从平稳性走向模型构建(约8分钟)教师活动:开启课程,首先在大屏幕上展示一张图表:中国社会消费品零售总额1995年至2024年的月度数据折线图。引导学生观察:“我们看到这条曲线呈现出明显的长期上升趋势和周期性的波动。请问,根据上节课所学,这是一个平稳的时间序列吗?”学生回答:“不是,它存在趋势。”教师追问:“正确!那上节课我们讲的处理非平稳性的常用方法是什么?”学生齐答:“差分!”教师点头肯定:“非常好。通过一阶或二阶差分,我们可以消除趋势,得到平稳的序列。那么,得到了平稳序列之后呢?我们统计建模的最终目的是什么?”停顿片刻,自答:“是为了揭示其内在的统计规律,进而进行预测,为决策提供依据。那么,我们应该用什么数学模型来描述这个经过差分后看似随机但实际上可能有相关性的平稳序列呢?这就是我们今天要深入探讨的核心——ARIMA模型。”教师简要回顾平稳性的判别方法(ADF检验),并演示在EViews中对社消数据取自然对数并进行一阶差分,得到对数收益率序列,展示其图形基本平稳。点明本节课的任务:为这个平稳的差分序列构建一个最优的时间序列模型,并预测未来三个月的社消总额增长率。学生活动:观察图表,回顾上节课知识点,积极参与问答互动。跟随教师思路,在脑海中构建本节课的学习地图:从非平稳到平稳(差分),从平稳到模型(ARIMA),从模型到预测。在笔记本上记录关键问题:“如何为平稳序列选择合适的模型?”【设计意图】以真实数据问题导入,自然引出本节课的主题,同时强化上节课的“差分”核心概念,建立知识之间的逻辑桥梁,激发学生的求知欲。二、新知探究:ARIMA模型的理论基石(约27分钟)(一)ARIMA模型的数学定义与内涵【基础】(约10分钟)教师活动:1.板书公式:首先写出一个ARMA(p,q)模型的一般形式:yt=c+ϕ1yt−1+ϕ2yt−2+...+ϕpyt−p+εt+θ1εt−1+θ2εt−2+...+θqεt−qy_t=c+\phi_1y_{t1}+\phi_2y_{t...+...+\phi_py_{tp}+\varepsilon_t+\theta_1\varepsilon_{t1}+\theta_2\varepsilon_{t...+...+\theta_q\varepsilon_{tq}......ϕ1​yt−1​+ϕ2​yt−2​+...+ϕp​yt−p​+εt​+θ1​εt−1​+θ2​εt−2​+...+θq​εt−q​解释:其中${y_t}$是平稳序列,$c$是常数项,$\phi_i$是自回归系数,$\theta_j$是移动平均系数,$\varepsilon_t$是白噪声序列(均值为0,方差恒定,无自相关)。2.引入滞后算子B:为了简化表达,引入滞后算子$B$,即$By_t=y_{t1}$,$B^ky_t=y_{tk}$。则ARMA模型可简化为:(1−ϕ1B−ϕ2B2−...−ϕpBp)yt=c+(1+θ1B+θ2B2+...+θqBq)εt(1\phi_1B\phi_2B^2......\phi_pB^p)y_t=c+(1+\theta_1B+\theta_2B^2+...+\theta_qB^q)\varepsilon_t(1−ϕ1​B−ϕ2​B2−...−ϕp​Bp)yt​=c+(1+θ1​B+θ2​B2+...+θq​Bq)εt​记$\Phi(B)=(1\phi_1B...\phi_pB^p)$,$\Theta(B)=(1+\theta_1B+...+\theta_qB^q)$,则模型为$\Phi(B)y_t=c+\Theta(B)\varepsilon_t$。3.整合差分:对于非平稳序列${x_t}$,如果我们通过$d$次差分得到平稳序列$y_t=\Delta^dx_t$(其中$\Delta=1B$),则ARIMA模型为:Φ(B)(1−B)dxt=c+Θ(B)εt\Phi(B)(1B)^dx_t=c+\Theta(B)\varepsilon_tΦ(B)(1−B)dxt​=c+Θ(B)εt​明确告知学生,这就是ARIMA(p,d,q)模型。d代表差分的阶数。4.深入阐释:以AR(1)模型$y_t=\phiy_{t1}+\varepsilon_t$为例,讲解其平稳性条件$|\phi|<1$(特征根在单位圆内)。对于MA(1)模型$y_t=\varepsilon_t+\theta\varepsilon_{t1}$,讲解其可逆性条件$|\theta|<1$(保证模型有唯一表示)。强调平稳性是针对AR部分,可逆性是针对MA部分,这是模型估计和解释的前提。学生活动:跟随教师推导,理解公式的每一部分含义。在笔记上记录AR、I、MA三个部分的直观解释。同桌两人一组,尝试口头解释:为什么$|\phi|<1$时,冲击$\varepsilon_t$的影响会随时间衰减?(二)模型识别利器:ACF与PACF的截尾与拖尾【核心】【高频考点】(约12分钟)教师活动:1.理论复习:快速回顾自相关函数(ACF)度量的是$y_t$与$y_{tk}$之间的相关性;偏自相关函数(PACF)度量的是在剔除中间变量$y_{t1},y_{t2},...,y_{tk+1}$的影响后,$y_t$与$y_{tk}$之间的条件相关性。2.图表对比教学:在PPT上并排展示五组理论ACF和PACF图(真实值,无抽样误差)。纯AR(1)模型($\phi=0.8$):PACF在滞后1阶处有一个高峰(截尾),之后均为0;ACF呈指数衰减(拖尾)。纯MA(1)模型($\theta=0.8$):ACF在滞后1阶处有一个高峰(截尾),之后均为0;PACF呈指数衰减(拖尾)。纯AR(2)模型:PACF在滞后1、2阶处有高峰(截尾),ACF呈混合衰减(拖尾)。纯MA(2)模型:ACF在滞后1、2阶处有高峰(截尾),PACF呈混合衰减(拖尾)。ARMA(1,1)模型:ACF和PACF均从滞后1阶开始逐渐衰减(均拖尾)。3.总结法则【重要】:逐条板书识别规则。若PACF在p阶后截尾,ACF拖尾→AR(p)模型。若ACF在q阶后截尾,PACF拖尾→MA(q)模型。若ACF和PACF均拖尾→ARMA(p,q)模型(需要进一步尝试定阶)。4.引入现实情况:展示真实数据的样本ACF/PACF图,它们不会像理论图那样完美地变为0,而是落在2倍标准误($\pm2/\sqrt{T}$)的带状区域内。引导学生学会观察“是否显著不为0”。5.练习互动:给出几个模拟数据的样本ACF/PACF图,请学生快速识别可能的模型阶数。学生活动:仔细观察并对比图表,在教师引导下总结规律。在笔记本上画出识别规则的思维导图。积极参与课堂练习,尝试对模拟数据进行模型识别,并与同桌交流判断依据。【设计意图】通过可视化对比,将抽象的数学性质转化为直观的图形记忆,降低认知门槛。结合真实数据的样本图,培养学生识别真实世界数据模式的能力,直击考点。(三)参数估计与模型诊断:BoxJenkins方法论的核心(约5分钟)教师活动:1.简要介绍参数估计方法:对于AR模型,可用普通最小二乘法(OLS)估计;对于包含MA项的模型,通常采用极大似然估计(MLE)或非线性最小二乘法。不必深究具体算法,强调软件实现即可。2.重点讲解模型诊断(ModelDiagnostics):估计完模型后,我们获得的是一组参数和残差序列$\hat{\varepsilon}_t$。一个好的模型,其残差应该像白噪声一样——无自相关。如果残差还存在显著的自相关,说明模型没有提取完所有信息,需要重新识别和估计。3.介绍诊断工具:残差序列的ACF/PACF图观察。LjungBoxQ统计量:对残差进行联合假设检验($H_0$:残差无自相关)。如果Q统计量的p值很大(如>0.05),则不拒绝原假设,认为残差是白噪声,模型通过检验。4.引入信息准则(AIC/BIC):当有多个候选模型(如ARMA(1,1)和ARMA(2,1))都能通过诊断时,如何选择?AIC和BIC可以帮我们平衡拟合优度与模型复杂度。通常选择AIC或BIC值最小的模型。指出BIC对模型复杂度的惩罚更严厉。学生活动:理解诊断的意义,认识到建立模型不仅仅是得到系数,更重要的是验证模型的有效性。记录LjungBox检验的原假设和信息准则的选择原则。三、实操演练:基于EViews的ARIMA建模全流程(约35分钟)【核心】、【教学实施核心环节】(一)任务发布与数据准备(3分钟)教师发布任务卡:继续使用“中国社会消费品零售总额”的对数序列(记为ln_sales)。目标是为其建立ARIMA模型,并预测未来3个月的数值。学生打开EViews软件,加载数据,并生成一阶差分序列d_ln_sales。(二)任务一:平稳性再检验与差分阶数d的确定(5分钟)学生操作:对ln_sales进行ADF检验,发现p值很大,不拒绝有单位根的原假设。对d_ln_sales进行ADF检验,p值小于0.05,序列平稳。由此确定d=1。教师巡视指导,检查学生是否进行了正确的差分操作和检验解读。(三)任务二:模型识别——看图定阶(8分钟)【热点】学生操作:查看d_ln_sales的相关图和偏相关图(View/Correlogram)。教师引导学生共同观察:观察ACF:在滞后1期处有一个显著的正相关,之后快速衰减,但2期和3期也可能落在边界上?这看起来像是拖尾还是截尾?观察PACF:在滞后1期处显著很大,滞后2期也接近显著边界,之后基本落入带内。这可能提示AR(1)或AR(2)。教师引导:“看到ACF和PACF都在1阶处显著,并且都逐渐衰减,这更像我们之前讲的哪一种理论模型?”学生回忆:“都拖尾?那是ARMA!”教师肯定:“对,初步判断可能是ARMA(1,1)或ARMA(2,1)或AR(2)等。我们需要建立几个竞争模型。”(四)任务三:模型估计与比较(10分钟)【重要】学生分组操作:分别建立三个候选模型:1.AR(2):lsd_ln_salescar(1)ar(2)2.ARMA(1,1):lsd_ln_salescar(1)ma(1)3.ARMA(2,1):lsd_ln_salescar(1)ar(2)ma(1)教师要求每个组记录下每个模型的以下信息:AIC值、SC值(BIC)、调整后的R方,以及最重要的——残差检验结果(View/ResidualDiagnostics/CorrelogramQstatistics)。观察每个模型残差的Q统计量的p值(Prob列),看是否大部分滞后阶数都大于0.05。(五)任务四:模型诊断与最终选择(5分钟)教师组织全班分享各组的发现。通常会得出类似结论:AR(2)模型的残差在某个滞后阶可能还有自相关(p值小于0.05)。ARMA(1,1)和ARMA(2,1)的残差可能都是白噪声。这时比较AIC值,ARMA(2,1)的AIC略低于ARMA(1,1)。因此,全班初步选定ARMA(2,1)模型,即最终的ARIMA(2,1,1)模型。教师强调:“注意,ARIMA(2,1,1)意味着对原始序列做了1阶差分,然后对差分后的平稳序列建立了ARMA(2,1)模型。”(六)任务五:预测未来(4分钟)教师演示:在估计出的ARMA(2,1)模型窗口,点击Forecast。设置预测样本范围为实际数据之后的一个时期(如2024M012024M03)。关键讲解:Forecastgraph:展示历史拟合值与未来预测值。Forecastevaluation:展示预测评价指标(如RMSE、MAE)。预测置信区间:解释为什么预测线两侧的置信区间随着预测步长增加而逐渐变宽。因为预测误差的方差会随着步长线性(或非线性)累积。学生操作:跟随教师步骤,生成预测图,并记录未来三个月的预测值(需要通过对数逆变换得到实际销售额的预测值)。四、巩固与拓展:从理论到实践,从一元到多元(约15分钟)(一)基础巩固:快速判断(3分钟)教师在大屏幕上展示若干组时间序列的ACF/PACF样本图(每组停留20秒),要求学生快速抢答,说出可能的模型阶数(如AR(1)、MA(2)、ARMA(1,1)等)。并解释判断依据。此环节旨在强化记忆核心识别规则。(二)综合应用:季节ARIMA模型简介(SARIMA)(5分钟)【难点】、【热点】教师指出:我们刚才处理的社消数据虽然通过差分去除了趋势,但大家看其原始图,是否存在周期为12的规律?学生肯定。教师引入:“对于这种具有明显季节性的月度数据(周期s=12),我们通常需要在普通ARIMA的基础上,加入季节自回归和季节移动平均项,这就是SARIMA(p,d,q)(P,D,Q)s模型。”以简单图示介绍季节差分(对12阶进行差分)的必要性,并展示EViews中估计SARIMA的界面。点明这是下一讲的核心内容,为后续课程埋下伏笔。(三)拓展挑战:模型过度拟合与简约原则(2分钟)教师提出问题:“如果我们尝试ARIMA(5,1,5),模型的AIC可能会更低,但估计出的参数可能有很多不显著。这是为什么?”引导学生思考“简约原则”(ParsimonyPrinciple)——在同等解释力下,应选择参数更少的模型。因为模型越复杂,预测的方差越大。(四)课堂小结与知识图谱构建(5分钟)教师引导学生一起回顾本节核心内容:1.一个模型:ARIMA(p,d,q)的结构。2.两条识别规则:ACF/PACF的截尾与拖尾。3.三个建模阶段:识别(定阶)、估计与诊断、预测。4.四个核心工具:ACF/PACF图、Q统计量、AIC/BIC、软件实操。学生在笔记本上自主绘制本节课的知识图谱,或使用思维导图软件记录。教师展示预先准备好的结构化总结图,供学生对照补充。五、课后任务与学习评价(约5分钟)【重要】、【高阶能力培养】(一)分层作业布置1.基础巩固作业:阅读教材指定章节,完成课后习题中关于ACF/PACF识别和ARIMA模型概念的选择题与简答题。要求手写推导一个MA(2)模型的自协方差函数。2.综合应用作业(个人):“上证综指”2023年1月1日至2024年12月31日的日度收盘价数据。要求:(1)对收盘价序列进行平稳性检验;(2)若不平稳,进行适当变换;(3)识别并建立一个合适的ARIMA模型;(4)撰写一份不超过两页的简要分析报告,包含数据处理过程、ACF/PACF图、最终模型表达式、残差诊断结果及对未来一周走势的预测(附置信区间)。提交电子版(Word/PDF)至课程平台。3.拓展挑战作业(小组,23人):任选一个含有明显季节效应的经济指标(如月度CPI、季度GDP、月度民航客运量),尝试构建SARIMA模型进行拟合和预测。在下次课进行5分钟的PPT分享,重点汇报处理季节性的方法和模型选择依据。(二)教学评价设计1.过程性评价:课堂提问互动表现(10%)、随堂练习完成情况(10%)、小组讨论参与度(10%)。2.结果性评价:综合应用作业(40%),重点考察建

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论