《数据分析与EViews的应用》(第4版)课件 第1、2章 EViews软件使用初步、线性回归分析_第1页
《数据分析与EViews的应用》(第4版)课件 第1、2章 EViews软件使用初步、线性回归分析_第2页
《数据分析与EViews的应用》(第4版)课件 第1、2章 EViews软件使用初步、线性回归分析_第3页
《数据分析与EViews的应用》(第4版)课件 第1、2章 EViews软件使用初步、线性回归分析_第4页
《数据分析与EViews的应用》(第4版)课件 第1、2章 EViews软件使用初步、线性回归分析_第5页
已阅读5页,还剩84页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章EViews软件使用初步目录01.工作文件及建立掌握工作文件的创建、保存与结构管理02.序列对象的基本操作学习序列的建立、数据录入与基本编辑方法03.数据分析的常用操作表达式、样本运算范围、新序列建立、群对象和图像绘制04.序列的描述统计分析单个序列、多个序列的描述统计分析及假设检验01.工作文件及建立概述工作文件在EViews中的核心地位,以及建立工作文件是进行数据分析的首要步骤。主窗口简介界面核心功能区详解主菜单:包含File、Edit等10个菜单,提供核心操作入口。命令输入区:位于菜单下方,支持交互模式下单条命令的输入执行。状态显示行:窗口最下方,实时显示当前路径、数据库及工作文件信息。EViews13.0主窗口概览如左图所示,EViews主窗口结构清晰。顶部菜单栏集成了所有核心功能;中部蓝色区域为命令输入区,是高效操作的关键;底部则是工作区和状态栏。熟悉这些布局是掌握软件操作的第一步。工作文件的创建创建流程与结构创建路径:主菜单File->New->Workfile结构类型:非时序类:适用于无时间标识的数据时间序列:适用于固定频率数据(年/季/月)齐整面板:适用于多个体、多时间的结构化数据参数设置与实操时间频率设置:选择频率(年/半年/季/月等),输入数据起止时间。左图:新建工作文件入口|右图:定义数据结构与频率工作文件窗口简介窗口组成与操作窗口组成:数据的集中显示和管理区域,包含标题栏、工具栏、数据显示区和状态栏。对象操作:双击对象名称即可打开该对象的窗口,查看其数据或进行进一步操作。默认对象与界面展示新建工作文件自动包含两个基础对象:c(系数向量):用于存储回归模型的系数估计值。resid(残差序列):用于存储回归模型的残差值。工作文件的存储与调用存储方式(Save)通过主菜单操作:File->Save/SaveAs快捷工具栏:直接点击窗口工具栏中的Save按钮文件格式:工作文件默认扩展名为.wf1调用方式(Open)路径:File->Open->Workfile操作:在弹出的对话框中选择已保存的.wf1格式文件。其他格式支持除了标准的.wf1工作文件外,EViews还支持直接读取以下外部数据格式:ASCII码文本文件数据库文件(DatabaseFiles)工作文件时间范围的调整操作方法与命令菜单方式(StructurePage)路径:Procs->StructuretheCurrentPage在对话框中直接输入新的起止时间即可。命令方式(Commands)扩展样本期:expand[start][end]例:expand1991.011999.12设置样本范围:smpl[start][end]例:smpl1993:11999:12案例实操:调整时间范围场景描述与目标原范围:1992年1月-1998年12月新范围:1991年1月-1999年12月(整体扩展)运算范围:1993年1月-1999年12月(局部设置)关键操作步骤1.输入命令扩展工作文件范围:expand1991.011999.122.输入命令设定新的样本运算范围:smpl1993:11999:12改变工作文件的显示方式对象过滤(DisplayFilter)View->DisplayFilter功能说明:设置过滤条件,只显示符合条件的对象。便于在大量对象中快速定位和管理。显示详细资料(DisplayComments)路径:View->DisplayComments(Label+-)功能:切换是否显示对象的标签、创建时间等详细元数据信息。字母大小写(Uppercase)路径:View->NameDisplay->Uppercase功能:将对象名称切换为大写显示,系统默认为小写。02.序列对象的基本操作概述序列对象是EViews中最常用的对象类型,介绍序列的创建、打开、数据录入等基本操作。对象的类型EViews对象体系基本概念:EViews13.0提供了24种功能不同的对象,它们是构成工作文件的基本元素,也是实现所有分析过程的载体。对象功能解析:数据存储:序列、矩阵、组等用于管理原始数据。分析处理:方程、模型、系统等用于执行统计和计量分析。24种对象概览Equation,Factor,GeoMap,Graph,Group,Logl,Matrix-Vector-Coef,Model,Pool,Sample,Scalar,Series,SeriesLink,SeriesAlpha,Spool,Sspace,String,Svector,System,Table,Text,ValMap,Var,Userobj。核心常用对象在众多对象中,序列(Series)和方程(Equation)是最常用的两种对象,后续的学习将主要围绕它们展开。序列的创建与打开NewObject对话框示例创建路径:主菜单依次点击Object->NewObject,打开新建对象对话框。类型与命名:左侧列表选择Series,右侧输入名称(如GDP/CPI)。命名规则:禁止使用保留字符(如ABS/LOG/NA),名称不区分大小写。打开方式:双击序列名/View->OpenSelected/Quick->Show。创建序列是数据录入的基础,规范命名可避免程序报错。序列对象窗口简介工具栏按钮包含View、Procs、Objects等功能按钮,按钮功能会根据当前对象的类型动态变化,提供针对性操作。数据显示模式默认以电子表格(SpreadSheet)形式展示数据,支持通过View菜单切换为图形(Graph)、描述统计等多种模式。多窗口支持EViews支持同时打开多个不同类型的对象窗口,便于对不同序列或分析结果进行直观的对比分析。序列数据录入:手动输入进入编辑状态点击序列窗口工具栏中的Edit+/-按钮,按钮变为按下状态,表示成功进入编辑模式。数据输入操作进入编辑状态后,可在电子表格的单元格中直接输入或修改数据,支持批量编辑操作。显示模式切换Smpl+/-:切换显示全部数据/仅样本数据Label+/-:切换显示/隐藏对象标签Wide+/-:切换单列显示/多列显示序列值退出编辑与显示对比再次点击Edit+/-退出,数据自动保存。下图为Wide模式对比:左:多列模式(Wide+)右:单列模式(Wide-)导入Excel数据-数据准备案例信息与准备案例背景Excel文件包含我国2007-2022年的科技支出(y)与GDP(x)数据。数据特点数据按时间顺序排列,但A列直接是数值,没有时间标志列。准备工作需先创建时间范围为2007-2022年的工作文件,匹配数据跨度。数据格式预览案例演示:导入Excel数据(例1.2)操作步骤详解步骤一:选择操作路径在主菜单中依次选择:Procs->Import->ImportfromFile。步骤二:选择目标文件在弹出的文件浏览器中,找到并选中“例1.2.xls”等目标Excel文件。步骤三:进入导入向导系统弹出“ExcelImportWizard-Step1of4”对话框,开始导入。导入向导界面展示图:ExcelImportWizard-Step1对话框案例演示:Excel数据导入参数设置数据结构与命名步骤2:设置起始行由于数据第一行即为数值,无需标题行,直接点击“下一页”。步骤3:变量命名在“Name”栏中分别输入“y”和“x”作为两个序列的名称。时间频率与完成步骤4:设置时间频率选择频率为“Annual”,并设定起始时间为“2007”。完成导入确认所有参数无误后,点击“Finish”按钮,完成数据导入。案例演示:导入Excel数据(例1.2)-导入结果结果展示与验证结果展示数据导入成功后,工作文件窗口中会出现两个新的序列对象:y和x。数据验证可以双击打开这两个序列,查看数据是否正确导入,数值是否与Excel文件中的一致。操作总结流程总结通过导入向导,我们成功将外部Excel数据转换为EViews中的序列对象,为后续的分析做好了准备。下一步提示确认数据无误后,即可开始进行单位根检验或回归分析。序列的重命名重命名操作方法方法一:工具栏操作选中目标序列,点击序列窗口工具栏中的`Name`按钮,在弹出的对话框中输入新名称。方法二:右键菜单操作在工作文件窗口中,右键单击序列名称,选择`Rename`选项,输入新名称。注意事项与规则数据安全性重命名操作仅修改序列的显示名称,不会对序列内部存储的数据造成任何改变或丢失。命名合规性确保新名称符合软件的命名规则,且不能与工作文件中现有的其他对象(如其他序列、方程等)重名。03.数据分析的常用操作表达式、样本运算范围、新序列建立、群对象和图像绘制等核心功能概述表达式基础语法构成构成要素:由数据、序列名称、函数(以@开头,如@mean,@abs)、数学和关系运算符构成。常用运算符:算术:+、-、*、/、^关系:>、<、=、<>、<=、>=逻辑运算符:and(和)、or(或)进行条件组合示例1:条件筛选代码:income>5000andage<=35含义:筛选出收入在5000元以上且年龄小于等于35岁的人群。示例2:分组赋值代码:age<=18then0elseage<=50then1else2含义:根据年龄进行分组赋值(0代表未成年,1代表青年,2代表中老年)。新序列的建立菜单方式:可视化操作通过主菜单Quick->GenerateSeries或工具栏Procs->GenerateSeries打开对话框,输入赋值语句和样本期即可生成。命令方式:高效脚本在命令行直接输入genr命令:genr[新序列名]=[表达式]例如:genrz=3*x-y/2功能特点:灵活强大支持基于已有序列生成新序列,也可直接修改原序列。赋值语句兼容多种数学函数和运算符,满足复杂计算需求。群(Group)对象的创建群的概念群是一个或多个序列的集合,是研究序列间关系的有效工具,可对多个变量进行统一管理和分析。创建方法:菜单方式通过菜单路径:Objects->NewObject选择Group类型,输入序列名。创建方法:命令方式在命令行直接输入指令:格式:group[群名][序列名1][序列名2]...示例:groupkjyx群对象的特点群对象具有动态更新的特性。当群中包含的原始序列数据发生变化时,基于该群对象进行的分析结果会自动同步更新,无需手动重建。群中序列的调用语法规则与示例调用方法通过群名加括号和序号调用特定序列,格式为:[群名](n)其中n是序列在群中的排列次序。具体示例若群kj包含序列y和x,则:kj(1)代表y,kj(2)代表x应用场景与拓展序列生成与修改基于群中已有序列进行计算,生成新序列或修改现有序列。示例:seriesy1=kj(1)+(kj(1)^2)数据分析便捷性在进行复杂数据分析时,通过群名+序号的方式可以快速、精确地引用群中的任意序列,提高代码可读性与执行效率。图像绘制:步骤1-选择序列操作步骤1.打开图像绘制向导通过主菜单`Quick->Graph`路径,启动图像绘制向导工具。2.输入序列名称在弹出的“SeriesList”对话框中,输入目标序列或群组名称。3.注意输入顺序若绘制散点图,输入顺序决定坐标轴:先输入的为横轴,后输入的为纵轴。序列定义对话框图中展示了“SeriesList”输入界面,用户需在此处准确输入需要进行绘图分析的序列名称,例如图中的“xy”。图像绘制:步骤2-设置图像参数01图像类型选择在“GraphType”标签下,选择点线图、条形图、散点图(Scatter)、箱线图等基本类型。02其他参数设置在“Frame&Size”、“Axis&Scale”等标签下,设置边框、坐标轴、图例、标题以优化展示。03操作界面预览04展示效果优化合理设置参数能显著提升图表的可读性与专业度,清晰传达数据背后的信息与趋势。05参数设置原则优先明确图表核心信息,按需选择最适合的类型,避免过度装饰,保持简洁明了。06确认与应用设置完成后点击确认,即可生成符合需求的统计图表,支持导出或进一步编辑操作。案例演示:绘制散点图-结果展示案例目标绘制例1.2中科技支出(y)与GDP(x)的散点图,直观分析两者之间的数量关系。操作回顾在序列列表中准确输入变量`xy`,并在图像类型选项中选择`Scatter`(散点图)类型进行生成。结果解读随着GDP(x)增长,科技支出(y)呈明显上升趋势,表明两者存在较强的正相关关系。散点图结果展示上图为科技支出(Y轴)与GDP(X轴)的散点图分布。数据点整体呈现从左下到右上的分布特征,直观验证了两者的正相关关系,为后续建立线性回归模型提供了可视化依据。04.序列的描述统计分析单个序列的描述统计与检验功能入口与可视化示例访问路径:序列对象窗口→View→DescriptiveStatistics&Tests核心功能:统计量与检验基础统计:输出均值、中位数、标准差、偏度、峰度等。正态检验:提供Jarque-Bera检验结果,判断分布特征。核心功能:统计表格与分组统计量表:以结构化表格形式输出详细描述统计量。分组统计:按分组变量划分样本子集,分别计算统计量。单个序列的假设检验简单假设检验对序列的均值、方差、中位数进行假设检验,可选择t检验、卡方检验等方法。分组齐性检验检验不同分组下序列的均值、方差、中位数是否相等,常用于方差分析。经验分布检验检验序列是否服从特定的理论分布,如正态分布、卡方分布等。假设检验是验证序列特征、组间差异及分布规律的重要统计手段。单因素列联表分析功能介绍:数据离散化将连续的序列值划分为不同的区间,统计每个区间内的观测值数量、百分比及累积量,形成列联表,从而清晰展示数据的分布特征。操作步骤:参数设置打开序列窗口,选择View->One-WayTabulation,设置分组区间和统计量。案例演示:绝对湿度H以绝对湿度序列H为例,展示单因素列联表分析结果,清晰呈现数据在不同区间的频数分布。群对象的简单统计分析群对象创建选中多个序列,右键选择Open/asGroup,即可创建群对象(可自定义命名)。描述统计对群中每个序列分别计算描述统计量,支持“普通样本”(个案删除)和“个体样本”(列删除)两种模式。齐性检验检验群中各序列的均值、方差、中位数是否相等,判断序列间的分布特征一致性。协方差与相关分析计算群中序列之间的协方差矩阵和相关系数矩阵,深入分析变量间的线性关系强度与方向。案例演示:群对象的协方差与相关分析操作步骤步骤一:创建群对象创建包含CONS和INC序列的群对象。步骤二:打开分析界面打开群对象,选择View->CovarianceAnalysis。步骤三:设置输出选项勾选输出相关系数和协方差,点击OK运行。协方差分析设置对话框示例,确认勾选Correlation和Covariance。结果解读案例目标分析北京市居民人均消费支出(CONS)与可支配收入(INC)之间的线性关系。分析结果表表格展示了CONS与INC的协方差及相关系数矩阵。核心结论相关系数为0.9734,表明消费与收入存在高度正相关关系。第二章线性回归分析本章将系统介绍线性回归分析的基本理论、模型检验方法、建模步骤以及在EViews中的具体操作。本章目录01.线性回归概述回归分析基本概念与模型形式02.常规检验统计检验与经济意义检验方法03.建模与操作EViews软件操作与建模流程04.自变量选择掌握t检验、似然比检验等四种选择方法05.预测掌握预测操作、评价指标、稳定性检验06.含定性自变量的回归模型定性变量的处理和结果解释07.分位数回归基本思想、模型设定、参数估计、EViews操作实现01.线性回归概述本节将介绍回归模型的基本概念、分类以及经典线性回归模型的基本假定。回归模型简介定义与一般形式研究客观事物间相关关系,寻找隐藏在不确定现象中的统计规律性。

y:因变量|x:自变量|f(·):回归函数|ε:随机误差模型的分类按表达式:线性回归模型和非线性回归模型按自变量个数:一元回归和多元回归经典线性回归模型的基本假定自变量是确定性变量且彼此不相关。随机误差项服从独立同分布的正态分布(期望0,方差σ²)。样本容量大于参数个数。模型的矩阵形式线性回归模型:y=Xβ+εy(因变量向量):n×1维,包含因变量的所有观测值。X(设计矩阵):n×(p+1)维,包含自变量观测值,首列为1。β(参数向量):(p+1)×1维,包含待估计的回归系数及截距。ε(误差向量):n×1维,包含随机误差项,服从正态分布。矩阵形式将线性回归模型简化为紧凑的代数表达式,不仅书写方便,更重要的是利用矩阵代数工具可以高效地进行参数估计(如最小二乘法OLS)和假设检验,是多元统计分析的基础。参数估计估计方法与原理核心方法:普通最小二乘法(OLS)。基本原理:使随机误差项的平方和最小,即min∑ε²。参数估计公式通过矩阵运算推导,OLS估计量的计算公式为:β̂=(X'X)⁻¹X'y其中X为解释变量矩阵,y为被解释变量向量。估计量的优良性质在满足经典假设的条件下,OLS估计量具有以下性质:无偏性:E(β̂)=β有效性:方差最小的无偏估计一致性:样本增大时收敛于真值02.常规检验本节将介绍线性回归模型的常规检验方法,包括方程显著性检验(F检验)、回归系数显著性检验(t检验)、残差自相关性检验(D.W检验)以及模型拟合优度评价指标(决定系数、AIC、SC等)。F检验:方程的显著性检验检验目的与零假设

若零假设成立,意味着我们选择的自变量整体上无法解释因变量的变化,回归模型是无效的。检验统计量构造F统计量F=SSE/(n−p−1)/SSR/p​该统计量服从自由度为(p,n-p-1)的F分布。其中SSR为回归平方和,SSE为残差平方和。判断标准若F>临界值或p<显著性水平(0.05):拒绝H0,回归方程显著。反之:不能拒绝H0,认为回归方程不显著。t检验:回归系数的显著性检验检验目的检验单个自变量对因变量的影响是否显著,判断变量是否应保留在模型中。零假设(H0)

检验统计量

判断标准若|t|>临界值或p<0.05,则拒绝H0,认为该自变量影响显著。反之则不显著。D.W检验:残差自相关性检验检验目的与假设检验残差序列是否存在一阶自相关性,验证经典假设。零假设(H0):残差序列无自相关(ρ=0)。检验统计量公式D.W.统计量用于衡量相邻残差的变化:D.W.=Σ(et-et-1)²/Σet²取值范围在0到4之间。当无自相关时,D.W.≈2。判断准则与结论0≤D.W.<dL:正自相关dU<D.W.<4-dU:无自相关4-dL<D.W.<4:负自相关dL≤D.W.≤dU:无法判定决定系数:模型拟合优度评价总离差平方和分解(SST)公式:SST=SSR+SSESST:因变量总变动;SSR:自变量解释变动;SSE:随机因素变动。样本决定系数(R²)公式:R²=SSR/SST衡量拟合优度,取值0到1。越接近1,模型对数据的解释能力越强。调整的决定系数(AdjustedR²)公式:R²_adj=1-[SSE/(n-p-1)]/[SST/(n-1)]引入惩罚项修正自变量个数影响,更适合比较不同自变量数量的模型。核心应用与解读R²反映模型解释力,调整R²防止过度拟合。R²接近1:拟合效果好调整R²>R²:模型改进有效信息准则:模型选择的依据主要信息准则AIC(赤池信息准则)公式:AIC=-2L/n+2k/n兼顾模型的拟合度和简洁性,取值越小越好。SC(施瓦茨准则)公式:SC=-2L/n+kln(n)/n与AIC类似,但对模型复杂度的惩罚更重。其他准则与应用HQC(汉南-奎因准则)公式:HQC=-2L/n+2kln(ln(n))/n一种常用的模型选择准则,惩罚力度适中。实际应用策略在比较不同模型时,通常选择AIC、SC或HQC值最小的模型。避免过度拟合,平衡解释力与简洁性。03.建模基本步骤和EViews操作本节将以“我国钢材需求量研究”为例,详细介绍线性回归建模的完整流程,包括数据读入、预处理、模型估计、检验与优化的每一个步骤,并结合大量EViews操作截图进行演示。案例背景:我国钢材需求量研究理论模型设定

模型说明:构建多元线性回归模型,分析多因素对钢材需求的影响。Y代表钢材产量(万吨),作为需求量的替代指标。X1-X8为选取的8个核心影响因素(如能源、投资等)。研究问题与数据来源研究核心:识别并量化影响我国钢材需求量的关键宏观经济与产业因素。数据支撑:选取1999-2021年中国统计数据库的年度数据,确保样本量与时效性。自变量指标体系(X1-X8)X1生铁产量·X2原油产量·X3原煤产量·X4发电量X5铁路货运量·X6固定资产投资·X7居民消费·X8政府消费涵盖能源生产、基础设施、投资消费等维度,全面反映经济活跃度。步骤1:数据读入-创建序列操作步骤详解1.操作路径:在工作文件窗口中,点击Objects->NewObject。2.选择类型:在对话框中选择Series,并命名(如Y,X1等)。3.重复操作:依次创建因变量Y和所有自变量X1至X8的序列。工作文件窗口新建序列对话框💡提示:确保所有变量序列创建完成后,再进行下一步数据导入操作。步骤2:数据读入-导入数据进入编辑状态双击序列名(如Y),点击序列窗口的Edit+/-按钮。复制粘贴数据从Excel复制对应数据,粘贴到EViews序列窗口中。完成数据录入对所有序列(X1-X8)重复操作,完成全部录入。步骤3:数据读入-保存文件操作路径在工作文件窗口中,点击菜单栏的File->SaveAs选项。选择保存位置在弹出的对话框中,选择合适的保存路径(如桌面),并为文件输入一个易于识别的名称。完成保存确认信息无误后点击保存,系统将自动将包含所有数据的工作文件保存为EViews格式(.wf1),方便后续随时调用。保存对话框示例上图展示了保存工作文件时的对话框界面,请注意文件类型需为EViewsWorkfile(*.wf1)。步骤4:数据预处理-绘制散点图(菜单方式)数据绘图流程步骤一:启动绘图功能在软件主窗口菜单栏中,依次点击`Quick->Graph`选项,打开绘图向导。步骤二:输入分析序列在“SeriesList”对话框中输入要分析的序列(如YX1X2)。图形参数配置步骤三:选择散点图类型在“GraphOptions”窗口中,选择`Scatter`类型并设置参数。确认并生成图表检查参数无误后点击“OK”,生成变量间的散点图进行观察。步骤4:数据预处理-散点图结果展示单图展示:自变量与因变量Y将所有自变量与因变量Y的散点图绘制在同一张图上,便于整体观察变量间的相关性趋势。矩阵图展示:变量间多重共线性以矩阵形式展示所有变量两两之间的散点图,直观呈现变量间关系,辅助分析多重共线性问题。散点图分析是数据预处理的关键环节,通过单图和矩阵图的结合,能够快速识别数据特征,为后续建模提供重要依据。步骤4:数据预处理-绘制散点图(命令方式)命令格式:scat[参数]序列名1序列名2...示例1:scatyx1(绘制Y与X1的单变量散点图)示例2:scat(m)yx1x2x3(绘制Y与多个自变量的矩阵散点图)群对象:scat(m)group1(先创建group1,再批量绘图)两个变量的散点图(YvsX1)多个序列的两两散点图矩阵技巧:使用scat(m)参数可快速生成多张图表,相比菜单操作更高效。步骤4:数据预处理-创建图形对象操作路径与设置1.操作路径:Objects→NewObject→选择Graph类型。2.参数设置:在对话框中输入序列,配置图形类型与参数。上图为创建新对象时的选择界面,Graph类型用于生成各类统计图形。图形对象效果展示创建后的图形对象默认显示为动态曲线图,支持多序列对比展示,直观呈现数据趋势与关系。保存与修改机制图形对象会作为独立实体保存在工作文件中,支持随时调用。如需调整样式或数据,双击对象即可打开编辑窗口进行修改,无需重新生成。步骤5:模型估计与结果解读操作路径:在主窗口中,点击Quick->EstimateEquation。方程设定:在方程设定对话框中,输入方程形式ycx1x2x3x4x5x6x7x8,并选择最小二乘法(LS)。结果解读要点:•回归系数(Coefficient):表示自变量每变化一个单位,因变量的平均变化量。•t统计量(t-Statistic)和p值(Prob.):用于检验单个自变量的显著性。通常,p值小于0.05表示该变量显著。•R²(R-squared):衡量模型的拟合优度,越接近1表示拟合效果越好。•F统计量(F-statistic)和p值:用于检验整个回归方程的显著性。步骤6:模型检验与优化显著性检验重点进行两类检验:F检验用于判断方程整体显著性,t检验用于验证单个变量的显著性。相关性与拟合评价自相关性:通过D.W检验判断残差序列是否存在自相关。拟合优度:查看R²和调整后R²,评估模型对数据的解释力。模型优化迭代依据检验结果进行调整:剔除不显著的变量,或尝试不同的模型形式,最终得到更优的模型。04.自变量的选择以“我国钢材需求量研究”为例,掌握t-检验、似然比检验等四种核心筛选方法案例背景回顾与问题提出研究模型

模型说明:构建包含8个自变量的多元线性回归模型,用于解释钢材需求量。其中Y为因变量(钢材需求量),X为各类影响因素。初始回归结果在之前的建模过程中,我们得到了包含全部8个自变量的回归结果。该模型初步拟合了数据,但变量较多,可能存在冗余。核心问题当前模型包含8个变量,需解决以下关键问题:这8个自变量是否都对因变量Y有显著影响?是否存在可以删除的不显著变量?如何科学地筛选出最关键的自变量以简化模型?方法一:t-检验法识别不显著变量方法原理:通过回归系数的t检验p值判断显著性,p值越大,变量越不显著。操作演示:初始回归含8个自变量,其中X1的p值为0.8339(最大)。决策建议:X1系数为0的概率高,应首先考虑删除该变量。关键结论:X1(p=0.8339)是当前最不显著的变量,优先剔除方法一:t-检验法-步骤2:重新建模与评估操作演示删除变量X1后,重新建立包含剩余7个自变量的回归模型。查看新模型的估计结果,确认参数变化。关键评估可决系数(R²):新模型R²与原模型无明显变化,拟合优度未显著降低。新不显著变量:识别新模型中p值最大的变量,准备下一步删除。回归结果展示方法一:t-检验法-步骤3:迭代筛选与最终模型迭代筛选过程重复核心步骤:识别最不显著变量(p值最大)删除该变量并重新建模直至所有系数p值<0.05最终模型结果经过多次迭代,最终得到所有系数均通过t检验的回归模型(图2-28)。模型剔除了不显著变量,保留了核心解释因子。显著性检验评价变量显著:所有系数p值<0.05,通过t检验整体显著:模型F检验的Prob值极小,通过检验拟合优度与自相关拟合效果:R²高达0.99,模型解释能力极强自相关:D.W.值接近2,残差无明显自相关方法二:似然比检验(LR)法-原理与应用理论基础与核心逻辑核心思想:模型比较比较“无约束模型”(全变量)与“约束模型”(去变量)的对数似然函数值,判断被移除变量的显著性。检验统计量LR=-2(lnLr-lnLu)。其中Lr为约束模型似然值,Lu为无约束模型似然值。检验原理:卡方分布原假设下LR服从卡方分布。若P值小于显著性水平,则拒绝原假设,认为变量显著不应删除。EViews操作与实践操作路径1.手动计算:分别建立无约束和约束模型,提取似然值进行计算。2.自动检验:利用软件自带的“遗漏变量检验”或“冗余变量检验”功能,本质均基于似然比原理。应用提示适用于对模型变量进行联合显著性检验,帮助研究者在不同模型规格间进行选择。方法三:遗漏变量检验法-假设与操作核心思想检验当前模型是否遗漏了重要的自变量。原假设是“新增变量是不显著的(即不是遗漏变量)”。步骤1:建立基准模型首先建立一个不包含待检验变量(如X1)的回归模型,例如已有的七元模型,作为后续检验的基准。步骤2:打开检验菜单在方程估计结果窗口中,点击View->CoefficientDiagnostics->OmittedVariablesTest进行检验。检验原理补充若检验结果P值小于显著性水平(如0.05),则拒绝原假设,认为该变量是显著的遗漏变量,应加入模型。关键提示确保基准模型已正确估计,且待检验变量数据完整。检验结果仅作为参考,需结合经济理论判断。应用场景适用于实证研究中模型设定阶段,检验是否因遗漏关键变量导致估计结果偏误,提高模型的稳健性。方法三:遗漏变量检验法-步骤2:输入变量与结果解读操作演示:在“OmittedVariablesTest”对话框中输入待检验变量名“X1”。点击“OK”执行检验,查看输出结果。结果解读:LR统计量的p值为0.7844,远大于0.05。统计量未通过显著性检验。结论:不能拒绝原假设,X1不是遗漏的重要变量,模型中无需包含。方法三:遗漏变量检验法-步骤3:验证结果新增变量后模型估计结果图2-31:EViews输出的回归结果详情,重点关注X1的Prob值。自动验证机制在输出检验结果的同时,EViews会自动展示将X1加入模型后的新估计结果,无需手动重新回归,提高了检验效率。结果验证与结论在新模型中,X1的系数p值依然很大(0.8339),再次证明其不显著。这验证了X1确实不是遗漏变量,基准模型设定合理。方法四:冗余变量检验法-步骤1:提出假设与操作路径核心思想:检验模型中已包含的变量是否为冗余(对因变量无显著解释力)。原假设为“待检验变量是冗余的”,即其系数为0。操作演示(以检验X1为例):1.建立全变量模型:构建包含所有变量(含待检验变量X1)的回归模型(如初始八元模型)。2.打开检验菜单:在方程估计结果窗口中,依次点击View→CoefficientDiagnostics→RedundantVariablesTest-LikelihoodRatio。注:此方法为遗漏变量检验的逆过程,用于剔除模型中不必要的变量。方法四:冗余变量检验法-步骤2:输入变量与结果解读操作演示:输入变量1.在“RedundantVariablesTest”对话框中输入待检验变量“X1”。2.点击“OK”执行检验。检验结果:LR统计量检验结果显示,LR统计量的p值为0.7844,该数值远大于显著性水平0.05。结论:变量处理决策由于p值(0.7844)>0.05,我们不能拒绝原假设。这意味着变量X1对模型的解释力没有显著贡献,属于冗余变量,可以从模型中安全地删除。方法四:冗余变量检验法-步骤3:验证结果自动验证机制在输出检验结果的同时,EViews会自动展示将X1从模型中删除后的新估计结果,无需手动重新进行回归操作。结果一致性验证新模型的估计结果与我们之前通过t检验法得到的七元模型结果完全一致,数据参数无偏差。冗余变量确认结果验证了删除X1的合理性,再次证明X1对模型解释力无显著贡献,属于冗余变量。模型估计结果截图(图2-33)左图为删除X1后的回归结果,可直观看到变量系数、t值等指标与七元模型一致。自变量选择的几点实用建议核心原则建议建议一:一次只检验一个变量同时检验多个变量可能会因部分变量显著、部分不显著而导致误判,无法准确识别单个变量的重要性。操作执行建议建议二:保证样本容量一致用于比较的模型必须基于相同的样本数据。若模型加入滞后变量导致样本期不同,检验结果将失效。建议三:选择合适的操作方式命令方式快捷高效(需熟悉testadd等命令);菜单方式直观易懂,适合初学者。05.预测以“我国钢材需求量研究”为例,演示EViews回归预测流程,掌握预测操作、结果解读、评价指标及稳定性检验。回归预测的基本操作-步骤1:打开预测功能操作前提在进行预测之前,必须确保已经完成了回归模型的建立工作。关键准备:成功建立回归方程对象。模型结果已保存至工作文件中。操作演示1.打开回归模型结果窗口(初始模型或筛选后模型)。2.在窗口工具栏中,找到并点击`Forecast`按钮。功能作用点击该按钮是开启预测流程的关键步骤。系统将弹出预测设置对话框,允许用户对预测范围、预测方法及输出选项进行详细配置。

回归预测的基本操作-步骤2:设置预测参数1.预测值序列名(Forecastname)系统默认在原因变量名后加“f”(如Yf),建议自定义有意义的名称以存放结果。2.预测范围(Forecastsample)样本内:仅回测已有数据,范围设为原样本期(如1999-2021)。样本外:需先扩展工作文件范围,再设置新范围(如1999-2023)。3.输出选项(Output)勾选“Forecastgraph”和“Forecastevaluation”以输出预测图和评价指标。图2-34:EViews预测设置窗口回归预测的基本操作-步骤3:查看预测结果预测图:直观对比预测评价指标:量化评估在输出窗口右侧会列出一系列统计指标,这些指标用于量化评估预测的精度,帮助我们更客观地判断模型效果。预测值序列:数据生成EViews会在工作文件窗口中自动生成一个包含所有预测值的新序列(通常命名为Yf),方便后续进一步分析或使用。预测评价指标-基于预测误差的指标详解均方根误差(RMSE)衡量预测值与实际值的平均平方误差的平方根,对异常值敏感。评价标准:值越小越好平均绝对误差(MAE)衡量预测值与实际值的平均绝对误差,直观反映误差大小。评价标准:值越小越好平均绝对百分误差(MAPE)相对误差指标,不受量纲影响。评价标准:MAPE<10%通常认为精度很高希尔不等系数(TIC)综合指标,取值范围为0到1。评价标准:越接近0预测效果越好预测评价指标-案例指标解读案例指标数值解读MAPE=3.012689%远小于10%,表明预测精度极高,模型拟合效果优秀。TIC=0.0010376非常接近0,表明预测效果极好,误差控制在极小范围。RMSE=1736/MAE=1442绝对误差指标值较小,从侧面印证了预测结果的准确性。预测指标数据详情预测评价指标-误差成分分析偏差率(BP)反映预测值均值与实际值均值的差异,衡量系统性偏差。理想值应接近0。方差率(VP)反映预测值与实际值变异程度的差异。理想值应接近0。协变率(CP)反映无法被前两项解释的非系统性误差。理想值应接近1。案例解读BP=0.000,VP=0.000463,CP=0.999537。预测误差主要来自非系统性因素,效果理想。分析结论系统性误差几乎为零,模型稳定可靠。误差主要源于随机因素,符合理想模型特征。价值与意义误差成分分析帮助我们深入理解误差来源,区分系统性与随机误差,从而有针对性地优化模型。稳定性检验-确保预测可靠性稳定性核心模型参数的稳定性(超样本特性)是预测可靠性的核心基石,决定了模型的长期有效性。不稳定风险若模型在不同时期表现显著不同,说明结构发生变化,继续使用将导致预测结果不可靠。Chow断点检验检验在样本期的某个“断点”前后,模型参数是否发生了显著变化,识别结构突变点。Chow预测检验检验模型对样本外数据的预测能力,判断模型是否适用于外推预测场景。操作路径在方程估计结果窗口中,找到稳定性检验的入口,通常位于“View”菜单下。执行检验点击`View->StabilityTests`,根据研究需求选择相应的检验方法进行执行。06.含定性自变量的回归模型定性变量的概念定量变量指取值有具体数值的变量,通常可以用数值来度量大小和差异。常见例子:国民生产总值(GDP)职工人均年收入北京市月降雨量定性变量描述事物的属性或类别,不是用数值度量的变量。例如:性别(男/女)、职称(高/中/初)历史时期(计划经济/市场经济)回归问题分类自变量含定性变量:本章重点讨论的内容。因变量含定性变量:模型较为复杂,将在第十章专门介绍。名义变量的设立数量化处理:对定性自变量引入只取0和1的名义(dummy)变量,将其转化为可计算的数值形式,是建立回归模型的前提。模型示例(职工工作量):yᵢ=β₀+β₁x₁+β₂Dᵢ+εᵢ,其中Dᵢ取1代表男性,取0代表女性。模型含义:男性平均工作量E(yᵢ|Dᵢ=1)=β₀+β₂+β₁x₁;女性平均工作量E(yᵢ|Dᵢ=0)=β₀+β₁x₁,β₂反映性别差异。重要规则:若事物有m种情况,仅需引入m-1个虚拟变量。若引入m个,会导致完全多重共线性,使最小二乘估计失效。EViews的操作:案例背景与数据研究问题:改革速度影响因素本案例旨在研究采取某项改革措施的速度与企业规模、企业类型之间的关系,分析不同企业特征对改革采纳速度的具体影响。变量定义:指标与类型y(被解释变量):公司采纳措施与给定企业采纳的时间间隔月数。x1(规模):企业总资产额(单位:百万元)。x2(类型):定性变量,1=股份公司,0=非股份公司。模型

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论