体育统计教程 雷福民 权德庆 第7章 回归分析新_第1页
体育统计教程 雷福民 权德庆 第7章 回归分析新_第2页
体育统计教程 雷福民 权德庆 第7章 回归分析新_第3页
体育统计教程 雷福民 权德庆 第7章 回归分析新_第4页
体育统计教程 雷福民 权德庆 第7章 回归分析新_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

在线教务辅导网:更多课程配套课件资源请访问在线教务辅导网1第7章回归分析多元线性回归分析线性回归分析SPSS例解3一元线性回归分析127.1一元线性回归分析在研究两个变量之间的关系时,一般是先将两个变量的n对观察值所对应的点在直角坐标系中做出散点图,当散点图呈直线趋势时,也就是两变量具有直线相关关系时,从专业知识角度分析两个变量间存在因果关系,常把其中的原因变量叫自变量,用X表示,而把结果变量〔依赖于X而变化的量〕叫因变量,用Y表示,这时可采用一元线性回归分析法。7.1.1模型的求法1.理论回归模型从理论上讲因变量与自变量的线性关系可用下式表示:(7-1)式7-1中,和是固定的但未知的参数,是常数项,是理论回归系数;是随机误差项,它可由多种因素引起。对于每一组可以观察到的因变量、自变量数值,式7-1可以表示成:(7-2)其中,假定各个是互不相关的,其总体均值0,总体方差为。2.实际回归模型的求法7.1.2回归模型的检验利用样本数据建立回归模型时,做以下几种假定:①变量X与Y存在线性关系;②回归余项线性独立;③回归余项服从正态分布,即。在这种条件下得到的估计值a、b是参数、的最小方差无偏估计,但尽管这些估计值是较理想和实用的,但此回归模型是否合理,以及回归模型的优劣需要被评价,回归模型的检验就是用各种统计检验方法来判别模型的实用性。1.回归方程的检验〔方差分析〕在计算时,常用如下公式:〔7-10〕上述回归方程检验问题常总结于方差分析表〔简称ANOVA〕中,由表7-2给出。2.回归系数的检验

建立回归方程后,不仅可以用方差分析法检验回归方程的效果是否显著,还可以通过与其等价的回归系数的t检验方法得到判别。3.回归剩余标准差的检验〔1〕回归剩余标准差的检验回归残差有助于衡量回归模型拟合样本数据的程度。应用线性回归分析,需要计算回归剩余标准差,回归剩余标准差是表示回归方程用来预测的精度标志,可用来检验模型预测的可靠程度。回归剩余标准差记作:〔7-12〕

注意:在体育科研中一般都是进行微观研究,比方预测运发动的运动成绩,这时用回归方程进行预测的效果通常不能满足实际需要,回归方程的预测对于宏观研究效果会更好。4.拟合优度检验

7.2多元线性回归分析7.2.1模型的求法1.理论回归模型2.实际回归模型的求法

式7-15写成矩阵形式,其中:

注意:在求多元回归方程的回归系数时,要求自变量之间不能存在线性关系,在应用中应多加注意。7.2.2回归模型的检验1.回归方程的检验〔方差分析〕2.回归系数的显著性检验3.拟合优度检验

7.2.3异方差问题1.异方差产生的原因体育社会现象是错综复杂的,因而在建立回归模型时,经常会出现某一因素或一些因素随着解释变量〔自变量〕观测值的变化而对被解释变量〔因变量〕产生不同的影响,导致随机误差项产生不同的方差;当样本数据为时间序列数据时也会出现异方差,因为此时随机误差项会随时间而变化;异常值〔离群点〕会导致异方差;用样本平均数作为样本数据时也会出现异方差;等等。2.异方差带来的问题当在多元回归分析时存在异方差问题时,仍用普通的最小二乘法求回归系数,将会使最小二乘法的使用的有效性遭到破坏。会使得到的回归系数估计值虽是无偏的,但不满足渐近有效性,并使得参数的显著性检验失效,使得到的回归方程效果不理想。3.异方差的诊断方法关于异方差的诊断,统计学家进行了大量地研究,目前,已有很多种方法问世,但没有一种最权威的方法。常见的诊断方法有残差图分析法、数据变换法、加权最小二乘法、基于得分统计量的异方差检验法等等,在此只介绍常用的残差图分析法。残差图分析法是一种直观、方便的分析方法,它以残差为纵坐标,以任何其他的量为横坐标画散点图。常用的横坐标有:以拟合值为横坐标、以为横坐标、以观测时间或序号为横坐标。一般情况下,当模型满足所有假定时,残差图上的n个点的散布应是随机、无任何规律的。如果回归模型存在异方差,残差图上的点的散布会呈现出一定的趋势。残差图分析法缺点是凭主观判断有其随意性。4.异方差问题的处理方法当进行回归分析时诊断出存在异方差性时,不宜用普通最小二乘法求回归方程,必须对原来的模型进行变换,使变换后模型的随机误差项满足同方差的假定,然后才能得到理想的回归模型。在SPSS软件中提供了加权最小二乘法〔WeightedLeastSquare,即WLS〕。7.2.4多重共线性问题1.多元共线性问题产生的原因多重共线性问题在体育研究中常常会遇到。例如,要研究百米跑运发动的运动成绩,影响百米跑运动成绩的因素有很多,如步幅、步频、起跑时间、加速跑时间、途中跑时间、终点冲刺跑时间等,这些因素显然对运发动百米跑成绩产生重要影响,而它们之间又有很强的相关性。又如在居民体育消费额的回归分析中,选择家庭收入、家庭储蓄、家庭人口、前期消费额等作为自变量时,这些自变量间也存在很强的相关性。从这些例子可以看出,在研究体育运动、社会经济现象等问题时,由于问题本身的复杂性,涉及的因素很多,在建立回归方程时,往往很难在众多的因素中找到一组互不相关又对因变量有显著影响的自变量,会不可防止地出现多重共线性问题。2.多重共线性的影响当多重共线性存在时,任何一个自变量的回归系数,依赖于包括在模型中的其它自变量,所以回归系数并不反映方程中任何一具体自变量对因变量的影响,且其方差较大,使回归系数不能令人满意。存在多重共线性时,一个自变量引起总离差平方和的减少必须看作是与包括在同一方程中的其它自变量相关联。此外多重共线性还会影响预测值的方差,但其效果不太明显。3.多重共线性的识别〔1〕非正式方法在进行多元回归分析中,如果以下情况存在时往往说明存在多重共线性:①模型中增加或删除一个自变量,回归系数值会发生较大变化;②回归模型的检验通过,而有的回归系数的检验未通过;③一些重要的自变量在回归方程中没有通过显著性检验;④有些自变量的回归系数值的符号与实际经验相反时;⑤自变量的相关阵中,两个自变量的相关系数较大时。〔2〕正规识别方法①判定系数法②特征值法④方差膨胀因子⑤容忍度4.消除多重共线性的方法进行多元回归分析中,如果发现了多重共线性,可采用下面几种常用方法消除多重共线性。删除共线性组中与因变量相关系数小,而与其它自变量高度相关的变量,然后重建回归方程;增大样本含量;采用岭回归、主成分回归和偏最小二乘法一类有偏估计的方法;等等。7.2.5自变量的选择问题1.选择自变量的统计学标准1〕残差平方和最小,等价于复相关系数或判定系数最大。2〕残差均方或剩余标准差最小,等价于调整的最大。3〕其他的还有准那么〔统计量最小〕、准那么等。2.变量的选择方法1〕向前选择法〔Forward〕:向前选择法的初始模型中没有变量,自变量有少到多一个一个引入回归方程。2〕向后削去法〔Backward〕:自变量由多到少一个一个从方程中剔除。首先对全部后选变量作总的回归,每次剔除一个偏回归平方和最小又能使F检验不能拒绝者,直到再不能剔除为止。3〕逐步回归法〔Stepwise〕:逐步回归法是向前选择法和向后削去法策略的综合。逐步回

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论