回归模型毕业论文_第1页
回归模型毕业论文_第2页
回归模型毕业论文_第3页
回归模型毕业论文_第4页
回归模型毕业论文_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、丽水学院2014屈学生毕业(设计)论文7线性】归模型的研究学院:理学院班级:金触数学10本姓名:俞超迪指导老师:杨毅【摘要】:木文首先对回归分析的定义、主耍内容、基木思想、实现过程进行了阐述.指出了它的优点及存 在的问題。对NBA比赛中的各因素和中国人口的预测进行了研尤。最后对整篇文苹做了个总结。【关键词】:回归分析:回归模型:检验:预测1引言回归分析最早是由19世纪末期髙尔顿(Sir Francis Gal ton)发展的。1855年,他 发表了一篇文章爼为"遗传的身高向平均数方向的回归”,分析父母与英孩子之间身髙的关 系,发现父母的身高越髙或的英孩子也越髙,反之则越坯。他把儿子跟

2、父母身高这种现象拟 合成一种线性关系。但是他还发现了个有趣的现象,高个子的人生岀来的儿子往往比他父亲 綾一点更趋向于平均身高,矮个子的人生出来的儿子通常比他父亲高一点也趋向于平均身 高。高尔顿选用“回归” 一词,把这一现象叫做'向平均数方向的回归”。于是“线形回归” 的术语被沿用下来了。回归分析中,当研究的因果关系只涉及因变量和一个自变量时,叫做一元回归分析;当 研究的因果关系涉及因变量和两个或两个以上自变量时,叫做多元回归分析。此外,回归分 析中,又依据描述自变量与因变量之间因果关系的函数表达式是线性的还是非线性的,分为 线性回归分析和非线性回归分析。按照参数估计方法可以分为主成分回

3、归、偏最小二乘回归、 和岭回归。一般采用线性回归分析,由自变量和规定因变屋来确定变量之间的因果关系,从而建立 线性回归模型。模型的各个参数可以根据实测数据解。接着评价回归模型能否够很好的拟合 实际数据:如果不能够很好的拟合,则重新拟合:如果能很好的拟合,就可以根据自变量进 行下一步推测。回归分析是重要的统计推断方法。在实际应用中,医学、农业、生物、林业、金融、管 理、经济、社会等诸多方而随着科学的发展都需要运用到这个方法。从而推动了回归分析的 快速发展。2回归分析的概述2. 1回归分析的定义回归分析是应用极其广泛的数据分析方法之一。回归分析(regression analysis)确左 两种或

4、两种以上变数间相互依赖的定量关系的一种统汁分析方法。2.2回归分析的主要内容(1) 从一组数据出发,确定某些变量之间的疋量关系式,即建立数学模型并估计其中的 未知参数。估计参数的常用方法是最小二乘法。(2) 对这些关系式的可信程度进行检验。(3) 在许多自变量共同影响着一个因变量的关系中,判断哪个(或哪些)自变疑的彫响 是显著的,哪些自变量的影响是不显著的,将影响显著的自变量选入模型中,而剔除影响不 显著的变量,通常用逐步回归、向前回归和向后回归等方法。(4) 利用所求的关系式对某一生产过程进行预测或控制。回归分析的应用是非常广泛的, 统汁软件包使各种回归方法计算十分方便。2.3 一元线性回归

5、与多元线性回归的分析一元线性回归模型,是分析两个变量之间相互关系的数学方程式,其一般表达式为 y=a+bx式中,y表示因变量的估计值,x表示自变量,a.b称为回归模型的待泄参数,其中b 又称为回归系数。上述的回归方程式在平而坐标系中表现为一条宜线即回归直线。当b>0 时y随x的增加而增加,两变量之间为正相关关系;当b<0时,y随x的增加而减少, 两变量之间为负相关关系;当y为一个常疑时,不随x的变动而变动。这样就为我们判断现 象之间的关系,分析现象之间是否处于正常状态提供了一条标准。多元线性回归模型旨在分析两个或者两个以上的自变量作用后产生的结果,即多个自变 量下的因变量结果,研究

6、的是随机变量y与多个普通变M xi.X2. -xP, (pM2)尚相关关系。表 达式为y= 3 o + P iXi + B 2X2+B pXp+ £ ,对随机误差项£常假定E( e )=0,Var( £ )= 0 2»并且 称E(y)= Bu+fhx】 + B2X2+BpXp为理论回归方程。在实际应用中,如果获得n组观测数 据(血Xip;yi),i=l,2,n,则线性回归模型变为 y=Bo + B 1 x.i +82X42+. P Pxip + £ ,。并且,量y与自变量x之间的关系往往是非线性关系,而不是简单的线性关系。但在非线性 回归分析研

7、究实际问题时,往往选择可以通过一沱变换后能转换成线性关系的研究模型,从 而避免了非线性回归分析的计算的复杂性。随着技术的不断进步,研究过程中经常运用到计 算机,复杂的非线性回归分析模型也将被应用在研究中,而且会越来越频繁。丽水学院2014屈学生毕业(设计)论文2.4回归分析的基本思想在回归分析中,把变量分为两类。一类是因变屋,它们通常是实际问题中所关心的一类 指标,通常用Y表示:而影响因变量取值的的期一类变量称为自变量,用X来表示。回归分析研究的主要问题是:(1)确左Y与X间的泄呈:关系表达式,这种表达式称为回归方程;(2)对求得的回归方程的可信度进行检验:(3)判断自变量X对因变量Y有无影响

8、:(4 )利用所求得的回归方程进行预测和控制。2. 5回归分析的实现过程(1)确立变量:明确预测的具体目标,也就确左了因变量。如预测具体目标是下一年度 的销售疑,那么销售量Y就是因变量。通过市场调查和査阅资料,寻找与预测目标的相关 影响因素,即自变量,并从中选出主要的影响因素。(2)建立预测模型:依据自变量和因变量的历史统计资料进行计算,在此基础上建立回 归分析方程,即回归分析预测模型。(3)进行相关分析:回归分析是对具有因果关系的影响因素(自变量)和预测对象(因 变量)所进行的数理统计分析处理。只有当变量与因变量确实存在某种关系时,建立的回归 方程才有意义。因此,作为自变量的因素与作为因变量

9、的预测对象是否有关,相关程度如何, 以及判断这种相关程度的把握性多大,就成为进行回归分析必须要解决的问题。进行相关分 析,一般要求岀相关关系,以相关系数的大小来判断自变量和因变量的相关的程度。(4)II-算渓差量:回归预测模型是否可用于实际预测,取决于对回归预测模型的检验和 对预测误差的讣算。回归方程只有通过各种检验,且预测误差较小,才能将回归方程作为预 测模型进行预测。(5)确立预测值:利用回归预测模型计算预测值,并对预测值进行综合分析,确疋最后 的预测值。2.6回归分析的优缺点回归分析的优点是在分析多个因素模型的时候,更加的简单有效,可以准确的计量多个 因素之间的相关程度与回归拟合程度的髙

10、低,从而提髙预测方程式的准确性。但有时候在回 归分析中,选用何种因子和该因子采用何种表达式只是一种推测,这影响了因子的多样性和 某些因子的不可测性,使得回归分析在某些情况下受到限制。3回归分析的应用3.1 一元线性回归分析中国人口发展的第四个髙峰期是在新中国建立之后的50年。在这一时期里,中国人口 的大展呈现着许多复杂的特点,而且这些特点都与中国历史时期人口有着密切的关系 人口问题一直是一个全球性问题,也是中国经济社会发展和可持续发展的一个基本问题。 2010年,中国人口总数已经达到134091万,全世界大约683059万人。全世界平均五个人 中就有一个是中国人。中国人口的特点是基数大、冇龄人

11、群和农村人口的比重髙、增长速度 较快而且地区分布不均匀。虽然中国人口基数大,但是每年净增人口数也很大。那么未来人 口增长趋势如何呢,未来男性比重、人口老龄化趋势、城市人口比重又如何呢?査阅大呈:资料得到以下数据年份总人口(万)男性人口比重()城市人口比重()199612238950.8230.48199712362651.0731.91199812476151.253335199912578651.4334.78200012674351.6336.22200112762751.4637.66200212845351.4739.09200312922751.5040.53200412998851

12、.5241.76200513075651.5342.99200613144851.5244.34200713212951.5045.89200813280251.4746.99200913345051.4448.34201013409151.2749.95201113473551.2651.273丽水学院2014届学生毕业(设汁)论文135COD-13250D- 总 13CG0D-口12750D-125G0D-122S0CT丿力年总人Ilf枚点图19&S3300201S20102035年价观察历年总人口散点图,发现变量间呈线性相关趋势,所以应该选取一元线性回归的方法。通过spss软件回

13、归分析得到下图模型拟合度检验模型汇总b模型RR方调整R方标准估计的误 差1.995*.990.989393.666a. 预测变量:(常址),年份°b. 因变量:总人口其中第二列R表示复相关系数,其反映的是自变量与因变量之间的密切程度。英值在0到1 之间,越大越好。第三列R方是复相关系数的平方,又称决上系数。通过观察这几个数据, 可知拟合情况很好。方差分析表Anovaa模型平方和df均方FSig.回归217948139.1361217948139.1361406.364000b1残差2169618.30114154972.736总计220117757.43815a. 因变虽:总人口b.

14、 预测变虽:(常虽),年份。从上图中可知,回归模型的Sig值为0,说明该模型有显著的统讣意义。系数°模型非标准化系数标准系数tSig.B标准误差试用版(常虽)1474830.96342773.88434.480.000年份800.64021.350.99537.502.000a.因变址:总人口根据上图得到拟合的结果为总人口二年份*800.640-1474830.963o 但是一个完整的回归分析过程还包括利用残差分析,对拟合结果进行检验。下图中所示的是 与残差值有关的一些统讣量,包括预测值及标准化的预测值、残差及残差的预测值的最小值、 最大值、均值、标准差和样本值。这些数据中无离群值,

15、且数据的标准差也比较小,可以认 为模型是健康的。残差统计量°极小值极大值均值标准偏差N预测值123245.89135255.48129250.693811.80716残差-856.890403.272.000380.31716标准预测值-1.5751.575.0001.00016标准残差-2.1771.024.000.96616a.因变址:总人口对于模型的检验,除了分析残差统il涅之外,还可以直接作出标准化残差值的直方图和正态 P-P图来观察其是否服从正态分布。如下图所示,由于残差具有正态分布的趋势。因此可以 认为这里的回归模型是恰当的。rt力图;灯2飯曰3回归标准化残羞的标准PFI

16、8I因变雄:总人口b0002040.608 1观対的/枳做率观察历年城市人口比重散点图,发现变虽间呈线性相关趋势,所以应该选取一元线性回归的 方法。城市人ri比重做戊團5500-5000-城市人口比至45 DO-4000-3500"3000-199520002035年份20102015通过spss软件回归分析得到下图模型拟合度检验模型汇总b模型RR方调整R方标准估计的误 差11.00031.0001.00013627a.预测变量:(常量),年份。b因变址:城市人口比重通过观察这几个数拯可知拟合度很好。Anova®模型平方和df均方FSig.回归643.0461643.046

17、34629.231000b1残差.26014.019总计643.30615a. 因变虽:城市人口比重b. 预测变量:(常量),年份。回归模型的Sig值为0,说明该模型具有显著的统计意义。系数°模型非标准化系数标准系数tSig.B标准误差试用版(常 fit)2714.34214.806-183.322.000年份1.375.0071.000186.089.000a.因变虽:城市人口比重拟合的结果为城市人口比重=年份*1.375-2714.342。同样可以通过以上两种方法对拟合结果进行检验,发现该回归模型是恰当的。结论通过建立回归模型可以预测未来几年内中国人口,中国人口一直呈现上升趋势,

18、上升 速度基本平缓,没有出现很大的波动,但上升幅度有略微的下降。同样通过回归模型能够预 测未来几年内中国城市人口比重,中国城市人口比重也一直呈现上升趋势,上升速度快,城 市人口越来越多,已经超过50%,未来几年内还会继续上升,没有下跌的趋势,而且上升 幅度基本不变。结合实际情况,比如"计划生冇”方而可以改善一下,适当的放宽要求。3.2多元线性回归分析篮球运动是一项热门的竞技体育运动项目,由两队参与的球类运动。篮球比赛强调篮球 运动员之间的配合来完成比赛。而篮球运动对运动员的技战术和身体素质要求越来越髙,尤 其是当今世界篮球水平最髙的联赛是美国的国家篮球协会(NBA),其对技术的要求比

19、起英 他赛事更髙。优秀的篮球技术是战术运用的基础。传统上把篮球技术分为进攻技术和防守技 术两种,包括移动动作、控制球权、支配球权和争夺球权,当然也包括由这些动作随意组合 9丽水学院2014届学生毕业(设汁)论文所组成的动作体系。众所周知,影响每一场比赛胜负的原因有很多,既有偶然性,但更多的 是必然性的。那么是哪些主要的技战术动作主导着NBA2012-2013赛季季后赛每支参赛球队 的最终排名呢?从而能够提髙这些技战术动作能力来提髙排名。通过对NBA2012-2013赛季 季后赛数拯的进行回归分析就能得到答案。NBA季后赛是世界最髙水平的比赛,各支球队以夺取总冠军为最髙荣誉和目标,而且 NBA比

20、赛也为各支球队的战术、实力的表现提供了平台。之所以NBA的吸引力大是因为比 赛精彩,战术、球员能力高。根据NBA中文官方网站提供的数据统讣情况,发现有总投篮 出手、投篮命中率、三分球命中率、罚球命中率、助攻、得分六项指标来评价球队进攻能力。 发现有篮板、抢断、盖帽、失分四项指标来评价球队的防守能力。发现有失误、犯规、失格 三项指标来评价球队的违规控制能力。NBA2012-2013赛季季后赛各球队进攻能力六项指标成绩球队总投篮出手投篮命中三分球命中率罚球命中助攻得分总冠军热火76.60.4680.40.76820.697.1四部冠军马刺82.20.4630.40.76321.9100.3四部决赛

21、灰熊81.50.418030.74819.394.7东部决赛步行者7&50.433030.74017.591.8第二轮雷霆81.60.427030.8381&19&5第二轮勇士84.40.4620.40.73621.7102.7第二轮公牛79.90.438030.72019.591.9第二轮尼克斯81.00.410030.78215.188.6第一轮老鹰77.30.422030.68217.089.3第一轮篮网83.70.442030.75820.299.4第一轮凯尔特人8230.413030.86016.890.6第一轮雄鹿76.80.433030.63019.893

22、.2第一轮火箭81.00.424030.7111&0100.0第一轮快船7530.467030.7821&094.7第一轮掘金84.80.438030.73021.2103.0第一轮湖人7&00.4420.30.6081&585.3NBA2012-2013赛季季后赛各球队防守能力四项指标成绩球队篮板抢断盖帽失分总冠军热火38.1&35.490.7西部冠军马刺42.67.95.0933四部决赛灰熊41.7734.694.1东部决赛步行者45.65.44.591.6第二轮雷霆42.96.07.097.1第二轮466.44.9102.5第二轮公牛40.86.4

23、4.698.6第二轮尼克斯39.5&84385.9第一轮3&3733.894.5第一轮篮网42.1635.697.4第一轮凯尔特人39.05.53.087.7第一轮雄鹿34.810.02.5100.0第一轮火箭43.55.85.5105.8第一轮快船37.25.25.7100.2第一轮掘金38.79.02.8107.2第一轮湖人40.05.853104.0NBA2012-2013 W季季后赛各球队违规控制能力三项指标成绩球队失误犯规失格总冠军热火13.122.20四部冠军马刺12.919.10.0西部决赛灰熊10.722.10东部决赛步行者16.422.40.2第二轮13.62

24、4.90.3第二轮勇士16.523.80.3第二轮公牛14.322.40.6第二轮尼克斯11.623.80.4第一轮老鹰12.224.20.2第一轮篮网11.619.90.3第一轮凯尔特人17.31&80.3第一轮雄鹿16.319.80.0第一轮火箭15.823.20.0第一轮快船13.327.80.2第一轮掘金14.523.20.3第一轮湖人16.517.50.0NBA2012-2013赛季季后赛各球队名称排名情况的影响因素分析(1)确定彫响NBA2012-2013赛季季后赛各球队的排轻情况模型。NBA2012-2013赛季季 后赛各球队名称排名情况是综合因素的反映,令热火为第一名,

25、马刺第二名,灰熊跟步行者 并列第三名,雷霆、勇士、公牛、尼克斯并列第五名,老鹰、篮网、凯尔特人、雄鹿、火箭、 快船、掘金、湖人并列第九。设成绩为因变量Y.设总投篮出手、投篮命中率、三分球命中 率、罚球命中率、助攻、得分、篮板、抢断、盖帽、失分、失误、犯规和失格为自变量,分 别为 X, X2, X3, X, Xs, X6, X" Xs, X" Xio, X1H Xl2, X13o(2)首先,分析各个待选变量的特制,以及对排名的影响程度,相关系数显著性检验代表 解释变量X与被解释变量Y之间的相关程度,它越靠近1,说明两者相关程度越高,可以 利用SPSS逐步筛选的方法进一步完成回

26、归方程的建立。依据下表可知,模型2的相关系数 显著性检验R为0.606,决左系数R方为0.368,调整的决左系数为0.323:而模型2的相关 性系数检验R为0.742,决左系数R为0.550,调整的决左系数为0.481,各值都比模型1更 加接近于1。所以模型2更加适合做线性回归模型,而且主要影响因素为X3和Xk>,英他因 素经分析可以不考虑。模型汇总模型RR方调整R方标准估计的误差1606.368 3232.4552742».550.4812.149a. 预测变虽:(常虽).X3。b. 预测变虽:(常盘).X3. X10。(2)建立NBA2012-2013赛季季后赛各球队的名次

27、排名情况回归方程。从下表中可知:各 列数据依次是非标准化回归系数B、非标准化回归系数的标准误差、标准化回归系数、回归 系数显著性检验中T统计疑的观测值、对应的概率sig。因为常疑sig值太大,所以选择标 准系数,误差小,即自变量X3三分球命中率为-0.558,自变SXio失分为0.429“由此可知 回归方程为 Y=-0.316-0.558X3+0.429Xioo系敬模型非标准化系数标准系数tSig.共线性统计虽B标准误澄试用版容差VIF(常虽)120.6155.0494.083.001X3-44.87215.723-.606-2.854.0131.0001.000(常塑)-.31610.142

28、-.031.9762X3-41.32013.855-.558-2.982.011.9881.013X10.204.089.4292.293.039.9881.013a.因变虽:YNBA2O12-2O13赛季季后赛各球队成绩排名与冬次回归方程的Y分析。依据对NBA2012-2013赛季季后赛各球队的名次回归方程Y与比赛成绩排名进行分析,各队需次回归方程Y排序情况与比赛成绩排名具有一立程度的相关关系,以NBA2O12-2O13赛季季后 赛各球队的成绩做为效标,爼次回归方程得分值排序情况Y与比赛成绩进行分析,经检验P 小于0.01,本研究名次回归方程较好地反映NBA2012-2013赛季季后赛各球队

29、的比赛成绩。 因此,各队教练员可以根据该方程的影响因素及影响程度,并结合球队实际情况分析自己球 队跟英他球队相比所存在的优势及不足,从而针对性的进行技术训练,自己球队有优势的地 方要保持并扩大,自己球队不足的地方得抓紧弥补,追上其他球队的步伐。军赛赛军冠决决轮轮轮轮轮轮轮轮轮轮轮轮 绩冠部部部二二二二一一 一一一 一一一 成总西西东笫笫笫笫笫笫笫笫笫笫笫笫者斯 特队火刺熊行克霆牛士尔鹰网鹿船人箭金球热马灰步尼雷公勇凯老篮雄快湖火掘名次回归方程Y名次回归方程Y排序38.3711339.4865539.8855638.813436.3677141.1725841.816943.43331337.1

30、399240.0571741.30121042.41661142.5024124413261444.90481545.505416结论与建议(1)从NBA2012-2013赛季季后赛务球队的技术数据分析出各队成绩回归方程Y排序情况 的彫响因素很多,其中主要影响的是三分球命中率和失分两项指标。(2)对NBA2012-2013赛季季后赛各球队的技术数据进行逐步回归分析,其有效性较高, 教练员可以根据回归分析的结果进行针对性的训练,比如说可以加强球队的三分球能力,可 以加大三分球训练的时间,可以多磨练球队的防守能力,防止球队的失分变多,使球队失分 控制在有利范用。(3)NBA2012-2013赛季季

31、后赛各球队的成绩回归方程排序情况与比赛成绩具有一定程度 的相关关系,回归方程能较好地反映出NBA2012-2013赛季季后赛各球队的比赛成绩。4结束语回归分析在实际应用有很大的作用,在分析多个因素模型的时候,更加的简单有效,可 以准确的汁量多个因素之间的相关程度与回归拟合程度的髙低,从而提高预测方程式的准确 15丽水学院2014届学生毕业(设汁)论文性。也可以分析一个因素建立模型,通过模型可以进行预测,而且预测值误差小,所以说回 归分析对实际应用有着重要的意义。参考文献1 李惠林.中国国家女子篮球队技术指标与比赛成绩的相关分析J.中国体育科技, 2007(4): 72-762 王路德.体育统计

32、方法与运用M.北京:人民体育出版社,2008: 120-1273 薛薇.SPSS统计分析方法及应用M.北京:电子工业岀版社,2009 : 246-2684 何志林,邓达之,余吉成,等.现代篮球M.北京:人民体育出版社,2000: 28 -295 NBA 中国官方网站:6 吴福珍、王晓军.应用Matlab软件对NBA赛程进行利弊分析J.电脑开发与应用, 2011(3):1417.7 王建国.NBA制衡机制的研究D.北京:北京体育大学,2011.8 张志谦.浅谈20112011赛季NBA总决赛各项技术统计对比赛胜负的影响J.内蒙古 体育科技,2011 (2):9394.9 吴福珍.应用Matlab软件对NBA赛程进行利弊分析,电脑开发和应用,2009 (3 )10 冯力.回归分析方法原理及SPSS实际操作M.北京:中国金融出版社,2004.11 刘伟铭等.基于多元回归分析的事件持续时间预测J.公路交通科技,2005, 22(11): 126-129.12 徐海量等.塔电木河下游坏境因子与沙漠化关系多元回归分析J

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论