(论文)NBA球员综合能力的统计分析 论文(2013年优秀毕业设计论文)_第1页
(论文)NBA球员综合能力的统计分析 论文(2013年优秀毕业设计论文)_第2页
(论文)NBA球员综合能力的统计分析 论文(2013年优秀毕业设计论文)_第3页
(论文)NBA球员综合能力的统计分析 论文(2013年优秀毕业设计论文)_第4页
(论文)NBA球员综合能力的统计分析 论文(2013年优秀毕业设计论文)_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本科毕业论文NBA球员综合能力的统计分析摘 要:本文利用多元统计分析的相关知识对NBA 球员综合能力进行聚类,因子等分析,从而给出球员综合能力的评价并向球员提供一些关于提高篮球综合水平的建设性意见. 进而给球队经理等高层对球员交易及球队管理一些意见、建议,以提高球队的水平. 模型结果表明球员综合能力主要体现在进攻端和防守端的能力,所在球队的战绩.关键词:聚类分析; 因子分析; MVP1引言在NBA中对球员综合能力的评价是联盟,球队管理高层,球迷等人非常关心的一件事.联盟利用各种各样的奖项来评价球员的素质,比如常规赛MVP,最佳新人,进步最快球员,最佳防守球员等等,但是这些指标都不能完全体现一个球员的综合素质;而且这些奖项是由美国国内资深体育评论员、体育记者及NBA 技术官员投票选举产生的,人为的因素不可忽略,同样缺乏一套科学而严谨的评选体系. 在NBA 赛场上,临场技术统计的单项技术指标能从一个侧面反映一位篮球运动员的比赛能力. 但是,其单一性和局限性决定了它无法对篮球运动员的比赛能力给与客观的综合的评价. 本文就利用多元统计的相关知识给出球员综合素质的评价,以及相关指标.MVP(Most Valuable Player)是衡量一个球员价值的体现,往往体现了球员的各方面的素质. 此奖项以NBA第一任主席莫里斯.波多洛夫命名,NBA最有价值球员MVP奖杯叫做“莫里斯.波多洛夫杯”. 从1955-1956赛季开始评选,在1979-1980赛季以前由球员投票产生,1980-1981赛季开始由体育记者和电视评论员投票产生. MVP评选标准最重要的3点:1.率领球队取得好成绩;2.身为球队的核心作用要立竿见影;3.能够使队友变得更好.无论是常规赛MVP还是总决赛MVP,对球员来说都是一个最好的嘉奖,都是一个至高的荣誉,是很有意义的一个奖项. 然而在资格人员的评选的过程中,虽然参考了很多表面的数据,但是总会避免不了人为因素,本文就是借助多元统计分析方法(聚类分析,因子分析)客观的评选出谁才是最合适的MVP. 借助多元统计分析评选出MVP和评选出其他奖项(最佳新人,进步最快球员,最佳防守等等)在分析过程上基本上是一致的,只是衡量的指标不一样,本文仅介绍MVP的评选过程.2 聚类分析与因子分析的基本思想及方法由历史数据以及相关经验,MVP奖的得主必定是跻身季后赛16支球队的一员(新秀除外),而且是这16支球队中的佼佼者,领军人物. 本文对2008-2009 NBA常规赛16支进入季后赛的球队的领军人物的数据进行聚类分析和因子分析,以得到最终的MVP. 下面介绍聚类分析和因子分析的基本思想和方法.2.1 聚类分析的基本思想由于样品之间往往存在程度不同的相似性,因此在此基础上可以具体找出一些能够度量样品之间相似程度的度量值,并按相似程度的大小分类:关系密切的类聚集到一个小的分类单位,关系疏远的类聚集到一个大的分类单位,直至所有的样品都聚集完毕,把不同的类型一一划分出来,形成一个亲疏关系谱系图,以更直观地显示分类对象.2.2聚类分析的方法聚类分析的内容十分丰富,按其聚类的方法可分为以下几种:系统聚类法、调优法(动态聚类法)、最优分割法、模糊聚类法、图论聚类法、聚类预报法等.聚类分析根据分类对象的不同又分为型和型两大类,型是对指标进分类,型是对样品进行分类.2.3因子分析的基本思想因子分析是多元统计分析中降维的一种方法,因子分析是研究相关阵或协方差的内部依赖关系,将多个变量综合为少数几个因子,以再现原始变量与因子之间的相关关系.2.4 因子分析的方法因子分析需要构造因子模型,因子模型包括因子载荷,变量共同度,公共因子. 因子载荷就是第个变量和第个公共因子的相关系数;变量共同度反映变量对公共因子依赖的程度;公共因子方差贡献表示衡量第个公共因子相对重要性的指标.2.5 因子分析的前提条件因子分析的目的是从众多的原有变量中综合出少数具有代表性的因子,这就必须有一个潜在的前提条件,即原有变量之间具有较强的相关关系,运用以下两种方法检验:(1) 巴特利特球度检验(Bartlett test of sphericity). 巴特利特球度检验以原有变量的相关系数矩阵为出发点,其原假设为:相关系数矩阵是单位阵. 巴特利特球度检验的检验统计量是根据相关系数矩阵的行列式计算得到,如果该统计量的观测值比较大,且对应的概率P-值小于给定的显著性水平,则应拒绝原假设,认为原有变量适合作因子分析,反之认为不适合作因子分析.(2) KMO检验. KMO检验统计量是用于比较变量间简单相关系数和偏相关系数的指标,KMO统计量的取值在之间,当所有变量间的简单相关系数平方和远远大于偏相关系数的平方和时,KMO值接近1,意味着变量间的相关性强,原有变量越适合作因子分析,反之KMO值接近0,不适合作因子分析. 常用的度量标准为:0.9以上表示非常适合;0.8-0.9适合;0.7-0.8一般;0.6-0.7不太适合;0.5以下极不适合.3 系统聚类法的步骤在本文中,选用聚类分析的方法是系统聚类法.(0) 数据变换.(1) 计算个样品两两间的距离,得样品间的距离矩阵.(2) 初始个样品各自构成一类,类的个数,第类.(3) 对步骤得到的距离矩阵,合并类间距离最小的两类为一新类.(4) 计算新类与其他类的距离,得到新的距离矩阵.(5) 画谱系聚类图.(6) 决定分类的个数及各类的成员.4 数据资料及其解释表1 2008-2009NBA常规赛球员数据表 变量球员X1X2X3X4X5X6X7X8X9L.James 37.728.448.97.577.251.691.152.980.81M.Williams 3517.846.73.444.060.81P.Pierce 37.520.545.75.643.630.990.332.810.756R.Allen 36.418.2483.522.760.86D.Howard 35.720.657.213.841.420.972.923.040.72J.Johnson 39.521.443.74.385.761.060.242.470.57D.Wade 38.647.462.191.343.440.52A.Iguodala 39.918.847.35.745.291.60.442.710.5B.Gordon 36.620.745.53.453.40.870.272.440.5R.Hamilton 3418.280.453.094.430.60.061.990.47KBryant 36.126.871.460.452.560.79P.Gasol 3718.956.79.633.510.6411.940.79C.Pillups 35.317.741.82.976.350.66C.Anthony 34.522.844.36.823.361.140.363.020.66T.Parke 34.1290.930.062.580.66T.Duncan 33.619.350.410.673.520.511.682.20.66B.Roy 37.222.6484.781.950.66M.Yao 33.619.754.89.881.780.393.043.340.65D.Nowitzki 37.725.947.98.412.430.750.781.940.61C.Paul 38.522.850.35.5411.042.770.132.960.6D.Williams 36.819.440.472.8710.661.070.293.350.59其中,9 个变量分别为-上场时间,-得分,-命中率,-篮板,-助攻,-抢断,-盖帽,-失误,-球队胜率. 以上球员都是16支进入季后赛的球队的领军人物(此数据来自于NBA 官方网站http:/NBA./),首先可以通过means过程对各变量进行整体描述,以下是means过程得到变量的五个基本统计量: 表2 变量的五个描述统计量(Descriptive Statistics)NMinimumMaximumMeanStd. DeviationX12133.6039.9036.44291.88350X22117.7030.2021.56293.56180X321.4557.2044.024815.00115X4212.8713.845.97953.01364X5211.4211.045.00142.58221X621.392.771.1262.56403X721.063.04.7290.87158X8211.703.442.5657.52183X9546.10656Valid N (listwise)21由表2可以看出21位MVP 候选人的九个指标均值都较高,说明这21个人整体较为全面,X8(失误)的均值为2.5657,这个说明这21个人的失误偏高,其实,作为球队的中坚力量,在比赛中受到对手防守的强度很大,比如受到包夹或者绕前防守等,受迫性失误自然比较高,因此失误稍微偏高也很正常. 但是这21个人的得分,篮板,助攻的方差较大,说明这21个人的篮球技术还是有差距的,其中命中率的方差最大,说明在实际的情况中,球员命中率有很大的差别,得分多不一定说明技术好,有可能是建立在他多次投篮的基础上. 从最大值和最小值可以看出,差距比较大,因此有必要对这21个球员进行综合性的评价,从而得出最后的球员价值排名,球员价值排名最高(反映球员综合素质最高)的当选MVP当之无愧,从中也可以对球员就如何提高自己的价值给出一些建议.对这9个变量进行相关系性分析:表3 相关系数矩阵(Correlation Matrix)X1X2X3X4X5X6X7X8X9CorrelationX11.000.355.126-.132.374.602-.245.113-.205X2.3551.000.235.099.247.547.108.372.024X3.126.2351.000.501-.370.124.387-.022.428X4-.132.099.5011.000-.492-.194.847.177.277X5.374.247-.370-.4921.000.703-.427.371-.232X6.602.547.124-.194.7031.000-.214.437-.142X7-.245.108.387.847-.427-.2141.000.410.136X8.113.372-.022.177.371.437.4101.000-.153X9-.205.024.428.277-.232-.142.136-.1531.000由表3可以看出某些变量间的相关系数较高,表明这些变量间存在某些相关性.例如,这说明抢篮板和盖帽能力有很强的相关性,这符合直观和常理(篮板和盖帽能力常被人们认为是考量篮球运动员的防守能力的指标). 此相关系数矩阵也可以帮助我们看出这些变量间的一些基本关系,可以帮助球员在平时的训练时重点训练在哪些方向.5 系统聚类法结果与讨论在本文中,将每个球员看成一个样品,并以1,2,21分别表示L.James, M.Williams,D.Williams等球员. 本文以SPSS系统聚类分析的操作和结果解释,运用SPSS中的层次聚类分析类平均法操作得出如下分析结果: 表4 系统聚类分析中的凝聚状态表(Agglomeration Schedule)StageCluster CombinedCoefficientsStage Cluster First AppearsNext StageCluster 1Cluster 2Cluster 1Cluster 21242.4020042392.4410043173.33400104233.60812552173.6914066283.7995077263.88660882144.21870992114.623801010124.6713911111194.68010012121154.796110161312185.00700141412165.13213015155125.21901419161135.46412017171206.806160191810217.084002019158.1541715202011041.42619180在表4,第一列表示聚类分析的第几步;第二列、第三列表示本步骤聚类中两个样品聚成一类;第四列表示个体距离或小类距离;第五列、第六列表示本步骤聚类中参与聚类的是个体还是小类;0表示样品,非0表示由第n步骤类生成的小类参与本步聚类;第七列表示本步聚类的结果将在以下第几步中用到.表4显示21个球员聚类的情况. 聚类分析的第一步(Stage1)中2号样品(M.Williams)与4号样品(R.Allen)聚成一类,它们的个体距离(本文采用欧式距离)为2.402,这个小类将在下面第4步用到,同理下面的解释类同,这里不做一一叙述.表5 系统聚类分析中的类成员表(Cluster Membership)Case8 Clusters7 Clusters6 Clusters5 Clusters4 Clusters1:L.James 111112:M.Williams 111113:P.Pierce 111114:R.Allen 111115:D.Howard 222226:J.Johnson 111117:D.Wade 111118:A.Iguodala 111119:B.Gordon 1111110:R.Hamilton 3333311:KBryant 1111112:P.Gasol 4422213:C.Pillups 5541114:C.Anthony 1111115:T.Parke 1111116:T.Duncan 6422217:B.Roy 1111118:M.Yao 4422219:D.Nowitzki 1111120:C.Paul 7654121:D.Williams 87654由表5可知,当聚成4类时, D.Howard,P.Gasol, T.Duncan ,M.Yao 聚成一类, R.Hamilton聚成一类, D.Williams 为一类,其它球员聚成一类. D.Howard,P.Gasol, T.Duncan ,M.Yao都是打中锋的,他们的篮板和盖帽都比较高,R.Hamilton是这些球员中比较差的一个,各项数据都不突出,自己成了一类,D.Williams 的得分和助攻都不错,但其他项和别的球员都有很大的差距,其他的球员分成一类,他们的竞技水平都是差不多,很多时候都是看当场的发挥. 同理当聚成5、6、7、8类时我们也可以根据同一列中数据相同的球员聚成一类.SPSS给出类成员表的同时,也可以得到下面的谱系图:图1 聚类谱系图谱系图展现了聚类分析中的每一次类合并的情况. SPSS自动将各类间的距离映射到之间,并将凝聚过程近似地表示在图上.6 各球员能力的综合评价以及分析在球员的综合评价中我们采用因子分析进行评价,采用SPSS软件进行操作,首先对数据进行标准化,然后进行因子分析,可以得到以下结果. 表6 巴特利特球度检验和KMO检验表(KMO and Bartletts Test)Kaiser-Meyer-Olkin Measure of Sampling Adequacy.806Bartletts Test of SphericityApprox. Chi-Square86.232df36Sig.000由表6可知:巴特利特球度检验统计量的观测值为86.232,相应的概率P-值接近0. 如果显著性水平为0.05大于概率P-值,则应拒绝原假设,认为相关系数矩阵与单位阵有显著差异. 同时 KMO值为 0.806,根据KMO度量标准可知原有变量适合进行因子分析.表7 因子解释原有变量总方差的情况表(Total Variance Explained)ComponentInitial EigenvaluesExtraction Sums of Squared LoadingsRotation Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %Total% of VarianceCumulative %13.07234.12934.1293.07234.12934.1292.66529.61329.61322.38926.54960.6782.38926.54960.6782.22024.66754.28131.29914.43475.1121.29914.43475.1121.87520.83175.1124.8309.21784.3295.5436.03190.3606.3774.18994.5497.2793.10097.6508.1281.42599.0749.083.926100.000Extraction Method: Principal Component Analysis.在表7中,第一列是因子编号,以后每三列组成一组,每组数据的含义是特征根值、方差贡献率和累计方差贡献率.表8 因子载荷矩阵(Component Matrixa)Component123Zscore(X5).862.113-.115Zscore(X6).735.558.152Zscore(X4)-.702.575-.131Zscore(X7)-.652.584-.414Zscore(X1).577.373.345Zscore(X2).319.694.135Zscore(X8).246.640-.589Zscore(X3)-.424.580.535Zscore(X9)-.443.161.551Extraction Method: Principal Component Analysis.a. 3 components extracted.表9 旋转后的因子载荷阵(Rotated Component Matrixa)Component123Zscore(X6).927-.056-.113Zscore(X1).735-.212.074Zscore(X2).724.247.129Zscore(X5).652-.275-.517Zscore(X7)-.155.940.171Zscore(X4)-.132.803.423Zscore(X8).470.642-.429Zscore(X3).220.308.813Zscore(X9)-.074.021.721Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.a. Rotation converged in 5 iterations.旋转后的因子载荷矩阵与旋转前的相比,因子含义较清晰了,因此根据表9可以写出以下因子得分函数: 对球员进行综合评价时,采用计算因子加权总分的方法,其中权重是关键.本文,仅从单纯的数量上考虑,以三个因子的方差贡献率为权数,从因子解释原有变量总方差的情况表中我们可以得到权数相应的值,于是计算公式为:对进行排序(结果如下表)表10球员L.James 1.4776310.5541410.7044760.72101D.Wade 2.1062481.001848-0.734160.717916D.Howard -0.485432.3743510.6450120.576294C.Paul 2.128402-0.2878-0.423180.471139KBryant 0.679044-0.226970.7986980.311475M.Yao -1.183932.437816-0.32110.183851D.Nowitzki -0.0409-0.036130.8404880.154059P.Gasol -0.56471-0.135221.5134150.114677A.Iguodala 0.670107-0.22444-0.396320.060518P.Pierce 0.033385-0.233390.4926760.054944C.Anthony -0.189860.439396-0.189780.012629B.Roy 0.143033-0.860430.621508-0.04042J.Johnson 0.470638-0.63101-0.12211-0.04172T.Duncan -1.254750.9088140.314797-0.08182T.Parke -0.16634-0.50902-0.16616-0.20943R.Allen -0.70688-1.352421.133939-0.30672B.Gordon -0.36631-0.42503-0.45224-0.30752M.Williams -0.72955-0.998930.739173-0.30847C.Pillups -0.41042-0.88473-0.22548-0.38674D.Williams 0.053005-0.11763-2.6923-0.57415R.Hamilton -1.66242-0.79321-2.08134-1.12152由表10可得到排名: L.James, D.Wade, D.Howard,C.Paul,K.Bryant,M.Yao,D.Nowitzki,P.Gasol,A.Iguodala,P.Pierce,C.Anthony,B.Roy,J.Johnson,T.Duncan,T.Parke,R.Allen,B.Gordon,M.Williams,C.Pillups,D.Williams,R.Hamilton. 由此可以看出球员综合能力较强的前五名分别为 L.James,D.Wade,D.Howard,C.Paul,K.Bryant,MVP应该是在他们当中评选出来.而事实上2008-2009赛季NBA常规赛的最有价值球员(MVP)正是这五个人当中排名第一的L.James. 这说明得到的结果和事实上的是非常相似的. MVP反映了一个球员的综合素质都比较高,但是在某些方面他还是存在不足的. L.James的命中率在这5个人当中排名倒数第二,这说明了他的高得分很有可能是建立在他多次投篮的基础上,这在他的平时训练中是要注意的. D.Wade在这五个人之中综合能力排在第二名,D.Wade是2008-2009赛季的得分王,排在第二绝对是有资格的,不过他的失误是这5个人当中最高的,虽然经常控球失误高也是情有可原的,但是还是可以通过平时的严格训练来减少自己的失误. D.Howard的排名第三,作为一个中锋,能场均抢下13.84个篮板是非常不错的,然而他是这5个人中得分最低的,足以见得他的投篮做得不好,现实中D.Howard的投篮能力确实不高,在训练中必须得加强. C.Paul排名第四,这5个人中唯一场均助攻上双的(11.04),他能帮助队友得分,但是他本身的得分能力并不是很强,而且黄蜂队的战绩不是很好,说明C.Paul的防守做得也不是很好,平时训练要重点往这方面发展. 可能很多人觉得K.Bryant排名第五对他不公平,但是K.Bryant的命中率是最低的,且得分排名才第三,助攻也不高,湖人战绩第二,不能说明K.Bryant的综合能力排名应该往前,因为湖人队本身有太多的出色的球员,K.Bryant平时的训练还是以提高命中率为主. 如今的NBA 赛场(篮球赛场),对球员的综合素质要求不断提高,比如能胜任赛场上多个位置或者攻防兼备的球员特别受球队教练,老板和经理甚至球迷的喜欢. 因此提高球员自身的综合素质非常有意义. 如果球员想要提高自己的综合素质关键在于提高自己的防守能力和进攻能力,同时要锻炼自己的耐力,身体素质,赢得更多的上场时间,从而赢得更多的球迷们的喜欢. 同时球员之间在赛场上的互相合作意识要提高,即提高团队篮球的意识,提高球队的战绩.7 结束语通过本文对球员综合能力的分析,建议球员通过提高自己的投篮命中率来提高自己在有限的出手次数下的得分;加强抢断,与盖帽训练;提高篮板意识和团队合作意识;争取每一场比赛的胜利. 这样,综合水平提高的可能就很大. 球队高层引进球员的时候,能胜任多个位置即多功能型的球员要优先考虑(比如双能卫,锋线摇摆人). 对于非核心球员,若只能胜任某一个位置或者团队意识差或者认为其没有发展的潜力或者认为发展该球员的成本太大,那么可以考虑交易该球员;如果认为其有潜力提升各方面的能力而且代价不超过球队的容限,那么可以将该球员留在队中发展或着下放到发展联盟锻炼.致谢本文写作过程中多次受到冯三营老师和赵艳,刘涛,王裕,张庆敏等同学的热情指导和帮助,在此表示衷心的感谢! 还有感谢在大学以来一直对我教

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论