因子分析方法在体育科研中的应用_第1页
因子分析方法在体育科研中的应用_第2页
因子分析方法在体育科研中的应用_第3页
全文预览已结束

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

因子分析方法在体育科研中的应用

本文从统计思维出发,探讨了因子分析的性质,指出了病因。以10个最佳数据为例。因此,成功的基于数据分析不仅是需要分析人员熟悉解决问题的相关专业知识,而且还需要充分理解数据分析的统计思想和性质。1正交因子分析的成功模式1.1公共因子综合因子分析假定P个随机观测向量x,有均值u,协方差Σ。因子分析模型要求线性相依,其中m个公共因子F1,F2…Fm和特殊因子ε1,ε2,…,εp组成。具体如下:用矩阵表示如下:若上述模型满足以下条件,即为正交因子分析模型:F和ε独立当满足以上条件即为正交因子模型。1.2组间相关到公共因子(1)因子分析的目的是用少数几个称之为公共因子的因子去描述众多变量间协方差关系,其实质是针对每一个具体的变量,去掉共同的东西后,剩余的变异部分由两个部分组成,即公共因子的贡献部分和特殊因子的贡献部分。值得注意的是正交因子分析模型中,公共因子部分和特殊因子部分是不相关的。理由是:如果公共因子与特殊因子在因子分析完成后还存在相关关系,则表明特殊因子中还存在着共同的东西,即还可以从特殊因子之中抽取到公共因子中去。(2)“正交因子模型”中“正交”一词,意味着各个公共因子间是不相关的。这一点是来自于因子分析初始思想。“正交因子模型”统计思想蕴含了:“组内高度相关”而“组间相关性很小”这表明各个组受制于不同的因子。组间相关性小到什么程度才算“小”呢?这是个模糊的概念,在实际应用中不易确定。于是表现在模型中就干脆把它理想化为不相关即公共因子间是独立的。这点有点像假定数据服从正态分布,然而实际上未必完全服从正态分布,但只要数据不是偏离正态太多,仍然能够得出比较满意的结论。(3)正交因子模型假定中,为何有cov(f)=I即各个公共因子方差相同且为1?这一点似乎与实际也不大相符,因为实践中的数据未必使每个公共因子的方差都是1。然而,这一困难在因子模型上是容易实现的。因为模型的变异部分是线性相依于公共因子,于是通过公共因子的系数上的调整可以使得因子的方差为1。具体的说,可以把方差不为1的公共因子,通过系数来化为方差为1。这样一来,X同F的关系完全转嫁到系数L上了,通过系数就能方便地判断因子的重要性与实际中的意义。心理学家们把反映F与X相关关系的系数L称为为因子载荷。2实际问题与模型的矛盾许多实际工作者在按正交因子模型做完因子分析后,总会得到模棱两可的解释。其根本原因出在“正交”上。正交因子模型是个理想化的模型。它要求公共因子间不相关,然而现实问题中,这些公共因子并非完全不相关的(可能相关性很小)。这样就出现了现实问题同模型间的矛盾。正是正交因子分析模型把事实上存在相关关系的变量都“强行”让它们不相关。而正交模型做的结果,却要回到实际数据中去解释。于是,实际问题与模型的矛盾导致解释上的麻烦。这一点我们在随后的十项全能数据的因子分析中得到了充分的证实。下面的数据来自文献,奥运会十项全能运动数据,在SPSS13.0中进行处理,每项得分经标准化后所得的相关阵如表1:在SPSS13.0上实施R型主因子分析发现其前4个特征值为:3.78,1.52,1.11,0.91。故取前4个主因子是合适的。在SPSS13.0上调用ML程序对因子载荷L进行估计所得因子载荷与特殊方差如下表2。从表2我们可以大致做出如下分析:因子F1上唯有1500m有较大的载荷,而在其余的项目上载荷均较小,因此可以称F1为耐力因子;在第二因子F2上,铅球、铁饼、标枪有较大的载荷,可以归结为力量因子;在第三因子F3上有较大载荷的是100m、400m,可以命名为速度因子;在因子F4上各项均有不大的载荷,这样F4的因子就难有合理的解释。造成十项全能项目因子分析不易解释的原因在于十项全能各个项目之间有均有着不同程度的相关,数据在空间凝聚成的主因子未必如正交因子模型所要求的完全正交。因此,这样的数据在完全按照正交因子分析模型去分析,而后的结果又回到实际数据中来解释,这样势必发生矛盾。在实际应用中如果实际数据所得因子非正交程度偏离正交模型不大的情况下,可以通过因子旋转的手段予以调整。3旋转前后因子分析结果比较因子旋转的最终目的是获得因子的解释富有现实意义,通常使用的是方差极大化旋转。因子旋转的理论参见文献,笔者在此不再赘述因子旋转理论内容,只就因子旋转的意义给出直观的说明。假定有6个数据如图所示(见图1)F1,F2为旋转前的因子主轴,从图中1,2,3点看很难说明是对F1贡献大些还是对F2贡献大些。如果实轴F1,F2代表正交因子模型,那么势必会引起分析结果的解释上的麻烦。此时针对数据特点实施方差极大化旋转,旋转后的主因子为F1*和F2*。从旋转后的图形可以大致分辨出,点4,5,6同F2*关系更为密切些,而点1,2,3同主因子F1*更为密切些。直观上,通过旋转能使得因子分析更为清晰。沿用上述十项全能的数据,在SPSS13.0上实施方差极大化因子旋转,所得因子载荷的ML估计如下表3。从上表3,可以做如下分析:旋转后,F1*上有较大载荷的是铅球,铁饼,都与手臂爆发力有关,可以将因子F1*命名感为上肢爆发力强度因子。而400m,100m在F2*上有高载荷,因为这两项主要反映跑的速度的,故命之为跑的速度因子。F3*上有高载荷的是跳远,跳高,110m栏,撑杆跳高。通过比较发现这些项目主要反映腿部爆发力的,可以命之为腿部爆发力强度因子。在F4*上唯有1500m有较高的载荷可以命之为跑的耐力因子。比较旋转前后,可以看到旋转后载荷的重新分配更易于因子的解释。尽管F1*和F2*上也有不易解释的高载荷现象(通常大于0.4都看成有较大的载荷),但同旋转前比较起来要清晰多了。我们看一下旋转前,表2中的载荷分布情况:跳远和跳高在F2均有较大的载荷。另外,在F3中跳远和110m栏均有高载荷,这些在未旋转的因子分析中都没有得到合理的解释。而因子F4中都没有较大的因子载荷,所以解释起来更是困难重重。值得注意的是:跳高,110m栏,撑杆跳高,标枪等几个项目上,无论是旋转前还是旋转过以后均有较大的特殊方差(大于0.4)。这表明,前几个公共因子在解释这些项目上并不理想。换句话说,这几个项目各自可能存在着其他项目不具备的影响因子。笔者分析了这几项体育运动特点发现这几项均属于技术性较强的项目,项目本身可能对运动员的素质存在着独特的要求。如110m栏、跳高等项目除了要求运动员娴熟地掌握跨栏技术外,同时也要求运动员有超强的心理素质,撑杆跳更是对运动员的协调性有着很高的要求,而标枪相比其他投掷项目,对运动员的加速的节奏感,最后的发力都有着独到的要求。因此,要想使因子分析得到完美的解释,仅仅依靠计算机是不够的,还须分析者对所要解决问题的领域的知识熟练的掌握并具有一定的见解。4根据数据分析确定因子旋转的标准通过对正交因子模型的分析,说明了正交因子模型的“理想化”同现实中的数据相矛盾导致了因子分析结果在解释上的困难。表现在形式上就是载荷的分布不明确,给因子命名带来了麻烦。客观上,在多数情况下实施因子旋转可以使得结果有个较清晰的解释。通常遵循方差最大准则做因子旋转直到因子分析在解释上较满意为止。从十项全能的例子可以看出,无论怎么旋转,总会有部分解释不是很清爽。此时,可以通过从所要解决问题的专业知识角度来考虑,可能会弥补因子分析的“先天不足”。值得提醒的是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论