分析方法-1因子分析法_第1页
分析方法-1因子分析法_第2页
分析方法-1因子分析法_第3页
分析方法-1因子分析法_第4页
分析方法-1因子分析法_第5页
已阅读5页,还剩39页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

因子分析方法概述MG1414017陆宇飞定义及特点定义在对多变量进行统计分析中,用彼此不相关的综合指标对存在相关关系的变量进行分析描述,以较少的因子反应原资料的大部分信息的统计学方法。从变量群中提取共性因子的方法,称R型因子分析。研究个案群的共性因子,称Q型因子分析。特点因子变量的数量远少于原有变量的数量因子变量对原始变量进行重构,可以反映大部分原始变量的信息因子变量之间线性无关因子变量具有命名解释性数学模型因子分析的数学模型用矩阵表示简记为且满足数学模型为任一个m阶的正交阵,上式仍满足约束条件因子分析每个相应的系数不是唯一的,即因子载荷阵不是唯一的。通过模型以F代替X,由于m≤p,从而达到简化变量维数目的。数学模型正交因子模型中各统计量的意义因子载荷因子载荷aij的统计意义是第i个变量与第j个公共因子的相关系数,表示Xi依赖Fj的份量(比重)。正交因子模型中各统计量的意义变量共同度因子载荷阵A中第i行元素的平方和,即称为变量Xi的共同度。为了说明它的统计学意义,对Xi的表达式两边求方差,即公共因子方差剩余方差正交因子模型中各统计量的意义公共因子Fj方差贡献因子载荷阵A中各列元素的平方和记为表示第j个公共因子对所有分量的总影响,称为第j个公共因子对X的贡献,它是衡量第j个因子相对重要性的指标基本步骤原始变量相关性检验构造因子变量利用旋转使得因子变量更具有可解释性计算因子变量得分相关性检验相关系数矩阵直观检验简单相关矩阵

计算出简单相关矩阵后,对各个变量之间的简单相关系数进行一般的分析观察,如果相关矩阵的大部分相关系数都小于0.3,原始数据之间的相关关系不大,则不适合进行因子分析。相关性检验相关系数矩阵直观检验反映像相关矩阵检验

反映像相关矩阵检验是通过偏相关系数矩阵进行的检验。反映像相关矩阵是由元素等于负的偏相关系数形成的矩阵。偏相关系数是控制其他变量不变,来测量一个自变量对因变量的独特解释作用的相关系数指标。如果原始数据中确实存在公共因子,则各个变量之间的偏相关系数应该很小,因为它与其他变量重叠的解释影响被扣除掉了,所以,如果反映像相关矩阵中的很多元素值比较大时,应该考虑该原始变量不适合进行因子分析。相关性检验KMO检验从比较原始变量之间的简单相关系数和偏相关系数的相对大小出发来进行的检验。KMO值接近1时,变量适合进行因子分析。rij表示简单相关系数,a2ij1,2,3,…k表示偏相关系数。相关性检验KMO检验取样足够度度量(MSA)MSA的求和项中并没有包含所有变量的相关系数和偏相关系数,而只包含了某个变量所涉及到的另外的(p-1)个变量。即根据每个原始变量与其他变量的相关系数和偏相关系数计算一个MSA值,共有p个MSA值,而KMO值是根据所有变量的相关系数和偏相关系数计算的,只有一个总比较值。因此MSA值反映的内容是按照各个变量进行的,更为详细。相关性检验巴特利特球形检验零假设为相关系数矩阵是单位矩阵。统计量为若值较大也相伴的概率值小于用户中心的显著性水平,则拒绝零假设,即适宜做因子分析。相关性检验φ检验共同度hi2检验碎石图的直观检验构造因子变量主成分分析法数据标准化处理计算协方差矩阵求R的特征值筛选特征值大于1的或者累计方差贡献率超过80%因子构造因子变量主轴因子法是主成分分析法的一种修正。该方法从样本约相关系数阵R*=R-D出发,由R*的前m个正特征值λ1*λ2*…λm*>=0和正交单位特征向量l1*,l2*,…,lm*,有近似分解式R*=AA′。公因子方差hi2=1-σi2往往是未知的,经常取hi2为第i个变量与其他所有变量的多元相关系数的平方作为公因子方差的初始估计值,采用迭代主因子的方法,直到某次迭代和下次迭代之间公因子方差的改变幅度能满足抽取的收敛条件,得到稳定的解。构造因子变量极大似然法当样本X来自多元正态总体N~p(μ,Σ)的情况下,因子提取的方法要选择极大似然法。设Σ=AA′+D,取μ=X,使似然函数L(X,AA′+D)达到最大的A,D即为所求的估计,它生成的参数估计最有可能生成观察到的相关矩阵,极大似然估计的计算一般也要使用迭代算法。最小二乘法构造因子变量主成分分析法对xij进行标准化处理,设样本的协差阵的特征值和对应的标准正交化特征向量分别为:则协差阵可分解为当最后p-m个特征值较小时,协差阵可以近似的分解为A即为因子协方差阵。当X的协方差阵未知,可以用样本协方差阵S去代替。变量解释因子旋转因子载荷矩阵A是不唯一的,可以由任意一组初始公共因子做线性组合,得到彼此之间相互独立的新的一组公共因子解释原始变量之间的相关关系。因子旋转的目的是为了找到意义更为明确,实际意义更明显的公因子。因子旋转不改变变量共同度,只改变公因子的方差贡献。因子旋转正交旋转由因子载荷矩阵A左乘一正交阵而得到,经过旋转后的新的公因子仍然保持彼此独立的性质。正交变化主要包括方差最大旋转法、四次最大正交旋转、平均正交旋转。斜交旋转放弃了因子之间彼此独立这个限制,可达到更简洁的形式,实际意义也更容易解释。方差最大化正交旋转假设:公因子的解释能力能够以其因子载荷平方的方差来度量对A按行计算共同度,并进行标准化。施行方差最大正交旋转(C为正交阵):方差最大化正交旋转载荷矩阵的每一列元素的绝对值尽可能向1和0两极分化(b112,…,bp12),(b122,…,bp22)这两组的方差尽量大。为此,正交旋转的角度必须满足使旋转后得到因子载荷阵的总方差V1+V2=G达到最大。经过计算,其旋转角度可按下面公式求得:推广到多个公共因子如果公共因子多于两个,我们可以逐次对每两个进行上述的旋转,设公共因子数m>21.第一轮旋转,每次取两个,全部配对旋转,变换共需进行m(m-1)/2次2.对第一轮旋转所得结果用上述方法继续进行旋转,得到第二轮旋转结果。每一次旋转后,矩阵各列平方的相对方差之和总会比上一次有所增加。3.当总方差的改变不大时,就可以停止旋转。因子得分因子分析的数学模型是将变量表示为公共因子的线性组合。由于公共因子能反映原始变量的相关关系,用公共因子代表原始变量时,有时更有利于描述研究对象的特征,因而往往需要反过来将公共因子表示成为变量的线性组合,即称上式为因子得分函数。因子得分汤姆森回归法Thomson假设公共因子可以对p个变量做回归,由于假设变量及公共因子都已经标准化了,所以常数项为0.即回归方程为:则,我们有如下的方程组:我们现在仅知道由样本值可得因子载荷阵A,由因子载荷的意义知:汤姆森回归法j=1,2,…,m汤姆森回归法于是F=BX,就是估计因子得分的计算公式。,记为B.汤姆森回归法在估计出公因子得分后,可以利用因子得分进行进一步的分析,如样本点之间的比较分析,对样本点的聚类分析等,当因子数m较少时,还可以方便地把各样本点在图上表示出来,直观地描述样本的分布情况,从而便于把研究工作引向深入。汤姆森回归法实例分析对我国30个省市自治区的农业生产情况作因子分析。从农业生产条件和生产结果及效益出发,选取六项指标分别为:X1—乡村劳动力人口(万人)X2—人均经营耕地面积(亩)X3—户均生产性固定资产原值(元)X4—家庭基本纯收入(元)X5—人均农业总产值(千元/人)X6—增加值占总产值比重(%)序号地区X1X2X3X4X5X61北京66.90.932972.413290.732.52549.72天津80.21.644803.542871.621.77449.63河北1621.82.034803.542871.810.8004544山西635.42.762257.661499.140.55556.25内蒙古514.110.175834.941550.150.905166.46辽宁605.12.963108.862059.351.475253.17吉林534.24.734767.511940.461.115463.18黑龙江494.88.245573.022075.421.628357.89上海661.021660.034571.813.044835.610江苏1530.21.262826.862868.331.192150.611浙江1123.10.945494.233289.070.856563.312安徽1953.61.443573.621508.240.575659.213福建775.80.822410.052295.191.149662.814江西1103.21.32310.981804.930.664959.915山东2475.11.443109.111989.530.88095516河南2815.81.53782.261508.360.582358.517湖北1296.51.62291.61754.130.879962.818湖南2089.31.422348.721719.180.58764.719广东1439.80.883249.612928.241.09659.720广西1579.91.433090.171590.90.569464.521海南165.91.354454.771575.490.353565.222四川3903.71.082870.451340.610.444364.123贵州1376.61.182282.271206.250.289265.424云南1642.22.424025.061096.730.345664.225西藏88.62.5111559.831257.710.434970.426陕西1046.12.62228.551091.960.438359.727甘肃6725.862879.361037.120.488357.228青海137.12.626725.111133.060.409670.329宁夏139.14.015607.971346.890.497362.530新疆288.53.967438.131161.711.493957.8将原始数据标准化建立指标间的相关系数阵R:实例分析求R的特征值和特征向量序号特征值贡献率累积贡献率(%)12.776546.275646.275621.740929.016075.291730.711611.861287.152940.43347.224894.377850.23693.948498.326360.10041.6736100实例分析

由于前三个特征值累积贡献率已达87.15%,所以取前三个特征值所对应的特征向量如下:u1u2u30.1460-0.6242-0.18540.16310.52700.75470.24210.52720.5369-0.54630.01530.2325-0.54550.2317-0.04220.54530.02250.2276实例分析列出因子载荷矩阵表因子指标a1a2a3X10.2433-0.8236-0.15640.7621X20.27180.69540.63660.9629X30.40350.69570.45290.8520X4-0.91030.02020.19610.8675X5-0.90890.3057-0.03560.9210X60.90860.02960.1920.8634实例分析

对因子载荷阵实行方差最大正交旋转,旋转后的矩阵如下:

由上表可见,每个因子只对应少数几个指标的因子载荷较大,因此可根据上表对指标进行分类。因子指标F1F2F3X1-0.3793-0.7252-0.3036X2-0.10460.21780.9510X3-0.29570.86980.0890X40.88620.0265-0.2852X50.94990.12060.0645X6-0.89760.2402-0.0009将六项指标按高载荷分成三类,并结合专业知识给出各因子的命名在第一因子中,X4、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论