




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第五章第五章 因子分析因子分析5.1 引言引言 5.2 正交因子模型正交因子模型 5.3 参数估计参数估计 5.4 因子旋转因子旋转 5.5 因子得分因子得分 5.6 实例分析实例分析 5.1 引言引言 主成分分析的成功需满足如下两点:主成分分析的成功需满足如下两点:(1)前前(少数少数)几个主成分具有较高的累计贡献率;几个主成分具有较高的累计贡献率;(通常较易得到满足通常较易得到满足)(2)对主成分给出符合实际背景和意义的解释对主成分给出符合实际背景和意义的解释 。(往往正是主成分分析的困难之处往往正是主成分分析的困难之处) 因子分析的用途与主成分分析类似,它也是一种降因子分析的用途与主成分
2、分析类似,它也是一种降维方法。由于因子往往比主成分更易得到解释,故维方法。由于因子往往比主成分更易得到解释,故因子分析比主成分分析更容易成功,从而有更广泛因子分析比主成分分析更容易成功,从而有更广泛的应用。的应用。 从方法上来说,因子分析比主成分分析更为精细,从方法上来说,因子分析比主成分分析更为精细,理论上也就更为复杂。主成分分析只涉及一般的线性变理论上也就更为复杂。主成分分析只涉及一般的线性变换,不涉及模型,仅需假定二阶矩存在。而因子分析需换,不涉及模型,仅需假定二阶矩存在。而因子分析需建立一个数学模型,并作一定的假定。建立一个数学模型,并作一定的假定。 因子分析起源于因子分析起源于20世
3、纪初,世纪初,K.皮尔逊皮尔逊(Pearson)和和C.斯皮尔曼斯皮尔曼(Spearman)等学者为定义和测定智力所作的努等学者为定义和测定智力所作的努力,主要是由对心理测量学有兴趣的科学家们培育和发力,主要是由对心理测量学有兴趣的科学家们培育和发展了因子分析。因子分析的目的是为了降维,降维的方展了因子分析。因子分析的目的是为了降维,降维的方式是试图用少数几个潜在的、不可观测的随机变量来描式是试图用少数几个潜在的、不可观测的随机变量来描述原始变量间的协方差关系。述原始变量间的协方差关系。 查尔斯查尔斯爱德华爱德华斯皮尔曼(斯皮尔曼(Charles Edward Spearman,1863-19
4、45)英国理论和实验心理学家。)英国理论和实验心理学家。他大器晚成,他大器晚成,1906年在德国获博士学位。年在德国获博士学位。1911年任伦敦大学心理学、逻辑学教授。年任伦敦大学心理学、逻辑学教授。1923至至1926期间年任英国心理学会主席。期间年任英国心理学会主席。1924年当选为英国皇家学会院士。年当选为英国皇家学会院士。 作为实验心理学的先驱,斯皮尔曼对心理统计的发展做作为实验心理学的先驱,斯皮尔曼对心理统计的发展做了大量的研究,他对相关系数概念进行了延伸,导出了等级了大量的研究,他对相关系数概念进行了延伸,导出了等级相关的计算方法。他还创立因素分析的方法,这是他学术上相关的计算方法
5、。他还创立因素分析的方法,这是他学术上最伟大的成就。他还将之与智力研究相结合,从而于最伟大的成就。他还将之与智力研究相结合,从而于1904年年提出智力结构的提出智力结构的“二因素说二因素说”,即,即G因素(一般因素)和因素(一般因素)和S因素(特殊因素)。他反对联想理论,著有因素(特殊因素)。他反对联想理论,著有智力的性智力的性质和认知的原理质和认知的原理、人的能力人的能力、创造的心创造的心等。等。例如,在商业企业的形象评价中,消费者可以通过一系列指例如,在商业企业的形象评价中,消费者可以通过一系列指标构成的一个评价指标体系,评价百货商场的各个方面的优标构成的一个评价指标体系,评价百货商场的各
6、个方面的优劣。但消费者真正关心的只是三个方面:商店的环境、商店劣。但消费者真正关心的只是三个方面:商店的环境、商店的服务和商品的价格。这三个方面除了价格外,商店的环境的服务和商品的价格。这三个方面除了价格外,商店的环境和服务质量,都是客观存在的、抽象的影响因素,都不便于和服务质量,都是客观存在的、抽象的影响因素,都不便于直接测量,只能通过其它具体指标进行间接反映。因子分析直接测量,只能通过其它具体指标进行间接反映。因子分析就是一种通过就是一种通过显在变量测评潜在变量显在变量测评潜在变量,通过,通过具体指标测评抽具体指标测评抽象因子象因子的统计分析方法。又比如,在研究区域社会经济发展的统计分析方
7、法。又比如,在研究区域社会经济发展中,描述社会与经济现象的指标很多,过多的指标容易导致中,描述社会与经济现象的指标很多,过多的指标容易导致分析过程复杂化。一个合适的做法就是从这些关系错综复杂分析过程复杂化。一个合适的做法就是从这些关系错综复杂的社会经济指标中提取少数几个主要因子,每一个主要因子的社会经济指标中提取少数几个主要因子,每一个主要因子都能反映相互依赖的社会经济指标间共同作用,抓住这些主都能反映相互依赖的社会经济指标间共同作用,抓住这些主要因素就可以帮助我们对复杂的社会经济发展问题进行深入要因素就可以帮助我们对复杂的社会经济发展问题进行深入分析、合理解释和正确评价。分析、合理解释和正确
8、评价。例例1 林登林登(Linden)根据他收集的来自根据他收集的来自139名运动员的比赛数据,名运动员的比赛数据,对第二次世界大战以来奥林匹克十项全能比赛的得分作了因对第二次世界大战以来奥林匹克十项全能比赛的得分作了因子分析研究。这十个全能项目为:子分析研究。这十个全能项目为:100米跑米跑(X1),跳远,跳远(X2),铅,铅球球(X3),跳高,跳高(X4),400米跑米跑(X5),11米跨栏米跨栏(X6),铁饼,铁饼(X7),撑,撑杆跳高杆跳高(X8),标枪,标枪(X9),1500米跑米跑(X10)。经标准化后所作的因。经标准化后所作的因子分析表明,十项得分基本上可归结于他们的短跑速度、爆
9、子分析表明,十项得分基本上可归结于他们的短跑速度、爆发性臂力、爆发性腿力和耐力这四个方面,每一方面都称为发性臂力、爆发性腿力和耐力这四个方面,每一方面都称为一个因子。十项得分与这四个因子之间的关系可以描述为如一个因子。十项得分与这四个因子之间的关系可以描述为如下的因子模型:下的因子模型: Xi=i+ ai1 f1+ ai2 f2+ ai3 f3+ ai4 f4+i, i=1,2, ,10其中其中f1, f2, f3, f4表示四个因子,称为表示四个因子,称为公共因子公共因子(common factor),aij称为称为Xi在因子在因子fj上的上的载荷载荷(loading),i是是Xi的均值,的
10、均值,i是是xi不不能被四个公共因子解释的部分,称之为能被四个公共因子解释的部分,称之为特殊因子特殊因子(specific factor)。例例2 公司老板对公司老板对48名应聘者进行面试,并给出他们在名应聘者进行面试,并给出他们在15个方面个方面所得的分数,这所得的分数,这15个方面是:个方面是:X1:申请书的形式:申请书的形式X9:经验:经验X2:外貌:外貌X10:积极性:积极性X3:专业能力:专业能力X11:抱负:抱负X4:讨人喜欢:讨人喜欢X12:理解能力:理解能力X5:自信心:自信心X13:潜力:潜力X6:精明:精明X14:交际能力:交际能力X7:诚实:诚实X15:适应性:适应性X8
11、:推销能力:推销能力通过因子分析,这通过因子分析,这15个方面可以归结为应聘者的外露能力、经个方面可以归结为应聘者的外露能力、经验、讨人喜欢的程度、专业能力和外貌这五个因子。验、讨人喜欢的程度、专业能力和外貌这五个因子。注:注: 因子分析与回归分析不同,因子分析中的因子是一个因子分析与回归分析不同,因子分析中的因子是一个比较抽象的概念,而回归因子有非常明确的实际意义;比较抽象的概念,而回归因子有非常明确的实际意义; 主成分分析与因子分析也有不同,主成分分析仅仅是主成分分析与因子分析也有不同,主成分分析仅仅是变量变换,而因子分析需要构造因子模型。变量变换,而因子分析需要构造因子模型。 主成分分析
12、主成分分析: :原始变量的线性组合表示新的综合变量,原始变量的线性组合表示新的综合变量,即主成分;即主成分; 因子分析:潜在的假想变量和随机影响变量的线性组因子分析:潜在的假想变量和随机影响变量的线性组合表示原始变量。合表示原始变量。5.2 正交因子模型正交因子模型一、数学模型一、数学模型 二、正交因子模型的性质二、正交因子模型的性质三、因子载荷矩阵的统计意义三、因子载荷矩阵的统计意义一、数学模型一、数学模型 设有设有p维可观测的随机向量维可观测的随机向量 ,其均值为,其均值为 ,协差阵为,协差阵为=(ij)。因子分析的一般模型为。因子分析的一般模型为 其中其中f1, f2, , fm为为公共
13、因子公共因子,1, 2, , p为为特殊因子特殊因子,它们,它们都是不可观测的随机变量。公共因子出现在每一个原始变量的都是不可观测的随机变量。公共因子出现在每一个原始变量的表达式中,可理解为原始变量共同具有的公共因素。上式可用表达式中,可理解为原始变量共同具有的公共因素。上式可用矩阵表示为:矩阵表示为: X=+Af+12(,)pXXXX 12(,)p 111111221122211222221122mmmmpppppmmpXa fa fafXa fafafXafafaf 式中式中 为公共因子向量,为公共因子向量, 为特为特殊因子向量,殊因子向量, 称为称为因子载荷矩阵因子载荷矩阵。通常假定。通
14、常假定该假定和上述关系式构成了该假定和上述关系式构成了正交因子模型正交因子模型。由上述假定可以。由上述假定可以看出,公共因子彼此不相关且具有单位方差,特殊因子也彼看出,公共因子彼此不相关且具有单位方差,特殊因子也彼此不相关且和公共因子也不相关。此不相关且和公共因子也不相关。 12,mffff12,p :ijapmA 22212diag,Cov,pEEVVEffIDf f000二、正交因子模型的性质二、正交因子模型的性质1. X的协差阵的协差阵的分解的分解2.模型不受单位的影响模型不受单位的影响3.因子载荷是不惟一的因子载荷是不惟一的1. X的协差阵的协差阵的分解的分解 故得故得=AA+D如果如
15、果X为各分量已标准化了的随机向量,则为各分量已标准化了的随机向量,则就是相就是相关阵关阵R= (ij),即有,即有R =AA+D Cov,Cov,Cov,AfAf AfAf AAf f AAf AV XVVVVV例例3 设随机向量设随机向量X=(X1,X2,X3,X4)的协方差矩阵为的协方差矩阵为则则可分解为可分解为=AA+D其中其中911520112717425175252042586214000430200,170020920001AD若取若取 ,则有分解式,则有分解式此时此时m=p,没有达到降维目的,故所作的因子分析没有意义。,没有达到降维目的,故所作的因子分析没有意义。出于降维的需要,
16、我们常常希望出于降维的需要,我们常常希望m要比要比p小得多,这样前述小得多,这样前述的的分解式通常只能近似成立,即有分解式通常只能近似成立,即有 =AA+D近似程度越好,表明因子模型拟合得越佳。一般来说,近似程度越好,表明因子模型拟合得越佳。一般来说,m选取选取得越小,上述近似效果就越差,即因子模型拟合得越不理想。得越小,上述近似效果就越差,即因子模型拟合得越不理想。拟合得太差的因子模型是没有什么实际意义的,故实践中拟合得太差的因子模型是没有什么实际意义的,故实践中m也也不应选得过小。不应选得过小。12,AD01122 02.模型不受单位的影响模型不受单位的影响将将X的单位作变化,通常是作一变
17、换的单位作变化,通常是作一变换X*=CX,这里,这里 C=diag(c1,c2, ,cp),ci0,i=1,2, ,p,于是,于是X*=C +CAf+C令令*=C ,A*=CA,*=C ,则有,则有X*=*+A*f+*这个模型能满足类似于这个模型能满足类似于前述因子模型前述因子模型的假定,即的假定,即 *Cov,Cov,EEVVffIDf f C000*2*2*2*22212*diag(,),1,2,piiicipD,其中其中因此,单位变换后新的模型仍为正交因子模型。因此,单位变换后新的模型仍为正交因子模型。3.因子载荷是不惟一的因子载荷是不惟一的设设T为任一为任一mm正交矩阵,令正交矩阵,令
18、A*=AT,f*=Tf,则模型能表示为则模型能表示为X=+A*f*+.因为因为 E(f*)=TE(f)=0; V(f*)=TV(f)T=TT=I; Cov(f*,)=E(f*)=TE(f)=0所以仍满足模型条件所以仍满足模型条件。也可分解为也可分解为 =A*A*+D因此,因子载荷矩阵因此,因子载荷矩阵A不是惟一的,在实际应用中常常利用这不是惟一的,在实际应用中常常利用这一点,通过因子的旋转(见稍后的一点,通过因子的旋转(见稍后的5.4),使得新的因子有),使得新的因子有更好的实际意义。更好的实际意义。三、因子载荷矩阵的统计意义三、因子载荷矩阵的统计意义1.A的元素的元素aij2.A的行元素平方
19、和的行元素平方和3.A的列元素平方和的列元素平方和221miijjha221pjijiga1.A的元素的元素aij Xi=i+ai1f1+ai2f2+ +aimfm+i即即aij是是Xi与与fj之间的之间的协方差协方差。若若X为各分量已标准化了的随机向量,则为各分量已标准化了的随机向量,则Xi与与fj的相关的相关系数系数 此时此时aij表示表示Xi与与fj之间的之间的相关系数相关系数。 1Cov,Cov,Cov,mijikkjijijkXfafffa Cov,Cov,ijijijijijXfXfXfaV XVf 2.A的行元素平方和的行元素平方和 Xi=i+ai1f1+ai2f2+ +aimf
20、m+i 令令 ,则则 221miijjha 22211222222121 2, ,iiiimmiiiimiV Xa Vfa Vfa VfVaaaip 2211 2, ,miijjhaip 221 2, ,iiiihip 反映了公共因子对反映了公共因子对Xi的影响,可以看成是公共因子的影响,可以看成是公共因子f1,f2, ,fm对对Xi的方差贡献,称为的方差贡献,称为共性方差共性方差(communality);而;而 是特殊是特殊因子因子i对对Xi的方差贡献,称为的方差贡献,称为特殊方差特殊方差(specific variance)。当当X为各分量已标准化了的随机向量时,为各分量已标准化了的随机
21、向量时,ii=1,此时有,此时有2ih2i221,1,2,iihip3.A的列元素平方和的列元素平方和其中其中 反映了公共因子反映了公共因子fj对对X1,X2, ,Xp的影响,是衡量公共因子的影响,是衡量公共因子fj重要性的一个尺度,可视为公共因子重要性的一个尺度,可视为公共因子fj对对X1,X2, ,Xp的总方的总方差贡献。差贡献。221pjijiga 221,1,2,pjijigajm2jg 2211111122211ppppiiimmiiiiipmiiV Xa Vfa VfVgg 8.3 参数估计参数估计一、主成分法一、主成分法二、主因子法二、主因子法三、极大似然法三、极大似然法一、主成
22、分法一、主成分法设样本协方差矩阵设样本协方差矩阵S的特征值依次为的特征值依次为 ,相应,相应的正交单位特征向量为的正交单位特征向量为 .选取相对较小的因子数选取相对较小的因子数m,并使得累计贡献率并使得累计贡献率 达到一个较高的百分比,则达到一个较高的百分比,则S可可近似分解如下:近似分解如下:其中其中 为为pm矩阵,矩阵, ,i=1,2, ,p。这里的。这里的 和和 就是因子模型的一个就是因子模型的一个主成分解主成分解。对主成分解,当因子数增加时,原来因子的估计载。对主成分解,当因子数增加时,原来因子的估计载荷并不变,第荷并不变,第j个因子个因子fj对对X的总方差贡献仍为的总方差贡献仍为 。
23、11pmiiii1 1 11111 1 1 m m mmmmpppm m mSt tt tttt tt tt tDAAD 1 1,mmijAtta 221diag,pD AD221miiiijjsa 12 ,pt tt120pi 例例5 如下八项男子径赛运动记录:如下八项男子径赛运动记录: x1:100米(秒)米(秒) x5:1500米(分)米(分) x2:200米(秒)米(秒) x6:5000米(分)米(分) x3:400米(秒)米(秒) x7:10000米(分)米(分) x4 :800米(秒)米(秒) x8:马拉松(分):马拉松(分)表3 八项男子径赛运动记录的样本相关矩阵x1x2x3x4
24、x5x6x7x8x11.000 x20.9231.000 x30.8410.8511.000 x40.7560.8070.8701.000 x50.7000.7750.8350.9181.000 x60.6190.6950.7790.8640.9281.000 x70.6330.6970.7870.8690.9350.9751.000 x80.5200.5960.7050.8060.8660.9320.9431.000表4 的前三个特征值、特征向量以及贡献率R特征向量 :100米0.3180.5670.332 :200米0.3370.4620.361 :400米0.3560.2480.560
25、:800米0.3690.0120.532 :1500米0.3730.1400.153 :5000米0.3640.3120.190 :10000米0.3670.3070.182 :马拉松0.3420.4390.263特征值6.6220.8780.159贡献率0.8280.1100.020累计贡献率0.8280.9370.957*1x*2x*3x*4x*5x*6x1t2t3t*7x*8x例例4 在在上一章例上一章例5中,分别取中,分别取m=1和和m=2,用主成分法估计的,用主成分法估计的因子载荷和共性方差列于表因子载荷和共性方差列于表3.1。表3.1当m=1和m=2时的主成分解变变 量量m=1m=
26、2因子载荷因子载荷共性方差共性方差因子载荷因子载荷共性方差共性方差f1 f1 f2 :100米米0.8170.6680.8170.5310.950 :200米米0.8670.7520.8670.4320.939 :400米米0.9150.8380.9150.2330.892 :800米米0.9490.9000.9490.0120.900 :1500米米0.9590.9200.959-0.1310.938 :5000米米0.9380.8790.938-0.2920.965 :10000米米0.9440.8910.944-0.2870.973 :马拉松马拉松0.8800.7740.880-0.41
27、10.943所解释的总方所解释的总方差的累计比例差的累计比例0.8280.8280.9382ih*1x*2x*3x*4x*5x*6x*7x*8x2ih主成分解的近似关系式主成分解的近似关系式主成分解的因子解释与主成分的解释完全相同。因主成分解的因子解释与主成分的解释完全相同。因子子f1代表在径赛项目上的总体实力,可称为代表在径赛项目上的总体实力,可称为强弱因强弱因子子;因子;因子f2反映了反映了速度与耐力的对比速度与耐力的对比。*1121*2122*3123*4124*5125*6126*71271000.8170.531000.8670.4324000.9150.2338000.9490.0
28、1215000.9590.131000.9380.292100000.9440.287xffxffxffxffxffxffxff(米)(2米)(米)(米)(米)(50米)(米)*81280.8800.411xff(马拉松)二、主因子法二、主因子法假定原始向量假定原始向量X的各分量已作了标准化变换。如果随机的各分量已作了标准化变换。如果随机向量向量X满足满足正交正交因子模型,则有因子模型,则有R=AA+D其中其中R为为X的相关矩阵,令的相关矩阵,令R*=RD=AA则称则称R*为为X的的约相关矩阵约相关矩阵(reduced correlation matrix)。R*中的对角线元素是中的对角线元素
29、是 ,而不是,而不是1,非对角线元素和,非对角线元素和R中是完全一样的,并且中是完全一样的,并且R*也是一个非负定矩阵。也是一个非负定矩阵。2ih设设 是特殊方差是特殊方差 的一个合适的初始估计,则约相关矩的一个合适的初始估计,则约相关矩阵可估计为阵可估计为其中其中 是是 的初的初始估计。又设始估计。又设 的前的前m个特征值依次为个特征值依次为,相应的正交单位特征向量为,相应的正交单位特征向量为 ,则则A的的主因子解主因子解为为2i2i211212*2122212ppppphrrrhrrrhRRD 2222212,diag,1ijpiirh RD,2ih*R*120m*12 ,mttt*112
30、2,m mAttt由此我们可以重新估计特殊方差,由此我们可以重新估计特殊方差, 的最终估计为的最终估计为如果我们希望求得拟合程度更好的解,则可以采用如果我们希望求得拟合程度更好的解,则可以采用迭代的方法,即利用迭代的方法,即利用上上式中的式中的 再作为特殊方差的再作为特殊方差的初始估计,重复上述步骤,直至解稳定为止。初始估计,重复上述步骤,直至解稳定为止。2i222111,1,2,miiijjhaip 2i特殊特殊(或共性或共性)方差的常用初始估计方法方差的常用初始估计方法(1)取取 ,其中,其中rii是是 的第的第i个对角线元素,个对角线元素,此时共性方差的估计为此时共性方差的估计为 ,它是
31、,它是Xi和其他和其他p1个变量间样本复相关系数的平方,该初始估计个变量间样本复相关系数的平方,该初始估计方法最为常用。方法最为常用。(2)取取 ,此时,此时 。(3)取取 ,此时,此时 ,得到的得到的 是一个主成是一个主成分解。分解。21iiir1R221iih 2maxiijj ihr 221iih 20i 21ih A例例5 在在前例前例中,取中,取m=2,为求得主因子解,选用,为求得主因子解,选用Xi与其他七个与其他七个变量的复相关系数平方作为变量的复相关系数平方作为 的初始估计值。计算得的初始估计值。计算得于是约相关矩阵为于是约相关矩阵为2ih22221234222256780.87
32、7,0.888,0.845,0.8840.927,0.955,0.967,0.905hhhhhhhh*0.8770.9230.8880.8410.8510.8450.7560.8070.8700.8840.7000.7750.8350.9180.9270.6190.6950.7790.8640.9280.9550.6330.6970.7870.8690.9350.9750.9670.5200.5960.7050.8060.8660.9320.9430.905R 的特征值为的特征值为从从 起特征值已接近于起特征值已接近于0,故取,故取m=2,相应的计算结,相应的计算结果列于表果列于表3.2。*R
33、*1234*56786.530,0.779,0.051,0.0060.014,0.015,0.036,0.053 *3表3.2 当m=2时的主因子解变变 量量因子载荷因子载荷共性方差共性方差f1f2 :100米米0.8070.4960.897 :200米米0.8580.4120.906 :400米米0.8900.2160.856 :800米米0.9390.0240.881 :1500米米0.9560.1140.926 :5000米米0.9380.2820.960 :10000米米0.9460.2810.974 :马拉松马拉松0.8740.3780.907所解释的总所解释的总方差方差的累计比例的
34、累计比例0.8160.9142ih*1x*2x*3x*4x*5x*6x*7x*8x三、极大似然法三、极大似然法设公共因子设公共因子fNm(0,I),特殊因子,特殊因子Np(0,D),且相互独立,则,且相互独立,则必然有原始向量必然有原始向量XNp(,)。由样本。由样本X1,X2, ,Xn计算得到的似计算得到的似然函数是然函数是和和的函数的函数L(,)。由于。由于=AA+D,故似然函数可更,故似然函数可更清楚地表示为清楚地表示为L(,A,D)。记。记(,A,D)的极大似然估计为的极大似然估计为( ),即有,即有可以证明,可以证明, ,而,而 满足以下方程组满足以下方程组: , A D ( ,)m
35、ax,LL A D A D xAD和11 () diag()mD A A IA D ADAA= 其中其中 。由于。由于A的解是不惟一的解是不惟一的,故为了得到惟一解,可附加计算上方便的惟一的,故为了得到惟一解,可附加计算上方便的惟一性条件:性条件:AD1A是对角矩阵是对角矩阵上述方程组上述方程组中的中的 一般可用迭代方法解得。一般可用迭代方法解得。 对极大似然解,当因子数增加时,原来因子的估对极大似然解,当因子数增加时,原来因子的估计载荷及对计载荷及对X的贡献将发生变化,这与主成分解及主的贡献将发生变化,这与主成分解及主因子解不同。因子解不同。例例6 在在例例5中,取中,取m=2,极大似然法的
36、计算结果列于,极大似然法的计算结果列于表表3.3。 的初始估计值与例的初始估计值与例5相同。相同。11()()niiinxxxxAD和2ih表3.3 当m=2时的极大似然解变变 量量因子载荷因子载荷共性方差共性方差f1f2 :100米米0.7310.6200.919 :200米米0.7920.5450.924 :400米米0.8550.3430.849 :800米米0.9160.1610.865 :1500米米0.9580.0260.918 :5000米米0.9720.1440.966 :10000米米0.9810.1430.982 :马拉松:马拉松0.9230.2490.914所解释的总方差
37、的累计比例所解释的总方差的累计比例0.8010.9172ih*1x*2x*3x*4x*5x*6x*7x*8x8.4 因子旋转因子旋转v因子的解释带有一定的主观性,我们常常通过旋转因子的解释带有一定的主观性,我们常常通过旋转公共因子的方法来减少这种主观性。公共因子的方法来减少这种主观性。v公共因子是否易于解释,很大程度上取决于因子载公共因子是否易于解释,很大程度上取决于因子载荷矩阵荷矩阵A的元素结构。的元素结构。v如果载荷矩阵如果载荷矩阵A的所有元素都接近的所有元素都接近0或或1,则模型,则模型的公共因子就易于解释。反之,如果载荷矩阵的公共因子就易于解释。反之,如果载荷矩阵A的的元素多数居中,不
38、大不小,则对模型的公共因子元素多数居中,不大不小,则对模型的公共因子往往往往就不易作出解释,此时应考虑进行因子旋转,使就不易作出解释,此时应考虑进行因子旋转,使得旋转之后的载荷矩阵在每一列上元素的绝对值尽得旋转之后的载荷矩阵在每一列上元素的绝对值尽量地拉开大小距离。量地拉开大小距离。 因子旋转方法有因子旋转方法有正交旋转正交旋转和和斜交旋转斜交旋转两类,两类,本章本章只只讨论正交旋转。对公共因子作正交旋转相当于对载荷讨论正交旋转。对公共因子作正交旋转相当于对载荷矩阵矩阵A作一正交变换,右乘正交矩阵作一正交变换,右乘正交矩阵T,使,使A*=AT能有能有更鲜明的实际意义。旋转后的公共因子向量为更鲜
39、明的实际意义。旋转后的公共因子向量为f*=Tf,它的几何意义是在,它的几何意义是在m维空间上对原因子轴作一刚性维空间上对原因子轴作一刚性旋转。因子旋转不改变共性方差,这是因为旋转。因子旋转不改变共性方差,这是因为A*A*=ATTA=AA 正交矩阵正交矩阵T的不同选取法构成了正交旋转的各种不的不同选取法构成了正交旋转的各种不同方法,在这些方法中使用最普遍的是同方法,在这些方法中使用最普遍的是最大方差旋转最大方差旋转法法(varimax),本节仅介绍这一种正交旋转法。,本节仅介绍这一种正交旋转法。 当当m2时,我们可以逐次对每两个公共因子和进行上述旋转。时,我们可以逐次对每两个公共因子和进行上述旋
40、转。对公因子对公因子Fl和和Fk进行旋转,就是对进行旋转,就是对A的第的第l和和k两列进行正交变换,两列进行正交变换,使这两列元素平方的相对方差之和达到最大,而其余各列不变,使这两列元素平方的相对方差之和达到最大,而其余各列不变,其正交变换矩阵为其正交变换矩阵为表4.1旋转后的因子载荷估计变变 量量主成分主成分主因子主因子极大似然极大似然 :100米米0.2740.9350.2870.9030.2880.914 :200米米0.3760.8930.3810.8720.3790.883 :400米米0.5430.7730.5410.7510.5410.746 :800米米0.7120.6270.
41、6950.6310.6890.624 :1500米米0.8130.5250.7990.5370.7970.532 :5000米米0.9020.3890.8950.3990.8990.397 :10000米米0.9030.3970.9000.4050.9060.402 :马拉松马拉松0.9360.2610.9090.2840.9140.281所解释的总所解释的总方方差差的累计比例的累计比例0.5230.9380.5100.9140.5120.917*1x*2x*3x*4x*5x*6x*7x*8x*1f*1f*1f*2f*2f*2f例例7 在例在例4至例至例6中分别使用最大方差旋转法,旋转后的因中
42、分别使用最大方差旋转法,旋转后的因子载荷矩阵列于表子载荷矩阵列于表4.1。三种方法的因子载荷估计经因子旋转之后给出了大致相三种方法的因子载荷估计经因子旋转之后给出了大致相同的结果,同的结果, 在因子在因子 上的载荷依次增大,在因子上的载荷依次增大,在因子 上上的载荷依次减小,可称的载荷依次减小,可称 为为耐力因子耐力因子,称,称 为为(短跑短跑)速度因子速度因子。将(主成分解的)因子载荷配对将(主成分解的)因子载荷配对( )在图在图4.1中用点中用点表示,在点上标出相应变量的序号。使用最大方差旋转表示,在点上标出相应变量的序号。使用最大方差旋转法后,因子按顺时针方向旋转了法后,因子按顺时针方向
43、旋转了=40.6,点,点i在新坐在新坐标系下的坐标为旋转后的因子载荷配对标系下的坐标为旋转后的因子载荷配对( )。从图中容易直接看出旋转后因子的实际意义。从图中容易直接看出旋转后因子的实际意义。*1f*2f*2f*1f12,iiaa12,iiaa图4.1 主成分解的因子旋转例例8 沪市沪市604家上市公司家上市公司2001年财务报表中有这样年财务报表中有这样十十个主要财务指标个主要财务指标(数据可从前言中提及的作者网页上下数据可从前言中提及的作者网页上下载载):x1:主营业务收入主营业务收入(元元) x6:每股净资产每股净资产(元元)x2:主营业务利润主营业务利润(元元) x7:净资产收益率净
44、资产收益率(%)x3:利润总额利润总额(元元)x8:总资产收益率总资产收益率(%)x4:净利润净利润(元元)x9:资产总计资产总计(元元)x5:每股收益每股收益(元元)x10:股本股本上述上述十十个指标的样本相关矩阵列于表个指标的样本相关矩阵列于表4.2。从相关矩阵出发,选择主成分法,相关矩阵的前三个特征值为从相关矩阵出发,选择主成分法,相关矩阵的前三个特征值为累计贡献率为累计贡献率为83.82%,取因子数,取因子数m=3,相应结果列于表,相应结果列于表4.3。1234.879,2.574,0.929表4.2 十个财务指标的样本相关矩阵x1x2x3x4x5x6x7x8x9x10 x11.000
45、 x20.7231.000 x30.4270.7431.000 x40.4070.6970.9821.000 x50.1710.3250.5390.5591.000 x60.1490.2280.2840.2740.5851.000 x70.0960.1770.3620.4020.7760.2181.000 x80.0660.2040.4550.5000.8490.2900.8331.000 x90.7480.7680.5740.5670.1250.1380.0670.0581.000 x100.6220.6190.4850.5000.002-0.0660.0330.0510.8611.000表
46、4.3 m=3时的主成分解变量变量因子载荷因子载荷共性方差共性方差f1f2f3 :主主营业务收入营业务收入0.6590.4720.1210.672 :主主营业务利润营业务利润0.8350.3460.0970.826 :利润利润总额总额0.8860.0030.0370.786 :净净利润利润0.8880.0370.0820.796 :每每股收益股收益0.6660.6920.1090.934 :每每股净资产股净资产0.3910.3670.8140.951 :净资产净资产收益率收益率0.5270.6700.3250.832 :总总资产收益率资产收益率0.5810.7030.2600.899 :资产资
47、产总计总计0.7470.5640.0190.877 :股本股本0.6360.5960.2190.808所解释的总方所解释的总方差的累计比例差的累计比例0.4880.7450.8382ih*1x*2x*3x*4x*5x*6x*7x*8x*9x*10 x表4.4 旋转后的因子载荷估计变量变量因子载荷因子载荷共性方差共性方差 :主主营业务收入营业务收入0.809-0.0290.1290.672 :主主营业务利润营业务利润0.8740.1710.1820.826 :利润利润总额总额0.7060.5090.1670.786 :净净利润利润0.6880.5520.1350.796 :每每股收益股收益0.1
48、150.8490.4470.934 :每每股净资产股净资产0.0820.1990.9510.951 :净资产净资产收益率收益率0.0220.9120.0040.832 :总总资产收益率资产收益率0.0450.9430.0870.899 :资产资产总计总计0.936-0.0120.0280.877 :股本股本0.869-0.013-0.2280.808所解释的总方所解释的总方差的累计比例差的累计比例0.4040.7120.8382ih*1x*2x*3x*4x*5x*6x*7x*8x*9x*10 x*1f*2f*3f8.5 因子得分因子得分 例例9 在例在例8中,用回归法得到的因子得分为中,用回归
49、法得到的因子得分为其中其中 为为Xi的标准化值,的标准化值,i=1,2, ,p,经计算:,经计算:*1*fA R X*12,piXXXXX*112345*678910*212345*678910*30.2170.2160.1450.1380.0540.0320.0660.0660.2540.2460.1090.0430.1160.1440.2350.1650.3810.3710.0860.0160.10fxxxxxxxxxxfxxxxxxxxxxf *12345*67891000.0980.0040.0370.2160.8760.2290.1570.0080.255xxxxxxxxxx序号股票
50、名称序号股票名称1上海石化8.580-2.704-2.1682东方航空7.446-2.089-1.861595康美药业-0.7010.2311.6243兖州煤碳6.9241.513-0.044596潜江制药-0.706-0.4302.0854马钢股份6.175-1.251-2.804597浏阳花炮-0.7090.1460.6555宁沪高速5.3410.835-2.220598浪潮软件-0.7131.625-1.3136广州控股4.1012.5960.640599兆维科技-0.7282.511-1.3667青岛海尔4.0220.9543.160600PT农商社-0.7510.5160.5108四
51、川长虹3.996-2.0271.907601三佳模具-0.7760.5270.3859仪征化工3.873-0.964-1.598602雄震集团-0.8171.175-1.40710上海汽车3.8341.293-0.666603中软股份-1.0232.715-1.685604天地科技-1.0232.355-0.946表5.1 按规模因子得分 的排序*1f*1f*2f*2f*3f*3f*1f序号股票名称序号股票名称1中软股份-1.0232.715-1.6852广州控股4.1012.5960.640595东方电机-0.246-3.212-0.3853广汇股份0.5172.534-1.608596ST
52、嘉陵-0.144-3.570-0.2844兆维科技-0.7282.511-1.366597ST海药-0.089-3.7090.2255长江通讯-0.6572.3691.899598鼎天科技0.034-4.230-0.2096天地科技-1.0232.355-0.946599大元股份0.111-4.5590.2847申能股份3.2482.158-0.498600新城B股-0.080-4.687-0.0868上港集箱2.9922.1121.624601银鸽投资-0.063-4.869-0.0869中远航运-0.5881.957-1.449602济南百货0.083-4.9680.01210创业环保0.
53、7971.755-2.099603ST东锅0.263-5.9790.272604国嘉实业0.491-7.7301.055表5.2 按收益因子得分 的排序*1f*1f*2f*2f*3f*3f*2f序号股票名称序号股票名称1贵州茅台0.8771.3665.7502用友软件-0.581-0.0615.165595PT宝信-0.5711.145-1.7603亿阳信通-0.5230.1244.059596东方航空7.446-2.089-1.8614华泰股份-0.2240.0613.420597ST成量-0.5250.042-1.8735太太药业0.0470.7473.234598ST自仪-0.185-0
54、.012-1.9056赣粤高速0.2060.1003.178599创业环保0.7971.755-2.0997青岛海尔4.0220.9543.160600上海石化8.580-2.704-2.1688美克股份-0.6990.0882.752601山东基建2.2750.797-2.1809宇通客车-0.2640.6042.619602ST中纺机-0.3900.278-2.18210东方通讯2.401-0.7502.593603宁沪高速5.3410.835-2.220604马钢股份6.175-1.251-2.804表5.3 按每股价值因子得分 的排序*1f*1f*2f*2f*3f*3f*3f因子分析的
55、步骤、展望和建议因子分析的步骤、展望和建议计算计算所选原始变量的相关系数矩阵所选原始变量的相关系数矩阵 相关系数矩阵描述了原始变量之间的相关关系。可以帮助判相关系数矩阵描述了原始变量之间的相关关系。可以帮助判断原始变量之间是否存在相关关系,这对因子分析是非常重断原始变量之间是否存在相关关系,这对因子分析是非常重要的,因为如果所选变量之间无关系,做因子分析是不恰当要的,因为如果所选变量之间无关系,做因子分析是不恰当的。并且相关系数矩阵是估计因子结构的基础。的。并且相关系数矩阵是估计因子结构的基础。 选择分析的变量选择分析的变量 用定性分析和定量分析的方法选择变量,因子分析的前用定性分析和定量分析
56、的方法选择变量,因子分析的前提条件是观测变量间有较强的相关性,因为如果变量之间提条件是观测变量间有较强的相关性,因为如果变量之间无相关性或相关性较小的话,他们不会有共享因子无相关性或相关性较小的话,他们不会有共享因子, ,所以所以原始变量间应该有较强的相关性。原始变量间应该有较强的相关性。 提取公共因子提取公共因子 这一步要确定因子求解的方法和因子的个数。需要这一步要确定因子求解的方法和因子的个数。需要根据研究根据研究者的设计方案或有关的经验或知识事先确定。因子个数的确者的设计方案或有关的经验或知识事先确定。因子个数的确定可以根据因子方差的大小。只取方差大于定可以根据因子方差的大小。只取方差大
57、于1(1(或特征值大于或特征值大于1)1)的那些因子,因为方差小于的那些因子,因为方差小于1 1的因子其贡献可能很小;按的因子其贡献可能很小;按照因子的累计方差贡献率来确定,一般认为要达到照因子的累计方差贡献率来确定,一般认为要达到6060才能才能符合要求;符合要求; 因子因子旋转旋转 通过坐标变换使每个原始变量在尽可能少的因子之间有密切通过坐标变换使每个原始变量在尽可能少的因子之间有密切的关系,这样因子解的实际意义更容易解释的关系,这样因子解的实际意义更容易解释, ,并为每个潜在并为每个潜在因子赋予有实际意义的名字。因子赋予有实际意义的名字。 计算计算因子得分因子得分 求出各样本的因子得分,
58、有了因子得分值,则可以在许多求出各样本的因子得分,有了因子得分值,则可以在许多分析中使用这些因子,例如以因子的得分做聚类分析的变量,分析中使用这些因子,例如以因子的得分做聚类分析的变量,做回归分析中的回归因子。做回归分析中的回归因子。 因子分析是十分主观的,在许多出版的资料中,因子分析模因子分析是十分主观的,在许多出版的资料中,因子分析模型都用少数可阐述因子提供了合理解释。实际上,绝大多数型都用少数可阐述因子提供了合理解释。实际上,绝大多数因子分析并没有产生如此明确的结果。不幸的是,评价因子因子分析并没有产生如此明确的结果。不幸的是,评价因子分析质量的法则尚未很好量化分析质量的法则尚未很好量化
59、. 一一 利用利用SPSS进行因子分析进行因子分析 二二 因子分析在市场研究中的应用因子分析在市场研究中的应用 8.6 实例分析 一、利用SPSS进行因子分析 (一)(一) 操作步骤操作步骤1. 在在SPSS窗口中选择窗口中选择AnalyzeData ReductionFactor,调,调出因子分析主界面图出因子分析主界面图1,并将变量,并将变量X1X13移入移入Variables框中。框中。 图图1 因子分析主界面因子分析主界面 2. 点击点击Descriptives按钮,展开相应对话框,见图按钮,展开相应对话框,见图2。选择。选择Initial solution复选项。这个选项给出各因子的
60、特征值、各复选项。这个选项给出各因子的特征值、各因子特征值占总方差的百分比以及累计百分比。单击因子特征值占总方差的百分比以及累计百分比。单击Continue按钮,返回主界面。按钮,返回主界面。 图图2 Descriptives子对话框子对话框 3. 点击点击Extraction按钮,设置因子提取的选项,见图按钮,设置因子提取的选项,见图3。在。在Method下拉列表中选择因子提取的方法,下拉列表中选择因子提取的方法,SPSS提供了七种提供了七种提取方法可供选择,一般选择默认选项,即提取方法可供选择,一般选择默认选项,即“主成分法主成分法”。在在Analyze栏中指定用于提取因子的分析矩阵,分别
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中乐器数字化工艺的自动化生产线研究考核试卷
- 火灾现场安全评估报告撰写规范考核试卷
- 低温仓储损耗的保险产品设计策略研究考核试卷
- 国际税收考试题及答案
- 政策环境对冷冻饮品行业节能减排目标的影响评估考核试卷
- 数学高考试题及答案
- 福建体育高考试题及答案
- 军人教官考试题及答案
- 优教资格考试试题及答案
- 药学法规考试试题及答案
- 边际贡献分析
- 2017人教版一年级语文下册识字表
- 《高度参与的课堂 提高学生专注力的沉浸式教学》读书笔记思维导图PPT模板下载
- GB/T 28046.1-2011道路车辆电气及电子设备的环境条件和试验第1部分:一般规定
- 外科病应急预案嵌顿疝病人应急预案
- 孤独症康复教育人员上岗培训练习题库及答案
- 机械设备投入计划及保证措施
- 东南大学附属中大医院ECMO操作记录单
- 每月防火检查及记录表(每月一次)
- 工程项目成本预算表
- GB∕T 3639-2021 冷拔或冷轧精密无缝钢管
评论
0/150
提交评论