版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
31.因子分析一、基本原理因子分析,是用少数(sǎoshù本gēnběn)作用、相立、易于解释通常又是不可观察的因和描述数据(shùjù)一组相互关联。通常情况下,这些相关因不能直观观测。因子分析是从研系数矩阵内部的系出发,把一些具有错综复杂关系的变量归结为少数几个综合zōnghé)因子的一种多变量统计分。简言之,即用少数不可观隐变量来解释原始变量之间的相关性或协方差。因子分析的作用变量个数,根据量的信息进行重组,能反映量大部分的信息;原始部分之间多存在较显著的相关关组变量(因子变量)之间相立;因子变量具有命名ìngmíng)解释性,即该变量是对某些原始变量信息的合和反映。主成分分析是因的特例。主成份目标是降维,而因子分析的找出公共因素及特有因素,共因子与特殊因子。因子分析模型在与线性回归模型但两者有着本质的区别:回中的自变量是可观测到的,子模型中的各公因子是不可观测的隐变量,而且两个模型的参数意义也不相同。得到(dédào)计的因子模必须对得到的公因子进行解释。即对每因子给出一种意义明确的名用来反映在预测每个可观察这个公因子的重要性。该公的重要程度就是在因子模型矩阵中相应于这个(zhège)因子的系数。由于óú)因子载荷阵不惟一,故可对因子(īnǐ)载荷阵进行旋转。目的子载荷阵的结构简化,使载阵每列或行的元素平方值向0和1两极分化(iǎɡífēnhuà,这样的因子便于解释和命名。每个样本都可以计算其在各个公因子上的得分,利用因子得分以及该公因差贡献比例,又可以计算每本的综合得分。二、因子分析实例例1(综合评价问题)对我国30个省市经济发展的8个指标进行分析和排序。数据文件如下:x1=GDP;x2=居民消费水平;x3=固定资产投资;x4=职工平均工资;x5=货物周转量;x=居民消费价格;x7=商品hāngpǐn价格指数;x8=gōè)总产值。1.【分析(ēnxī——【降维】——【因子分析】,打开“因子分析”窗口,将变量“x1-x8”选入【量(biànling)】框;2.点【描述(iáoshù)】,打开“描述统计”子窗口,勾选【统计量】下的“单变量描、“原始分析结果”关矩阵】下的“系数”、“再生”、“KMO和Bartlett的球形度检验”;点【继续】;3.点【抽,打开“抽子窗口,【】选“主成份”,【分析】选“相关性矩输出】勾选“未旋转因子(īnǐ)解”、“碎石图”,【抽取】选“基于(jīú)特征值:特大于‘1’”;点【继续(jìxù);注1:提取公因子(īnzǐ法有(1主成份法(默认),假设变量(biànling)是各因子的线性组合,从解释变量的变异除非量是变量的方差能被主成分所解释,适合大多数情况;(2)未加权的最小平方法:使相关矩阵和再生(zàhēng相关矩阵之差的平方和达到最小;(3)综合(znghé)小平方法:同(2),并用ìnɡònɡ值的倒数对相关系数加权;(4)最大似然法:要求数据服从(fúóng)多变量正态分布,此时生成的参最接近观察到相关矩阵,适本量较大情况;(5)主轴(hǔzhóu因子分解始变量的相关性出发,使变量间的相尽可能地被公因子解释,但量方差的解释不太重视;(6)分解法:将变量看出从潜在的变量空间出的样本,计算时尽量使得变量的α信度达到最大,适合不好的数据;(7)映像因子分解法:把一变量看作是其它变多元回归,提取公因子。注2:计算特征值和特征向量时,可选关矩阵(不受量纲影响)或协方(受量纲影响较大,需先进量标准化)计算主成分。但SPSS做因子时,已经包含了量标准化过程。者结果有差异,但在对因子解释和方差贡献率的解释上是一致的。4.点【旋转】,“旋转”子窗口,【方“最大方差法”,【输出】旋转解”、“载;点【继续】;注:1)最大方差法:最常用,使各因子保持正交前提下的方差差异(相对载荷平方和)达方便(ngbiàn)对公因子解释;(2)最大四次方值法:各因子(īnzǐ方差差异化更强,并减少和每个变量有关联的因子数,简化对原变量的解释;(3)最大平衡值法:介于方差(fānɡà)最大正交旋转与4次方最大正交旋转(xuánzhuǎn)之间;(4)直接(zhíjiē)Obliin法:斜,需先指定一个因子映像的自相关范围;(5)Promax:最常用的斜交旋转法,在方差最大正交旋转的基础上再进行转,旋转后允许因子间存在,适合有具体的结果倾向时选用。5.用主成分法提因子,用回归法对因子计。点【得分】,打子得分”子窗口“保存为变量”方法选“回归”示因子得分系数;点【继续】;另外(lìnɡwi),若在【选项】子窗口,将【系数显示(iǎnshì)格式】勾选“按大小排序”,将按载荷从大到小排列(pili)变量。点【确定(qudìng到(部分与主成份(chngfn)分析结果相同,略)KM和Bart的检验t取样足够度的Kaiser-Me度量。-Olkin .620近似卡方 231.285Bart度检验 df 28Sig. .000KMO检验变量间的偏相是否较大,该值越大越适合做因子分析,0.7以上因子分析效果较好,0.5以下不适合做因子。KMO值=0.620<0.说明变量间的重叠可能不是特别高。Bartlett球形度检验判断相关系数是否是阵,原假设H0:各变量相互独立。P值<0.01<0.5,故拒绝原假设,即变量间有较强的相关性。公因子方差初始 提取GDP居民消费水平固定资产投资职工平均工资货物周转量居民消费价格指数商品价格指数工业总产值
1.000 .9451.000 .7991.000 .9021.000 .8731.000 .8571.000 .9571.000 .9281.000 .904提取方法:主成份分析。公因子方差,表示各变量(biànliàng)中所含原始信息能被提取的公因子所表示的程度。基本都在0.80以上,表示提取的公因子对各变量(biànling)有较强的解释能力。解释的总方差成份 初始特征值 提取平方和载入 旋转平方和载入合计方差的%累积%合计方差的%累积%合计方差的%累积%1 3.75446.9246.93.75446.946.93.20740.040.0922 2.20327.5324.42.20327.574.42.21727.767.8003 1.20815.0969.51.20815.089.51.74021.789.5514 .4035.0494.5935 .2142.6797.2666 .1381.7298.9887 .066.82999.8178 .015.18100.000提取方法:主成份分析。【初始特征值】表示初步提取(tíqǔ共同的结果:计”列为每一个分的特征值,其值越大该主成分在解释8个变量(biànliàng)的变异时越重要;“方差的”列为每个提取(tqǔ素可以解释的变异百分比;“累积%”列为解释的变异的累积百分比;8个变量始特征值=1)总特征值8,第一个特征值=3.754,3.754/8=46.924%即第一个“方差的”值,累积百分比最终是10%.【提取平方和载出了旋转前的特解释变异量、累积(lěiī)解释变异量;主成分法默认只提取≥1的特征值,共3即3子(yīnzǐ)(3否(shìǒu)适借助碎石图判断),它们tāmen)共可解释89.551%的变(biàì)。【旋转平方和载出了旋转后的特解释变异量、累积解释变异转后,共同因素的特征值会,但总的特征值之和不变(变异的累积百分比相同);性也不会改变,但每个变量在因素中的负荷系数会改变。碎石图,可以帮助决定因子的数目。碎石图将每个公因子的特征值(重要程度)从高到低排序绘制成一条坡度线,横轴为公因子数目。其判是:取坡度线急剧下降的部去掉坡度线平坦的部分,从图中看选取4个共同因素是合适的。另外(lìnɡwi),也要参考选取的合理性:选择的公因子īnzǐ)包含(ohán的变量数不能太少。正常(zhgcháng)情况下需要将【抽取】的公因子数设为4重新(chóngxīn)做因子分析:在原窗口点【抽取】,打开“抽取”子窗口,选择【抽取】下的“因子的固定数量”,在【要提取的因子】框输入“4”;点【继续】;但由于本例中较少,故保持原来的3个公因子。成份矩阵a成份1 2 3GDP居民消费水平固定资产投资职工平均工资货物周转量居民消费价格指数商品价格指数工业总产值
.884 .385 .120.606 -.596 .277.911 .163 .213.465 -.725 .362.486 .737 -.279-.510 .257 .794-.621 .596 .433.822 .429 .210提取方法:成份。a已提取了个成份。旋转(xuzuǎn)前(实际上是主成分(chngfèn)分析的结果),8个变量(ànling)在3个公因子(īnzǐ的载荷矩阵,载荷值越大表示该变量(binliàng)与其共同因素的关联越大。由该矩阵可以计算每个变量同性、每个公因特征值、再生相阵。公因子结构表达式(因子模型,前3项为共同因素,εi为特殊因子):1=0.884*F1+0.385*F2+0.120*F3+……8=0.822*F1+0.429*F2+0.210*F3+其中,Zxi为xi的标准化变量,Fi的表达式同【第30篇:主成份分析】中的表示。共同性为每个变公因子上载荷的,如变量“固定资产投资”的共同性为09112+132+.32=0.902公因子的特是该公因子上所有载荷方和,如公因子1的特征值为(注特征值是从大到小排列):112+.882+.822+…+(-0.10)3.754aaaaaaaaaaaaaaGDP居民消费水固定资产投职工平均工货物周转平 资 资 量
居民消费价格商品价格指工业总产指数 数 值GDP .945 .341 .894居民消费水平 .341.799 .515固定资产投资 .894 .515.902职工平均工资 .176 .814 .383
.176.680.814-.222.383.503.873-.409
-.257-.268.917-.243-.611.301-.254-.376.864-.136-.563.148再生的相货物周转量关性 居民消费价格指数
.680-.222.503--.243-.254.257
-.409.857-.136-.280
-.280.017.657.957 .814-.142-商品价格指数 -.611-.376-.563.017 .814.928-.163.268工业总产值 .917 .301 .864 .148.657 -.142-.163.904GDP -.074.056 .011-.062 -.015.004-.044-居民消费水平 -.089-.098.071 .008 .019.062.074固定资产投资 .056-.089 .013-.073 -.026.017-.072职工平均工资 .011-.098.013 .053 -.009.020-.049-残差b 货物周转量 .071-.073.053 .027 .005.002.062居民消费价格 -.008-.026-.009.027 -.051.017指数 .015商品价格指数 .004-工业总产值.044
.019 .017.062-.072
.020.005-.049.002
-.051 -.029.017-.029提取方法:主成份分析。a重新生成的公因子方差b将计算观察到的相关性和重新生成的相关性之间的残差。有11(3个绝对值大于0冗余残差。旋转成份矩阵a成份1 2 3GDP居民消费水平固定资产投资职工平均工资货物周转量居民消费价格指数商品价格指数工业总产值
.955 .124 -.131.219 .841 -.209.872 .351 -.137.048 .925 -.121.751 -.507 -.192-.135 -.013 .969-.104 -.496 .819.944 .109 -.014提取方法:成份。旋转法具有Kai标准化的正交旋转法。a旋转在次迭代后收敛。采用(ǎiòng)方差最大正交旋转旋转后的公因子矩阵,旋转的目的ùdì)是为了让载荷大的越大、小的载荷平方和不变),从易区分各变量的归属。由于交转轴,故表中系数可视为变量与共同因素的矩阵(因素结构或加权矩阵),等于旋转前的公因子(īnzǐ荷àihè)阵乘以成份转换(zhuǎnhuàn)矩阵。标准定为选择载荷大于0.5的变量,可看出公因子(īnǐ1含bāohn)变量:GDP、工业总产值、固定资产投资(tóuī)、货物周转量;从而(cóngr),可命名(ìngmíng为总量因子;公因2包含变量:职工平均工资、居民消费水平;从而,可命名为消费因子;公因3包含变量:居民消费价格指数、商品价格指数;从而,可命名为价格因子。成份转换矩阵成份 1 2 31 .817 .407 -.4082 .548 -.769 .3313 .179 .494 .851提取方法 :主成份。旋转法 :具有 Kaiser 标准化的正交旋转法。成份得分系数矩阵成份1 2 3GDP居民消费水平固定资产投资职工平均工资货物周转量居民消费价格指数商品价格指数工业总产值
.306 .011 .047.025 .387 .040.270 .129 .075-.025 .451 .096.248 -.319 -.139.070 .180 .653.077 -.098 .462.317 .026 .123提取方法:成份。旋转法具有Kai标准化的正交旋转法。成分得分矩阵给出了各主成分量上的载荷(zàih),从而得到计算公式:F1=.6Zx1+0.52+0.2703-0.254+0.248Z5+0.070Z6+0.077Z7+0.31
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年水利水电项目造价管理中的流程优化
- 2026黑龙江哈尔滨工业大学机电工程学院机械设计系招聘备考题库及一套完整答案详解
- 2026年机械加工工艺规程中常见问题解析
- 2026河北邢台学院高层次人才引进55人备考题库及参考答案详解
- 2026年货运交通安全评价与优化
- 文物修复师安全意识强化模拟考核试卷含答案
- 药膳制作师复测模拟考核试卷含答案
- 绝缘成型件制造工岗前安全检查考核试卷含答案
- 热带作物栽培工发展趋势强化考核试卷含答案
- 变配电运行值班员安全管理强化考核试卷含答案
- 生鲜安全操作培训
- 2026届云南省保山一中高二生物第二学期期末检测试题含解析
- 2026年区块链安全审计成功经验分享
- 道法历久弥新的思想理念 课件-2025-2026学年统编版道德与法治七年级下册
- 2026版生产经营单位安全生产管理人员试题及答案
- 环氧地坪施工合同模板与范本
- 福建省装配式结构构件生产和安装信息化技术规程
- 医疗纠纷处理与防范考核培训
- 2026春教科版(新教材)小学科学二年级下册教案(全册)
- 黑龙江省考面试真题(省市级综合类)
- DB37∕T 3772-2025 农业用水定额
评论
0/150
提交评论