《多元统计分析》(第6版)课件 第5、6章:主成分分析理论与应用、因子分析理论与应用_第1页
《多元统计分析》(第6版)课件 第5、6章:主成分分析理论与应用、因子分析理论与应用_第2页
《多元统计分析》(第6版)课件 第5、6章:主成分分析理论与应用、因子分析理论与应用_第3页
《多元统计分析》(第6版)课件 第5、6章:主成分分析理论与应用、因子分析理论与应用_第4页
《多元统计分析》(第6版)课件 第5、6章:主成分分析理论与应用、因子分析理论与应用_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

主成分分析理论与应用CONTENTS目录01主成分分析概述02主成分分析的基本思想03主成分分析的基本理论04主成分分析的几何意义05主成分的求解方法CONTENTS目录06主成分的性质07主成分分析的应用注意事项08主成分分析的步骤09主成分分析的SPSS实现与案例10主成分分析的总结与展望主成分分析概述01主成分分析的定义

提出背景与核心思想主成分分析由霍特林于1933年首次提出,其核心是利用降维思想,在损失很少信息的前提下,将多个指标转化为少数综合指标(主成分),以简化问题并揭示变量间规律。

主成分的本质特征每个主成分都是原始变量的线性组合,且各主成分之间互不相关,能保留原始变量绝大多数信息,比原始变量具有更优越的性能,便于抓住主要矛盾。2026/5/16主成分分析的学习目标

理论方法理解理解主成分分析的基本理论与方法,包括其降维原理、主成分与原始变量的关系及内在逻辑。

主成分性质掌握了解主成分的性质,如协方差阵为对角阵、方差贡献率等,明确主成分在数据浓缩中的作用机制。

求解与软件应用掌握主成分的求解方法,包括从协方差阵或相关阵出发求解特征根与特征向量;学会使用SPSS软件进行主成分分析,并能正确理解和分析软件输出结果。2026/5/16主成分分析的基本思想02问题的提出

多指标研究的矛盾实证研究中,为全面反映事物特征需考虑多个指标,但指标增多会增加问题复杂性,且各指标对同一事物的反映易导致信息大量重叠,甚至掩盖事物真正特征与内在规律。

主成分分析的需求基于上述问题,需要一种能在定量研究中涉及较少变量却得到较多信息的方法,主成分分析应运而生,其旨在通过原来变量的少数几个线性组合来解释原来变量绝大多数信息。2026/5/16主成分是原始变量的线性组合每一个主成分都是各原始变量的线性组合,这是主成分的基本构成形式。主成分数量少于原始变量主成分的数量大大少于原始变量的数量,从而达到简化问题的目的。主成分保留原始变量绝大多数信息主成分保留了原始变量的绝大多数信息,在研究复杂问题时,只考虑少数几个主成分不至于损失太多信息。各主成分之间互不相关各主成分之间互不相关,使得主成分比原始变量具有某些更优越的性能,便于分析和研究。主成分与原始变量的关系主成分分析的基本理论03基本概念与线性变换

核心概念定义设研究涉及p个指标,构成p维随机向量X=(X₁,X₂,…,Xₚ)′,其均值为μ,协方差矩阵为Σ,用于描述变量离散程度与相关性。线性变换表达式通过线性变换Y=AX生成新综合变量Y,其中Y=(Y₁,Y₂,…,Yₚ)′,X=(X₁,X₂,…,Xₚ)′,A为变换系数矩阵,目标是将高维数据降维。2026/5/16单位向量约束要求变换系数向量满足u′ᵢuᵢ=1(i=1,2,…,p),避免方差无限制增大,确保问题有实际意义。正交无关约束各主成分Yᵢ与Yⱼ(i≠j)相互无关,即cov(Yᵢ,Yⱼ)=0,消除信息重叠,保证主成分独立性。方差最大化约束Y₁是X所有满足单位向量约束的线性组合中方差最大者,Y₂是与Y₁无关的线性组合中方差最大者,依此类推,实现信息有序浓缩。线性变换的约束原则主成分分析的几何意义04二维空间中的几何意义原始变量的二维散布特征在由两个原始变量X1、X2构成的二维坐标系中,N个样品点呈带状散布,沿X1轴和X2轴方向均有较大离散性,单独使用任一变量会损失较多信息。坐标轴旋转与信息浓缩通过逆时针旋转坐标轴θ角度,得到新坐标轴Y1和Y2。旋转后样品点在Y1轴上的离散程度最大,Y1集中了原始数据的绝大部分信息,实现数据信息的浓缩。旋转变换的数学表达坐标旋转公式的矩阵形式为Y=UX,其中U为正交阵(满足Uᵀ=U⁻¹,UᵀU=I),主成分分析的核心即求解该变换矩阵U,使新坐标轴方向为数据变差最大方向。2026/5/16多元正态分布下的几何意义01二元正态分布的密度函数与椭圆方程二元正态分布密度函数经推导可转化为椭圆方程(x-μ)ᵀΣ⁻¹(x-μ)=d²,其中Σ为协方差矩阵。标准化后方程为Z₁²-2ρZ₁Z₂+Z₂²=d²(1-ρ²),椭圆长短轴为2d/√(1±ρ)。02主成分与椭圆主轴方向设Σ的特征根λ₁≥λ₂>0,对应的标准正交特征向量为γ₁、γ₂,正交阵P=(γ₁,γ₂),则椭圆在Y1=γ₁ᵀX、Y2=γ₂ᵀX构成的新坐标系中,主轴方向即为Y1、Y2坐标轴方向,Y1方向集中了最大变差。03多维情况的扩展对于多维正态分布,主成分分析的几何意义类似:通过坐标系旋转,将数据投影到协方差矩阵(或相关矩阵)特征向量构成的新坐标轴上,各主成分方差对应特征根,且变差按特征根大小依次递减,多维空间中数据信息主要集中在前几个主成分方向。2026/5/16主成分的求解方法05从协方差矩阵出发求解协方差矩阵与主成分关系

设随机向量X的协方差矩阵为Σ,λ₁≥λ₂≥…≥λₚ为Σ的特征根,γ₁,γ₂,…,γₚ为对应的标准正交特征向量,第i个主成分为Yᵢ=γᵢ'X,其方差var(Yᵢ)=λᵢ,协方差cov(Yᵢ,Yⱼ)=0(i≠j)。主成分的核心性质

Y的协方差阵为对角阵Λ=diag(λ₁,λ₂,…,λₚ);总方差分解为各主成分方差之和,即tr(Σ)=Σλᵢ;第k主成分方差贡献率αₖ=λₖ/Σλᵢ,累积贡献率用于确定主成分个数(通常≥85%)。因子负荷量的意义

第k主成分Yₖ与原始变量Xᵢ的相关系数ρ(Yₖ,Xᵢ)=γᵢₖ√λₖ/√σᵢᵢ,刻画原始变量对主成分的重要性,其平方和等于该主成分对Xᵢ的方差贡献率。2026/5/16从相关矩阵出发求解相关矩阵的标准化基础对原始变量标准化Z=(Σ^(-1/2))(X-μ),E(Z)=0,var(Z)=1,相关矩阵R即标准化变量的协方差矩阵,求解主成分过程与协方差矩阵一致,特征根λᵢ、特征向量γᵢ意义类似。相关矩阵主成分性质Y协方差阵为对角阵Λ;总方差tr(R)=p;第k主成分方差贡献率αₖ=λₖ/p;因子负荷量ρ(Yₖ,Zᵢ)=γᵢₖ√λₖ,因var(Zᵢ)=1,形式更简单,直接反映标准化变量与主成分相关性。两种矩阵求解的区别协方差矩阵求解保留原始变量量纲差异,适合同度量/同量级数据;相关矩阵求解消除量纲影响,适用于不同量纲/取值范围差异大的指标(如利润总额与市盈率),结果可能显著不同。2026/5/16主成分的性质06方差与协方差性质

主成分协方差阵的对角化特性主成分的协方差矩阵为对角阵Λ,表明各主成分之间互不相关,实现了原始变量信息的无重叠提取。

主成分方差与特征根的对应关系各主成分的方差等于协方差矩阵或相关矩阵的特征根λi,即var(Yi)=λi,特征根大小反映主成分携带信息的多少。

方差总和的不变性主成分方差总和等于原始变量方差总和,即λ1+λ2+…+λp=tr(Σ)(协方差阵迹)或tr(R)=p(相关阵迹,标准化后变量方差和为p),保证信息总量守恒。2026/5/16方差贡献率与因子负荷量

01方差贡献率的定义与作用第k个主成分的方差贡献率为αk=λk/Σλi,反映该主成分解释原始变量总方差的比例;累积贡献率Σαk(k=1至m)用于确定主成分个数,通常取累积贡献率≥85%的m个主成分。

02因子负荷量的概念及意义因子负荷量是主成分Yk与原始变量Xi的相关系数ρ(Yk,Xi),其绝对值大小刻画主成分的成因及原始变量对主成分的重要性,是主成分解释的核心依据。

03因子负荷量与主成分系数的关系因子负荷量ρ(Yk,Xi)=γik√λk/√σii(协方差阵)或ρ(Yk,zi)=γik√λk(相关阵,zi为标准化变量),与主成分系数γik成正比,与原始变量标准差成反比,不可与系数向量混淆。2026/5/16主成分分析的应用注意事项07协方差阵与相关阵的选择指标量纲不同或取值范围差异大时的选择对于度量单位不同的指标或取值范围彼此差异非常大的指标,不直接由其协方差矩阵出发进行主成分分析,而应该考虑将数据标准化,从相关矩阵出发求解主成分。例如在对上市公司财务状况分析时,利润总额、市盈率、每股净利率等指标取值范围相差很大,直接用协方差阵分析,利润总额会起支配作用,此时应标准化后用相关阵。同度量或同量级指标的选择对取值范围相差不大或度量相同的指标进行标准化处理后,其主成分分析的结果与由协方差阵出发求得的结果有较大区别。标准化会抹杀原始变量离散程度差异,各变量方差均为1,而方差是数据信息的重要概括,因此对同度量或同量级的数据,直接从协方差矩阵求解主成分为宜。实际应用中的建议在实际工作中,建议分别从协方差阵和相关阵出发求解主成分并研究结果差别,确定哪种结果更可信,不考虑实际情况就标准化或直接用相关阵是有不足的。2026/5/16数据分布与重叠信息主成分分析对数据分布的要求主成分分析不要求数据来自正态总体,无论是从协方差矩阵还是相关矩阵出发求解主成分,均不涉及总体分布问题。它是对矩阵结构的分析,用到矩阵运算、对角化和谱分解技术,只要变量协方差矩阵或相关矩阵非负定,就能求出主成分,扩展了应用范围。原始变量相关性对主成分分析的影响主成分分析适用于变量之间存在较强相关性的数据,若原始数据相关性较弱,如大部分变量相关系数小于0.3,运用主成分分析不能起到很好的降维作用,各主成分浓缩原始变量信息的能力差别不大。主成分分析与重叠信息的关系主成分分析对重叠信息的剔除无能为力,若原始变量存在重叠信息,如某指标被考虑两次,其在生成主成分构成中会起到加倍作用,使主成分方差总和等发生变化。当样本协方差矩阵(或相关阵)最小特征根接近于零时,表明原始变量存在多重共线性即重叠信息,需注意对主成分的解释或筛选初始指标。2026/5/16主成分分析的步骤08分析步骤概述

选取初始分析变量根据研究问题筛选具有代表性的指标,确保变量能反映事物特征及规律,避免遗漏关键信息。

判断矩阵类型依据变量特性选择:若变量度量单位不同或取值范围差异大,采用相关矩阵;同度量或同量级数据,宜用协方差矩阵。

求解特征根与特征向量通过矩阵运算,求解协方差阵或相关阵的特征根及对应的标准正交特征向量,特征根体现主成分方差贡献。

判断多重共线性若矩阵最小特征根接近零,表明原始变量存在多重共线性,需返回第一步重新筛选变量。

确定主成分个数与表达式按累积贡献率(通常≥85%)或特征根碎石图确定主成分个数,根据特征向量得到主成分线性表达式。

结合问题分析利用主成分结果解释变量内在规律,结合实际问题进行深入研究,如综合评价、分类或降维建模。2026/5/16变量筛选与准备起点为根据研究目标选取初始变量,完成数据收集与预处理,为后续分析奠定基础。矩阵选择与计算根据变量特性判断使用协方差阵或相关阵,进而求解其特征根与特征向量,此为核心计算环节。共线性检验与调整对矩阵进行多重共线性判断,若存在问题则返回变量筛选阶段重新优化,确保分析有效性。主成分提取与确定依据特征根及累积贡献率确定主成分个数,得到主成分表达式,实现数据降维与信息浓缩。结果分析与应用将提取的主成分应用于实际问题分析,如综合评价、分类研究等,形成完整分析闭环。逻辑框图展示主成分分析的SPSS实现与案例09SPSS操作步骤

数据录入与准备将原始数据录入SPSS数据表,确保变量名称与数据一一对应,如例5-1中9个行业工资数据按地区分行、指标分列录入。

进入FactorAnalysis模块依次点击菜单栏“Analyze→DimensionReduction→Factor”,打开因子分析对话框,准备进行主成分分析设置。

选择分析变量在FactorAnalysis对话框中,将待分析的原始变量(如X1至X9)选入“Variable(s)”框,作为主成分分析的输入指标。

参数设置点击“Extraction”按钮,设置提取方法为“Principalcomponents”,选择分析矩阵类型(协方差阵或相关阵),并勾选“Screeplot”等输出选项,完成后点击“Continue”返回主对话框。2026/5/16案例一:地区行业工资水平分析

数据背景与分析选择使用2022年我国31个地区9个行业城镇私营企业就业人员平均工资数据(单位:元),因各变量量纲差别不大,选择从协方差阵出发提取主成分。

关键结果解读Communalities表显示第一主成分对X6(金融业)信息提取率最高(96.3%),对X3(电力等行业)最低(40.6%);TotalVarianceExplained表中第一主成分方差贡献率为83.705%,保留原始信息超80%。

主成分表达式建立根据ComponentMatrix表计算特征向量,得到第一主成分表达式:Y1=0.127X1+0.234X2+0.190X3+0.136X4+0.120X5+0.797X6+0.172X7+0.352X8+0.266X9,其中X6(金融业)系数最大,表明其对主成分影响最显著。2026/5/16案例二:工业企业经济效益评价

数据特点与分析方法选取2022年各地区规模以上工业企业8项指标(资产总计、负债合计等,单位差异大),对数据标准化后从相关阵出发进行主成分分析。

输出结果解读相关矩阵显示8个变量间存在强相关性(多数相关系数>0.9);TotalVarianceExplained表中第一主成分方差贡献率达96.499%,仅需1个主成分即可概括原始信息。

主成分表达式与应用第一主成分表达式为Y1=0.3538X1关+0.3552X2关+...+0.3523X8关(标准化变量),系数均为正,可用于排序。地区得分显示广东(9.260)、江苏(7.989)等为第一类,西藏(-2.790)等为第三类,反映工业企业规模与效益差异。2026/5/16案例三:餐饮企业经济效益评价数据与主成分提取使用2022年限额以上餐饮企业7项指标(法人企业数、营业收入等),从相关阵出发提取2个主成分,累积方差贡献率96.809%,涵盖绝大部分信息。主成分经济意义主成分Y1(系数以X2-X6为主)综合反映企业整体规模与收入水平;主成分Y2(X7系数0.874)主要反映盈利能力,二者从规模和盈利两方面刻画经济效益。得分与分类分析计算各地区主成分得分并绘制散点图,江苏(Y1=4.792,Y2=1.955)、四川(Y1=1.970,Y2=1.716)等位于第一象限,为经济效益较好地区;海南、西藏等位于第三象限,企业规模小且盈利能力弱;北京、上海虽规模大但效益欠佳(Y2为负)。2026/5/16主成分分析的总结与展望10主成分分析的优势与局限

降维简化,提升分析效率通过将多个原始变量转化为少数几个主成分,在保留85%以上信息的前提下(如例5-1中第一主成分贡献率83.705%),有效降低数据维度,简化模型复杂度,提高分析效率。

揭示变量关系,凸显核心规律通过协方差矩阵或相关矩阵的特征根与特征向量分析,揭示变量间内在关联(如例5-2中8个工业指标高度相关,主成分综合反映整体规模与收益),抓住主要矛盾。

主成分意义解释依赖专业知识主成分是原始变量的线性组合,其经济或实际意义需结合领域知识解读(如例5-3中主成分1代表企业规模,主成分2代表盈利能力),缺乏统一标准,易产生主观偏差。

无法有效剔除重叠信息若原始变量存在多重共线性(如相关系数>0.9),主成分分析会将重叠信息纳入主成分,可能导致结果失真(如重复指标会加倍影响主成分构成)。2026/5/16大数据与高维数据处理在基因测序、图像识别等领域,主成分分析可快速压缩高维数据(如百万级特征降维至数百主成分),为后续机器学习模型提供高效输入。跨学科融合应用结合经济学、生物学等领域,用于综合评价(如区域经济竞争力、物种多样性),例5-2中通过主成分得分对31个地区工业经济效益分类排序。与其他统计方法结合优化与因子分析、聚类分析结合(如主成分-聚类模型),提升解释性与分类精度;或与偏最小二乘回归结合,解决多重共线性问题(主成分回归)。算法改进与稳健性提升研究针对非正态数据、缺失值的稳健主成分分析方法,开发自适应降维算法(如稀疏主成分),增强在复杂数据场景下的适用性。应用前景与发展方向THEEND谢谢观看因子分析理论与应用CONTENTS目录01因子分析概述02因子分析的基本思想与理论03因子载荷的求解方法04因子旋转与因子得分CONTENTS目录05因子分析与主成分分析的区别06因子分析的步骤与逻辑框图07因子分析的上机实现08案例分析因子分析概述01学习目标

01理解因子分析方法的思想领会因子分析通过降维将复杂变量归结为少数公共因子的核心思路,把握其对变量相关性分组的本质。

02了解因子分析的基本理论掌握因子分析模型的构成,包括公共因子、特殊因子、因子载荷等关键概念及相关数学表达。

03掌握求解因子的方法步骤熟悉从确定因子载荷、因子旋转到计算因子得分的完整流程,明确各环节的实现方式。

04分辨因子分析与主成分分析的异同对比两种方法在模型设定、变量关系、假设条件等方面的区别与联系,理解各自适用场景。

05能够用SPSS软件进行因子分析并理解结果学会运用SPSS的FactorAnalysis模块执行因子分析,正确解读输出的载荷矩阵、方差解释表等结果。2026/5/16因子分析的定位与核心思想作为主成分分析的推广,因子分析基于降维思想,从原始变量相关矩阵内部依赖关系出发,将错综复杂的变量归结为少数综合因子。因子分析的特点与主成分分析相比,更倾向于描述原始变量之间的相关关系,出发点为原始变量的相关矩阵,通过公共因子和特殊因子构建变量分解模型。因子分析的发展与应用领域思想始于1904年查尔斯·斯皮尔曼对学生考试成绩的研究,如今已成功应用于心理学、医学、气象、地质、经济学等多个领域,理论方法不断丰富。因子分析的概念因子分析的基本思想与理论02基本思想

变量分组原则根据相关性大小对原始变量分组,同组内变量相关性较高,不同组变量相关性较低,每组代表一个基本结构即公共因子。

原始变量构成原始变量可分解为两部分:少数不可观测公共因子的线性函数与该变量特有的特殊因子,特殊因子与公共因子相互独立。

物价变动案例反映物价变动无需调查所有商品价格,通过提取“综合商品”价格这一公共因子,即可代表某类商品物价变动,体现降维与信息浓缩思想。2026/5/16斯皮尔曼的例子

研究背景与数据1904年斯皮尔曼研究33名学生古典语(C)、法语(F)等6门考试成绩,得到相关矩阵,发现非对角元素大致成比例规律。

单公共因子模型提出模型xi=aiF+ei,xi为标准化成绩(均值0、方差1),F为公共因子(一般智力,均值0、方差1),ei为特殊因子且与F独立。

因子载荷与共同度ai为因子载荷,其平方a²i称为共同度,代表公共因子解释xi方差的比例,满足1=a²i+var(ei),var(ei)为特殊因子方差(特殊度)。2026/5/16一般因子分析模型模型数学形式xi=ai1F1+ai2F2+…+aimFm+ei,xi为标准化变量(均值0、方差1),F1…Fm为独立公共因子(均值0、方差1),ei为特殊因子(均值0、与F独立)。基本假设条件原始变量X均值向量E(X)=0、协方差矩阵Σ=相关阵R;公共因子F协方差矩阵为单位阵I;特殊因子ε协方差矩阵为对角阵且与F独立。矩阵表达形式模型矩阵形式为X=AF+ε,其中X=(X1…Xp)为可观测变量向量,A为p×m因子载荷矩阵,F=(F1…Fm)为公共因子向量,ε=(ε1…εp)为特殊因子向量。2026/5/16因子载荷aij的含义aij是xi与Fj的协方差,因xi和Fj均为标准化变量(均值0、方差1),故aij同时也是两者的相关系数,其绝对值反映xi与Fj的相依程度。变量共同度h²ih²i=a²i1+a²i2+…+a²im,代表所有公共因子解释xi方差的比例,满足var(xi)=1=h²i+var(εi),h²i越大,因子分析效果越好。公共因子方差贡献g²jg²j=a²1j+a²2j+…+a²pj,是公共因子Fj对所有原始变量方差贡献的总和,用于衡量Fj的相对重要性,g²j越大,Fj对X的影响越显著。载荷矩阵的统计意义因子载荷的求解方法03主成分法基本思路先对数据进行主成分分析,将前m个主成分作为未旋转的公共因子,通过对主成分标准化处理得到因子模型。载荷矩阵与共同度载荷矩阵A=(√λ1γ1,...,√λmγm),其中λ为相关阵特征根,γ为标准正交特征向量;共同度h²i=Σ(aij)²,反映公共因子对变量方差的解释比例。优缺点及适用情况优点:简单直观,易于实现;缺点:特殊因子不独立,不完全符合因子模型假设。适用于共同度较大、特殊因子影响可忽略的场景。2026/5/16主轴因子法

核心原理以调整相关矩阵R*=R-Σε(主对角线为共同度h²i)为出发点,求解其特征根与特征向量,得到因子载荷矩阵A=√λ*γ*。

与主成分法的区别主成分法基于原始相关阵,解释全部方差;主轴因子法基于调整相关阵,仅解释公共因子方差,更符合因子模型“部分方差解释”的假设。

共同度初始估计通常先通过主成分分析得到初始共同度估计,再迭代优化调整相关矩阵,直至结果稳定。2026/5/16极大似然法

假设前提假定公共因子F和特殊因子ε均服从正态分布,即F~N(0,I),ε~N(0,Σε),且两者相互独立。

估计方法通过极大化似然函数估计因子载荷A和特殊因子方差Σε,需添加唯一性条件A'Σε⁻¹A=Λ(Λ为对角阵)以确定唯一解。

特点理论上更严谨,依赖正态分布假设,在大样本下估计效果较好,适用于对模型假设有严格要求的分析场景。2026/5/16因子旋转与因子得分04因子旋转的目的与方法因子旋转的核心目的解决初始因子解意义模糊问题,通过线性组合使各主因子表达式中变量系数差异增大,让公共因子实际意义更明确,便于对实际问题分析。正交旋转的特点与方法保持公共因子彼此独立,由初始载荷矩阵右乘正交阵实现。常用方差最大正交旋转,目标是使各列元素平方的相对方差之和最大,使载荷系数接近0或±1。斜交旋转的特点与方法放弃因子间独立限制,可能得到更简洁形式,实际意义更易解释。常用最优斜交旋转(promax方法),输出结果含因子载荷矩阵(patternMatrix)和相关阵(structureMatrix)。2026/5/16因子得分的定义指公共因子F1,F2,…,Fm在每一个样品点上的得分,用于反映样品在公共因子上的取值,可据此对样品性质及相互关系进行分析。因子得分的计算方法基于回归思想,以公共因子为因变量、原始变量为自变量建立回归方程,在最小二乘意义下得到估计值公式:F=A'R⁻¹X,其中A为因子载荷矩阵,R为原始变量相关阵,X为原始变量向量。因子得分的应用可用于样本点比较分析、聚类分析,当因子数较少时,能将样本点在因子构成的空间中标示,直观描述样本分布,还可代替原始数据进行后续回归等分析。因子得分的概念与计算因子分析与主成分分析的区别05模型与目的差异

因子分析的模型与目的因子分析将变量表示为公共因子和特殊因子的线性组合,目的是探寻对变量起解释作用的公共因子和特殊因子,以及它们的组合系数,从数据中提取潜在结构。主成分分析的模型与目的主成分分析把主成分表示为各变量的线性组合,目的是从空间生成角度寻找能解释诸多变量绝大部分变异的几组彼此不相关的新变量(主成分),实现数据降维。2026/5/16假设与提取方法不同

因子分析的假设与提取方法因子分析需假设公共因子之间不相关、特殊因子之间不相关、公共因子和特殊因子之间不相关;提取方法多样,包括主成分法、主轴因子法、极大似然法等。主成分分析的假设与提取方法主成分分析不需要专门假设;仅用主成分法提取,主成分数量固定(一般有几个变量就有几个主成分),且主成分固定,因子分析中因子可旋转得到不同结果。2026/5/16解释与应用场景区别

因子分析的解释与应用场景因子分析可使用旋转技术帮助解释因子,在解释方面更有优势,适用于需要明确因子实际意义的场景,如探究影响学生成绩的潜在能力因子等。

主成分分析的解释与应用场景主成分分析适合将现有变量变成少数几个几乎带有原来所有变量信息的新变量,用于后续分析;实际中也可通过计算因子得分处理类似场景,但区分并非绝对。2026/5/16因子分析的步骤与逻辑框图06因子分析的步骤选取原始变量根据研究问题确定分析对象,选择具有相关性的指标变量,如衡量企业经济效益的多项财务指标。数据标准化与相关阵分析对原始变量进行标准化处理(均值为0,方差为1),计算相关矩阵并分析变量间相关性,通过KMO检验(>0.7适合分析)和Bartlett球形检验(拒绝单位阵假设)判断适用性。求解初始公共因子及载荷矩阵采用主成分法、主轴因子法等提取公共因子,确定因子载荷矩阵,如主成分法通过相关阵特征根与特征向量求解,保留特征值>1的因子。因子旋转对初始因子进行正交(如方差最大旋转)或斜交旋转,使载荷系数向0或±1集中,便于解释因子意义,旋转后共同度不变但载荷矩阵更新。计算因子得分通过回归方法建立公共因子与原始变量的线性关系(如F=A'R⁻¹X),得到因子得分矩阵,用于样品评分及后续分析。因子得分的进一步分析利用因子得分进行样本比较、聚类分析或绘制因子得分散点图,直观展示样品分布特征,辅助决策。2026/5/16因子分析的逻辑框图数据输入与预处理阶段

输入原始变量数据,完成标准化转换,计算相关矩阵并进行KMO和Bartlett检验,确保数据适合因子分析。因子提取与载荷矩阵构建阶段

基于相关阵或调整相关阵,通过主成分法等提取公共因子,求解初始因子载荷矩阵,确定因子数量(如特征值>1准则)。因子旋转与解释优化阶段

对初始因子载荷矩阵进行旋转(正交/斜交),得到结构更清晰的旋转后载荷矩阵,明确各公共因子的实际意义。因子得分计算与应用阶段

通过回归模型计算因子得分,将得分用于样本排序、分类或可视化(如散点图),实现对原始数据的降维分析与解释。步骤间逻辑关系

各阶段依次衔接:预处理为因子提取提供数据基础,旋转优化因子解释性,得分计算将抽象因子转化为可应用的量化指标,共同构成完整分析流程。2026/5/16因子分析的上机实现07SPSS操作步骤

01模块选择与变量导入依次点选Analyze→DimensionReduction→Factor,进入FactorAnalysis对话框,将待分析的指标变量选入Variables框中。

02提取方法与参数设置点击Extraction按钮,在Method选项框选择提取方法(默认主成分法),Analyze选项框默认从相关阵出发,Extract选项框可通过特征值大于1或固定因子数目(如输入2)确定因子个数,完成后点击Continue。

03因子得分设置点击Scores按钮,选中Displayfactorscorecoefficientmatrix选项以输出因子得分系数矩阵,点击Continue后返回主对话框,点击OK运行分析。2026/5/16输出结果解读(一)01共同度表(Communalities)展示各变量的初始共同度(均为1.000)和提取共同度,提取共同度反映变量被公共因子解释的程度,如X2提取共同度为0.993,表明其方差的99.3%可由公共因子解释。02总方差解释表(TotalVarianceExplained)包含初始特征值、提取平方和载荷,显示各因子的方差贡献及累计解释率,如前2个因子累计解释96.809%的方差,说明其能较好概括原始变量信息。03因子载荷阵(ComponentMatrix)呈现各变量在公共因子上的载荷系数,如X1在因子1上载荷0.913、因子2上0.320,表明X1与因子1相关性较强,载荷绝对值越大,变量与因子关系越密切。2026/5/16因子得分系数矩阵给出公共因子用标准化原始变量表示的线性系数,如F1=0.155X1+0.168X2+…-0.097X7,可直接代入变量值计算因子得分。因子载荷与得分系数的关系因子得分系数等于因子载荷除以对应因子的特征根,如X1在因子1的得分系数0.155=0.913/5.910(因子1特征根为5.910),因公共因子需标准化为方差1。主成分法下的因子模型保留前m个主成分作为公共因子,剩余部分为特殊因子,如X1=0.913F1+0.320F2+特殊因子,特殊因子方差为1-累计解释率(如3.191%)。输出结果解读(二)变量相关性检验KMO检验用于判断变量间相关性和偏相关性,KMO值越接近1效果越好,0.7以上适合因子分析,案例中KMO值为0.718,表明适合进行因子分析。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论