版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第13章因子分析本章目录01因子分析的基本理论介绍因子分析的基本概念、因子模型、因子个数确定方法、模型估计方法、模型评估指标以及因子旋转的理论基础。02因子分析示例通过计算机行业上市企业创新能力评估的案例,详细演示在EViews中进行因子分析的完整操作流程,包括模型设置、估计、诊断、旋转和得分计算。01因子分析的基本理论因子分析概述定义因子分析是一种探索性的多元统计方法,它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个抽象的“公共因子”来表示其基本的数据结构。目的1.数据简化:综合变量减少个数;2.结构探索:揭示变量内在联系;3.变量分类:根据载荷对变量分类。特点因子分析是一种“降维”技术,它将原始的p个变量转换为m个(m<p)公共因子,这些因子是不可直接观测的,但能够反映原始变量的大部分信息。因子模型(基本形式)基本模型公式Xᵢ:p维观测变量向量,即我们实际测量的数据。μ:p维均值向量,代表观测变量的平均水平。L:p×m因子载荷矩阵,衡量变量与因子的相关程度。Fᵢ:m维公共因子向量,不可观测的潜在核心变量。εᵢ:p维独特因子向量,变量中不能被公共因子解释的部分。模型核心解读线性组合分解每个观测变量都可以拆解为两部分:公共因子的线性组合+独特因子。这体现了因子分析的降维思想。载荷矩阵的桥梁作用因子载荷矩阵L是连接“可观测变量”与“不可观测公共因子”的关键桥梁,其元素值大小反映了变量与因子的关联强度。因子模型(基本假设与方差分解)基本假设1.公共因子约束公共因子的均值为0,方差标准化为1。2.独立不相关独特因子均值为0,且与公共因子线性不相关。3.独特因子互斥不同变量的独特因子之间互不相关。方差分解共同度(h²ⱼ)变量方差中能被所有公共因子解释的比例,反映因子对变量的解释力。独特度(ψⱼ)变量方差中不能被公共因子解释的部分,由独特因子贡献。核心意义评估分析效果的关键共同度是衡量因子分析质量的重要指标。当共同度越高时,说明该变量的大部分信息都被所选的公共因子所捕获,因子分析的降维效果越好。确定因子个数的方法(一)Kaiser-Guttman准则(特征根大于1)最常用的方法。计算相关系数矩阵的特征根,保留特征根大于1的因子。因为对于相关系数矩阵,特征根的平均值为1,特征根大于1意味着该因子解释的方差大于平均水平。累计方差贡献率法计算每个因子的方差贡献率和累计方差贡献率,选择累计方差贡献率达到某个阈值(通常为80%或90%)的因子个数。该方法确保提取的因子能够解释大部分数据信息。方法特点这两种方法简单直观,但有时可能会提取过多或过少的因子。确定因子个数的方法(二)最小平均偏相关法(MAP)核心逻辑:计算去除m个因子后偏相关平方的平均值。决策标准:选择使该平均值最小的因子个数m。断棒法(BrokenStick)核心逻辑:将特征根的分布与随机分布(断棒分布)进行比较。决策标准:保留那些解释方差比例超过随机预期的因子。平行分析法(Parallel)核心逻辑:对比真实数据特征根与模拟随机数据的平均特征根。决策标准:保留真实特征根大于随机特征根的因子。★目前最准确的方法之一学术应用建议:平行分析法(ParallelAnalysis)因其客观性和准确性,在现代学术研究中被强烈推荐。它通过与随机数据对比,能有效排除数据中的“噪音”干扰,帮助研究者识别出真正具有结构意义的潜在因子。因子模型的估计方法(一)最小差异法(MinimumDiscrepancy)核心思想:通过最小化观测协方差矩阵与模型拟合协方差矩阵之间的差异来估计因子载荷和独特因子方差。最大似然法(ML)基于正态分布假设,统计性质良好,应用最为广泛。广义最小二乘法(GLS)对数据进行加权处理,适用于存在异方差的情况。非加权最小二乘法(ULS)计算过程简单,不要求严格的分布假设,稳健性较强。方法特点与评价理论优势理论基础扎实,估计结果较为可靠,能够有效反映变量间的潜在结构。计算挑战计算相对复杂,尤其是在因子个数较多或样本量较大时,对计算资源有一定要求。在实际应用中,若数据符合正态分布,最大似然法(ML)通常是首选,因其能提供标准误和拟合优度检验统计量,便于模型评估。因子模型的估计方法(二)主成分因子法源于主成分分析,通过对协方差矩阵进行特征分解,提取主成分作为初始因子,然后通过迭代调整共性方差来得到最终的因子解。共性估计方法在主成分因子法中,需要对变量的共性方差进行估计,常用方法包括:对角线分数法、最大相关系数法和平方多重相关法(SMC)。迭代法通过反复更新共性方差估计并重新提取因子,直到结果收敛。但过度迭代可能导致结果偏差。核心逻辑:主成分因子法通过特征分解初始化,结合迭代法不断优化共性方差估计,直至收敛。因子模型的估计方法(三):分区协方差法(PACE)方法定义PACE是一种非迭代的估计方法。它通过将协方差矩阵分割成不同的区域进行独立估计,具有一致性、渐近正态性和尺度不变性等优良统计性质。核心优势计算效率极高,特别适用于变量个数很多的大型因子模型。因其快速收敛特性,也常被用作其他复杂迭代方法的初始值,加速整体求解过程。工具支持主流统计分析软件如EViews已内置支持PACE方法,无需手动编程实现,为处理大规模金融或经济数据提供了便捷的工具支持。应用场景小结:当面对变量维度极高(例如超过100个变量)的大型数据集时,传统的极大似然估计等迭代方法可能面临计算瓶颈或收敛困难。此时,分区协方差法(PACE)凭借其非迭代、高效率的特性,成为了因子模型估计的首选方案。模型评估指标从不同维度衡量因子模型对数据的解释能力与拟合优度绝对拟合指标●卡方检验
检验模型拟合协方差矩阵与观测矩阵的差异,p>0.05表示拟合良好。●信息准则(AIC,SC)
综合考虑拟合度和复杂度,数值越小代表模型越优。相对拟合指标●核心逻辑
将当前估计模型与“独立模型”(零因子模型)进行对比。●评估目的
量化模型相对于基准模型的改进程度,反映因子结构的有效性。残差指标●均方根残差(RMSR)
直接衡量拟合残差的大小,数值越小说明拟合精度越高。●标准化均方根残差(SRMSR)
消除了变量量纲的影响,更便于在不同研究间进行比较。评估建议:单一指标不足以全面评价模型,建议结合绝对拟合、相对拟合及残差指标进行综合判断,以确定最佳的因子个数和模型形式。因子旋转旋转目的因子载荷矩阵并非唯一解。旋转的核心目的是:简化载荷矩阵结构,使变量载荷两极分化。让每个变量尽可能只在一个因子上有较高载荷。最终实现因子实际含义的清晰解释。旋转原理通过对载荷矩阵L和公共因子F进行正交或斜交变换,得到新模型。新旧模型在观测数据上是等价的。旋转类型正交旋转(Orthogonal)保持因子之间相互独立(不相关)。最常用的是方差最大法(Varimax)。斜交旋转(Oblique)允许因子之间存在相关性。通常能得到更符合实际、易于解释的结果。因子旋转是因子分析中提升结果可解释性的关键步骤02因子分析实例案例背景介绍研究目的通过11个指标来衡量计算机行业355个上市企业的创新能力,以评估企业的综合创新水平。变量定义列出11个指标的名称及代码,涵盖研发投入(如研发人员占比、研发费用)、研发产出(如专利账面价值)和研发可持续性(如营收增长率)等方面。数据说明样本数量为355个,为截面数据。模型设置与估计(Data页)操作路径在EViews中,选择多个序列,右键点击选择Open/asFactor,打开因子分析对话框。Data页设置•Type:选择Correlation(相关系数矩阵)•Method:选择Ordinary(皮尔逊相关系数)•Variables:输入11个变量;Sample:设置样本范围操作界面说明右侧展示了因子分析Data页的设置界面,需重点确认变量列表与样本范围是否正确,这是后续分析的基础。因子分析Data页设置界面💡操作提示•若数据量纲不同,务必选择基于相关系数矩阵分析。•建议勾选“Balancedsample”以保证数据质量。•变量需为数值型序列,否则无法计算相关系数。模型设置与估计(Estimation页)Estimation页核心设置•Method:选择PACE估计方法。•Numberoffactors:选择基于方差解释比例确定因子个数。操作界面概览界面包含Method(估计方法)、Numberoffactors(因子数量)及Options(选项)等核心设置区域,右侧图示为具体设置界面。执行模型估计确认所有参数设置无误后,点击界面右下角的“确定”按钮,EViews将开始运行算法并估计因子模型参数。Estimation页设置界面示例💡操作提示•PACE方法适用于处理高维数据,估计效率较高。•若未特殊指定,建议保留默认选项以确保结果稳健。模型估计结果解读因子载荷矩阵关键发现:展示未旋转的正交因子载荷矩阵,分析各变量在不同因子上的载荷分布。例如:研发投入相关变量(X1,X7,X8,X9)在第一因子上表现出显著的高载荷。方差解释比例统计指标:基于提取的3个公共因子,分析其对总体方差的解释能力。数据表明:第一因子单独解释了超过60%的方差,累积方差贡献值达到4.27,说明因子提取效果良好。因子命名命名逻辑:根据载荷分布和变量含义,对三个公共因子进行专业命名:因子1:研发投入因子因子2:研发可持续性因子因子3:研发产出因子综合结论通过因子分析,我们成功将多个研发指标降维为三个核心维度:投入、可持续性和产出。这三个因子不仅涵盖了研发活动的主要方面,而且具有较高的方差解释率,为后续的综合评价提供了坚实的数据基础。模型诊断(拟合优度与残差)拟合优度指标评估查看模型的拟合优度总结(表13-3),通过R²、调整R²等关键指标,量化评估模型对原始数据的解释能力,判断自变量对因变量的解释程度是否显著。残差协方差矩阵检验查看残差的协方差矩阵(图13-3),检验模型的拟合效果。理想情况下,残差应数值较小且无明显规律(随机分布),若存在明显模式则提示模型可能遗漏关键变量。残差协方差矩阵示例综合诊断结论判定综合拟合优度指标的解释力与残差分析的随机性,最终判断模型的整体拟合效果是否良好。若指标达标且残差随机,则模型有效,可用于后续推断;反之则需优化。模型诊断(特征根与MSA值)特征根碎石图通过观察曲线拐点确定因子个数。本例中曲线在第3个因子处出现明显拐点,之后趋于平缓,提示提取3个因子较为合适。KMO检验(MSA值)本例中Kaiser-Meyer-Olkin检验的MSA值为0.64。虽然略低于0.7的标准,但仍接近临界值,表明数据结构尚可,适合进行因子分析。诊断结论综合特征根碎石图的拐点信息与KMO检验的MSA值结果,统计指标支持我们从数据中提取3个公共因子的决策。总结:因子分析的前提假设检验通过了关键指标的验证。特征根碎石图直观展示了因子贡献度的变化趋势,而KMO值则量化了变量间的偏相关性,两者共同为后续提取3个公共因子提供了坚实的统计依据。因子旋转(正交旋转)旋转目的通过因子旋转简化因子结构,使每个变量在尽可能少的因子上有较高的载荷,从而更容易解释因子的实际含义。正交旋转设置选择最常用的方差最大法(Varimax)进行正交旋转,确保因子之间相互独立,便于后续分析。旋转结果解读旋转后因子载荷矩阵显示,变量在因子上的载荷分布更集中,分组更加明确,因子的经济含义或实际意义显著增强。图13-5:因子旋转设置界面(Varimax正交旋转)操作提示:在因子分析对话框中,进入“Rotation”选项卡,选择“Varimax”方法,即可执行正交旋转。因子旋转(斜交旋转)斜交旋转特点斜交旋转(ObliqueRotation)打破了因子必须独立的假设,允许因子之间存在相关性。这种方法通常能更贴合现实数据结构,得到更易于解释的因子含义。斜交旋转结果通过观察因子载荷矩阵(如表格13-8),并与正交旋转结果对比,可以发现斜交旋转在保持变量解释率的同时,能更清晰地界定因子归属,具有更强的实际解释优势。因子相关矩阵斜交旋转会生成因子相关矩阵。该矩阵展示了提取出的因子之间存在显著的相关性,这更符合现实世界中不同能力维度或特征往往相互关联而非完全独立的情况。核心洞察:在探索性因子分析中,如果理论假设变量间存在潜在关联,或正交旋转结果解释性不佳时,斜交旋转是更优的选择。它通过牺牲因子独立性假设,换取了对现实结
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年汽车售后公司合同(1篇)
- 川教版(2019)三年级下册第2节 小小设计师教案设计
- 第11课 制作校园小报(下)教学设计-2025-2026学年小学信息技术(信息科技)第二册上粤教版
- 高中生物 专题2 微生物的培养与应用 课题1 微生物的实验室培养教学设计 新人教版选修1
- 第11课 近代以来的城市化进程教学设计高中历史统编版2019经济与社会生活-统编版2019
- 上海市曹杨第二中学2025-2026学年高一下学期3月月考化学试卷(含解析)
- 变压力为动力教学设计高中心理健康北师大版浙江专版高中二年级全一册-北师大版浙江专版
- 高中语文 第六单元 三 尚贤教学设计 新人教版选修《先秦诸子选读》
- 财务审核合同要点
- 科学三年级下册2.认识其他动物的卵教案
- (高清版)DZT 0214-2020 矿产地质勘查规范 铜、铅、锌、银、镍、钼
- 有关锂离子电池安全的基础研究课件
- 人工智能与计算机视觉
- 口腔材料学课件
- 盐酸凯普拉生片-临床用药解读
- 中建综合支架专项施工方案
- 医院财务制度专家讲座
- 2023年北京市中国互联网投资基金管理有限公司招聘笔试题库含答案解析
- 中控ECS-700学习课件
- 2023年上海市杨浦区中考一模(暨上学期期末)语文试题(含答案解析)
- 甲状腺病变的CT诊断
评论
0/150
提交评论