【《因子分析的模型和数学模型概述》3700字】_第1页
【《因子分析的模型和数学模型概述》3700字】_第2页
【《因子分析的模型和数学模型概述》3700字】_第3页
【《因子分析的模型和数学模型概述》3700字】_第4页
【《因子分析的模型和数学模型概述》3700字】_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

因子分析的模型和数学模型概述目录TOC\o"1-3"\h\u6816因子分析的模型和数学模型概述 1141251.1因子分析的基本原理 1245481.2因子分析的数学模型 298771.3因子分析的相关概念 472181.4因子分析的基本步骤 5311631.5因子分析在地理样本的应用 7因子分析从形成到今天已经经历了相当长的时间,CharlesSpearman于1904年发表了一篇名为《对智力测验得分进行统计分析》的文章,通常被认为是因子分析的开端,学者们首先用它来研究心理学和教育学问题。计算量大和缺少高速计算设备很大程度上限制了因子分析的发展和应用,甚至使其停滞了一段时间。后来,随着电子计算机的出现,因子分析的理论研究和计算才得以快速发展。目前,该方法已广泛应用于社会学、经济学、生物学、地质学、考古学、体育科学、医学等领域。1.1因子分析的基本原理因子分析是主成分分析(PrincipalComponentAnalysis,PCA)的扩展,都是降维处理的多元统计方法,它们都将多个具有复杂关系的变量(或者样本)综合成数量少于原始变量的几个公共因子ADDINEN.CITE<EndNote><Cite><Author>Zhang</Author><Year>2017</Year><RecNum>21</RecNum><DisplayText><styleface="superscript">[23]</style></DisplayText><record><rec-number>21</rec-number><foreign-keys><keyapp="EN"db-id="v2599xfaox2527etxp6xz5z59v92vdvewppa"timestamp="1620558693">21</key></foreign-keys><ref-typename="ConferenceProceedings">10</ref-type><contributors><authors><author>QiZhang</author><author>ShengyueHao</author><author>XuRen</author></authors><secondary-authors><author>Wang,Y</author><author>Pang,Y</author><author>Shen,GQP</author><author>Zhu,Y</author></secondary-authors></contributors><titles><title>TheInfluencingFactorsofCarbonEmissionsinChineseConstructionIndustryBasedonFactorAnalysisandImprovedSTIRPATModel</title><secondary-title>InternationalConferenceonConstructionandRealEstateManagement(ICCREM)</secondary-title></titles><pages>148-155</pages><dates><year>2017</year></dates><pub-location>Guangzhou,PEOPLESRCHINA</pub-location><urls></urls><language>english</language></record></Cite></EndNote>[23],并且显示出这些结果因子和原始变量之间的转换关系,同时,还可以根据降维结果将原始变量分类。因子分析有两种常见类型:R型因子分析(变量的因子分析)和Q型因子分析(样本的因子分析)。因子分析方法是研究原始变量(或样本)的相关系数矩阵(或相似系数矩阵)的内部结构,并将所有变量(或样本)中存在的相关(相似)关系用抽取出的一些随机变量来描述ADDINEN.CITE<EndNote><Cite><Author>王芳</Author><Year>2003</Year><RecNum>22</RecNum><DisplayText><styleface="superscript">[24]</style></DisplayText><record><rec-number>22</rec-number><foreign-keys><keyapp="EN"db-id="v2599xfaox2527etxp6xz5z59v92vdvewppa"timestamp="1620560056">22</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author><styleface="normal"font="default"charset="134"size="100%">王芳</style></author></authors></contributors><titles><title><styleface="normal"font="default"charset="134"size="100%">主成分分析与因子分析的异同比较及应用</style></title><secondary-title><styleface="normal"font="default"charset="134"size="100%">统计教育</style></secondary-title></titles><periodical><full-title>统计教育</full-title></periodical><pages>14-17</pages><number>5</number><dates><year>2003</year></dates><urls></urls><language>Chinese</language></record></Cite></EndNote>[24],所获得的这些随机变量是不可以实际观测的,通常称为因子。然后,根据变量的相关性(或样本的相似性)将变量(或样本)分组,以使同一组内的变量(或样本)之间的相关性(或者相似性)更高,不同分组内的变量(或样本)的相关性(或者相似性)较低。R型因子分析和Q型因子分析的全部计算过程是一样的,计算的数据也是同一批观测数据,只是出发点不同,R型因子分析从相关系数矩阵开始计算,Q型因子分析从相似系数矩阵开始计算,可以根据降维目的决定选择哪一类型的因子分析。1.2因子分析的数学模型本节详细介绍因子分析的模型ADDINEN.CITE<EndNote><Cite><Author>Johnson</Author><Year>2007</Year><RecNum>58</RecNum><DisplayText><styleface="superscript">[25]</style></DisplayText><record><rec-number>58</rec-number><foreign-keys><keyapp="EN"db-id="v2599xfaox2527etxp6xz5z59v92vdvewppa"timestamp="1620573115">58</key></foreign-keys><ref-typename="Generic">13</ref-type><contributors><authors><author>R.A.Johnson</author><author>D.W.Wichern</author></authors></contributors><titles><title><styleface="normal"font="default"size="100%">AppliedMultivariateStatisticalAnalysis</style><styleface="normal"font="default"charset="134"size="100%">(</style><styleface="normal"font="default"size="100%">6thEdition</style><styleface="normal"font="default"charset="134"size="100%">)</style></title></titles><dates><year>2007</year></dates><pub-location>NewYork</pub-location><publisher>PearsonEducation</publisher><urls></urls><language>english</language></record></Cite></EndNote>[25],以便于后续地理因子分析方法的描述。设原始数据如下表2-1:表2SEQ表2-\*ARABIC\s11原始数据资料表变量X1X2…Xp样本1xx…x2xx…x⋮⋮⋮⋮nxx…x以R型因子分析为例,设有p个变量X1,X2,…,Xp,根据因子分析的要求,假设这些变量已经标准化。假设p个变量可以用m个(m≤p)因子F1,F2,…,Fm的线性组合表示,即R型因子分析的数学模型为:X1用矩阵表示为:X1简记为:X(p×1)且满足:=1\*GB3①m≤p;=2\*GB3②F和ε不相关。其中,X=(X1,X2,⋯,XP)'为可以实际观测的p维向量,它的每一个分量表示一个变量。F=(F类似的,Q型因子分析的数学模型为:X1其中,X=(因子分析是通过X=AF+ε用F代替X,因为m≤p,n≤p,从而达到降低变量维数的目的。在因子分析中,当m=p时,因子分析是一种变量转换的方法。然而,在实际应用中,m小于p,并且出于经济原因,m越小越好。在因子分析中,各因子F对应的系数aij是不唯一的,即因子分析的因子载荷矩阵是不唯一的。因此,通过A的变换,即改变因子对解释变量Xi1.3因子分析的相关概念1.3.1因子载荷因子载荷aij的统计意义是第i个原始变量在第j个公共因子上的载荷,即表示Xi依赖于Fj的分量(比重),反映了第i个原始变量在第j个公共因子上的相对重要性。如果将原始变量Xi视为m维因子空间中一个向量,则aij表示向量Xi在坐标轴Fj上的投影。因子载荷aij的绝对值越接近于1,原始变量Xi与公共因子Fj的相关性越强。反之,情况恰恰相反。因子载荷矩阵A=(A=(a其中,p为原始变量的个数,m为公共因子的个数。1.3.2公共因子的方差贡献方差贡献是一个衡量公共因子F相对重要性的指标,本文将在地理因子分析的实例结果的分析中使用,因此需要在这一节进行特别说明。将因子载荷矩阵A=(aij)Sj其中,称Sj为公共因子Fj对所有原始变量X的贡献,即Sj表示同一公共因子F1.3.3变量的共同度原始变量Xi的共同度定义为因子载荷矩阵A=(aij)hi共同度hi2表示全部公共因子对原始变量Xi的总方差的贡献。原始变量除用公共因子描述外,其余信息被特殊因子ε描述。1.4因子分析的基本步骤通过上述因子分析基本原理和数学模型的介绍,本文在此节中将归纳因子分析的计算步骤。本文中利用Python语言在PyCharm中实现因子分析的全部计算过程。R型因子分析和Q型因子分析针对的数据和全部计算过程是一样的,只是出发点不同:R型因子分析从相关系数矩阵出发,Q型因子分析从相似系数矩阵出发,流程图如下:图2-1因子分析流程图(1)原始数据标准化处理。定义原始数据矩阵为X=(xij为了量化分析,强化变量间的可比性,在因子分析以及本文构建的两种方法中,变量均需要标准化后再进行运算,以降低量纲不同对于研究结果的影响。本文对各个变量进行Min-Max的标准化,即把最大值归一化为1,最小值归一化为0,目的是不改变数据的分布规律。而且,由于因子分析不能判断各个变量对碳排放量的影响方向,本文对各个变量都进行正向的标准化,不改变他们原有的数据分布方向。bnp其中,xj表示第j个变量,x(2)得出相关系数矩阵或者相似系数矩阵。若作R型因子分析,则建立变量的相关系数矩阵R=(r其中rij若作Q型因子分析,则建立样本的相似系数矩阵Q=(q其中qij以下步骤类似,只是将相关系数矩阵R=(rij)p×p改成相似系数矩阵(3)求特征值和特征向量。求出相关系数矩阵R=(rij)p×p的特征值(4)计算累计方差贡献率,确定因子载荷矩阵。根据累计方差贡献率i=1mi(5)对A=(a一般而言,提取因子后,因子载荷矩阵A=(aij

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论