下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第13章主成分分析和因子分析,13.1主成分分析,13.1.1主成分分析的基本原理,13.1.2主成分分析的数学模型,13.1.3主成分分析的步骤,13.1.4主成分分析的步骤,13 . 1 . 4主成分分析的步骤,主成分的概念是由卡尔皮尔逊在1901年提出的,用来研究多个变量之间的相关性。多元统计方法研究如何传递几个主成分,也就是说,几个主成分是从原始变量中导出的,这样它们就可以尽可能多地保留原始变量的信息,并且它们之间不相关。主成分分析的目的:数据压缩;数据解释通常用于寻找综合指标来判断事物或现象,并恰当地解释综合指标中包含的信息。什么是主成分分析?(主成分分析)中,这两个相关变量所携带的
2、信息(统计上,信息通常指数据的变异)是集中的。假设只有两个变量x1和x2。从散点图可以看出,两个变量之间存在相关性,这意味着两个变量提供的信息重叠。主成分分析的基本思想(以两个变量为例),如果两个变量用一个变量表示,并且这个新变量尽可能地包含原来两个变量的信息,这就是降维的过程。数学上,原始的P变量被线性组合,并且作为新的变量,P原始变量被设置为,新的变量(即,主成分)被设置为,并且主成分和原始变量之间的关系被表示为:主成分分析数学模型,主成分分析数学模型,aij是例如,a11表示第一主成分和原始的第一变量之间的相关系数,a21表示第二主成分和原始的第一变量之间的相关系数。标准化原始P指数,消
3、除变量对水平和维度的影响。根据标准化数据矩阵求出相关系数矩阵,求出协方差矩阵的特征根和特征向量,确定主成分,并对每个主成分包含的信息给出适当的解释。根据2008年第一季度沪深两市农发行上市公司9项主要指标的数据,进行主成分分析,找出主成分并做出相应的解释。主成分分析(案例分析)、Stata输出结果、estat smc和变量之间有很强的相关性,适用于主成分分析。Stata输出结果(选择主成分),该表是选择主成分的主要依据。事实上,“初始特征值”在本例中是9个主轴的长度特征根,反映了主成分对原始变量的影响,表明引入该主成分后能够解释原始变量的信息特征根也称为方差,某个特征根占总特征根的比例称为主成
4、分的方差贡献率,所以第I个主成分的方差贡献率为,例如, 第一主成分的特征根为3.54354,占总特征根(方差贡献率)的39.37%,这意味着第一主成分解释了原九个变量的39.37%的信息,因此可以看出第一主成分没有完全解释原九个变量,那么应该用什么来选择主成分呢? 根据主成分的贡献率,一般来说,累积方差贡献率达到80%以上的前几个主成分可以作为最终的主成分。例如,表中前三个主成分的累积方差贡献率为78.13%。根据特征根的大小,当特征根小于1时,将不再选择它作为主成分,因为主成分的解释不如原始变量解的直接解释那样强。因此,只选择了三个主要成分。根据什么?Stata还提供了一个更直观的图形工具来
5、帮助选择主要成分,即砾石图。在实践中,我们可以从砾石图中看到九个纺锤长度的变化趋势。通常,根据具体情况,我们选择砾石图中前几个具有拐点的主成分作为原始变量的代表。在这种情况下,我们可以选择前三个主成分。根据什么,我们选择主成分?如何解释主成分?主成分的因子负荷矩阵。表1中的每一列都代表一个主成分,即原始变量线性组合的系数,即主成分分析模型中的系数aij。例如,第一主成分所在列中的系数-0.0364表示第一主成分和原始第一变量之间的线性相关系数。系数越大,主成分对变量的代表性越大。加载图直接显示了主成分对原始九个变量的解释。图中的横轴表示第一主成分和原始变量之间的相关系数。纵轴表示第二主成分和原
6、始变量之间的相关系数。对应于每个变量的主分量载荷对应于坐标系中的一个点。第一主成分充分解释了原始的最后四个变量(与每个原始变量都有很强的正相关),而第二主成分在VAR2、VAR3、VAR5和VAR6(与它们有较高的相关性)上较好,而与其他变量的关系较弱(相关系数)(加载图),13.2因子分析,13.2.1因子分析的基本原理,13.2.2因子分析的数学模型,13.2.3因子分析的步骤,13.2.4因子分析的Stata命令, 因子分析可以看作是主成分分析的延伸和延伸,但它对问题的研究更深入、更细致。 事实上,主成分分析可以看作是因子分析的一个特例。简而言之,因子分析就是通过研究变量之间的关系,找出能够综合原始变量的几个因子,使几个因子能够反映原始变量的大部分信息,然后根据相关性的大小对原始变量进行分组,使组内的变量具有较高的相关性,而不同组内的变量具有较低的相关性。因此,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年大学中药炮制(中药炮制实操)试题及答案
- 2025年高职生物技术(微生物培养)试题及答案
- 2025年大学母婴照护(母婴健康常识)试题及答案
- 2025年中职美发与形象设计(化妆技巧)试题及答案
- 2025年大学特种经济动物饲养(蚕桑养殖技术)试题及答案
- 2025年大学大一(物联网工程)物联网安全实务试题及答案
- 2025年大学车辆工程(汽车电子)期末试题
- 2025年中职珠宝玉石加工与营销(珠宝营销技巧)试题及答案
- 2025年高职物流审计(物流审计基础)试题及答案
- 2025年高职计算机网络技术(网络安全配置)试题及答案
- GB/T 17642-2025土工合成材料非织造布复合土工膜
- 清欠历史旧账协议书
- 临床创新驱动下高效型护理查房模式-Rounds护士查房模式及总结展望
- 乙肝疫苗接种培训
- 心衰患者的用药与护理
- 食品代加工业务合同样本(版)
- 车间管理人员绩效考核方案
- 安全生产应急平台体系及专业应急救援队伍建设项目可行性研究报告
- 浙江省杭州市北斗联盟2024-2025学年高二上学期期中联考地理试题 含解析
- 医用化学知到智慧树章节测试课后答案2024年秋山东第一医科大学
- 中国传统美食饺子历史起源民俗象征意义介绍课件
评论
0/150
提交评论