版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
脚本-数据建模中的统计模型——多元统计分析(PPT1)(PPT2)同学,你好,今天我们介绍多元统计分析中的因子分析,本节由模型背景、因子分析模型、模型建立步骤、案例分析和模型应用五个部分构成。(PPT3)(动画1)首先,我们简要介绍第一部分——因子分析背景(PPT4)(动画1)因子分析是一种降维、简化数据的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个抽象的变量来表示其基本的数据结构。(动画2)例如,在商场的形象评价中,消费者可以通过一系列指标构成的一个评价体系,评价商场的各个方面的优劣。(动画3)但消费者主要关心的是四个方面,即商店的环境、商店的服务、商品的质量和商品的价格。因子分析方法可以通过显在变量,找出反映商店环境、商店服务水平、商品质量和商品价格的四个潜在的公因子,对商场进行综合评价。(PPT5)(动画1)下面介绍第二部分——因子分析模型(PPT6)(动画1)对于一个样本,记p个观测指标变量为X1,X2,...Xp,n个样品的数据资料阵为:(动画2)X=(X_1,X_2,...,X_p)=[x_11,x_12,...x_1p;x_21,x_22,...x_2p;...,x_n1,x_n2,...x_np];矩阵中的每一列是相应指标变量的样本观测值,每一行对应样本的一次观测。(动画3)因子分析就是将观测指标X_i综合成为m(m<p)个新的综合指标(也称公共因子)的线性组合,即X_i=a_i1*F_1+a_i2*F_2+...+a_im*F_m+epsilon_i,i=1,2,...,p其中:F_j称为X_i的公共因子,a_ij称为第j个公因子在第i个指标上的载荷,epsilon_i称为X_i的特殊因子。(PPT7)模型需要满足以下三个条件(动画1)1)公因子两两不相关且公因子方差为1;2)公因子与特殊因子不相关;3)特殊因子两两不相关且特殊因子epsion_i的方差为sigma_i的平方。(ppt8)为进一步理解因子分析,下面给出因子载荷矩阵中有关因子载荷、变量共同度、公共因子方差贡献的统计意义。(动画1)先看因子载荷的统计意义(动画2)计算第i个指标变量与第j个公因子的相关系数r,根据标准化条件可知相关系数与协方差相等,将X_i的表达式代入,利用前述条件可知其等于因子载荷a_ij。(动画3)即a_ij反映了第i个变量Xi与第j个公共因子Fj的密切程度。(ppt9)(动画1)接着再看变量共同度的统计意义(动画2)所谓变量共同度是指因子载荷矩阵中第i行元素的平方和。即(动画3)h_i的平方=a_ij的平方关于j从1到m求和,i=1,2,...,p(动画4)为了说明变量共同度的统计意义,对变量X_i求方差,有(动画5)X_i的方差=h_i的平方+sigma_i的平方。从上式可知:原始变量的方差由两部分组成:第一部分为共同度,它刻划了全部公共因子对原变量的总方差所做的贡献,共同度越接近总方差,说明该变量的几乎全部原始信息都被所选取的公共因子说明了。第二部分为特殊因子的方差,它仅与原变量本身的变化有关,它是原变量的方差的补充值。(PPT10)(动画1)最后来看公因子方差贡献的统计意义(动画2)所谓公共因子方差贡献是指因子载荷矩阵中第j列元素的平方和。即(动画3)S_j=a_ij的平方关于i从1到p求和,j=1,2,...,m。(动画4)Sj表示同一公共因子Fj对各个变量Xi所提供的方差贡献的总和。它是衡量公共因子相对重要性的指标。(动画5)显然,Sj越大,表明Fj对X的贡献越大。(PPT11)(动画1)下面,我们介绍第三部分——模型建立步骤(PPT12)因子分析主要由五个步骤构成:(动画1)原始数据标准化处理、(动画2,动画3)计算样本相关系数矩阵、(动画4,动画5)计算初等载荷矩阵并提取公因子、(动画6,动画7)进行因子旋转、(动画8,动画9)计算因子得分并进行综合评价。(PPT13)(动画1,动画2)这里第1步原始数据标准化处理和第2步计算样本相关系数矩阵与主成分分析中的第1步和第2步完全一致,我们不作重复介绍。下面我们从第3步开始。(动画3)第3步,计算初等载荷矩阵(动画4)从样本相关系数矩阵R,计算出其由大到小的特征值lambda_1,...lambda_p及对应的标准正交化特征向量u_1,...u_p。(动画5)确定公因子个数m后,则主成分因子分析的载荷矩阵A等于[根号lambda_1*u_1,根号lambda_2*u_2,根号lambda_m*u_m].(动画6)在实际应用中,有两种常用的确定公因子提取个数m的方法:一是仅提取特征值大于1的因子;二是利用因子的累积方差贡献率来确定公因子提取的个数,一般认为达到60%才符合要求。(PPT14)第4步,对初等载荷矩阵进行因子旋转(动画1)因子分析的目标之一就是要对所提取的抽象因子的实际含义进行合理解释,即对因子进行命名。有时直接根据特征根、特征向量求得的因子载荷矩阵难以看出公共因子的含义。通过因子旋转的方法,可以使每个变量仅在一个公共因子上有较大的载荷,而在其余的公共因子上的载荷比较小。这时对于每个公共因子而言(即载荷矩阵的每一列),它的载荷会尽可能地向1和0进行两极分离,这时,该公共因子的含义就能通过这些载荷较大的变量做出合理的说明。(动画2)因子旋转主要有以下三种方法:(动画3)①方差最大旋转法(动画4)②四次最大正交旋转法和(动画5)③平均正交旋转法。(PPT15)第5步,计算因子得分。(动画1)设因子得分函数为(动画2)F_j=beta_j1*X_1+beta_j2*X_2+...+beta_jp*X_p,j=1,2,...,m(动画3)利用因子分析模型X_i=a_i1*F_1+a_i2*F_2+...a_im*F_m+epsilon_i和回归分析的思想,可得F_j_hat=beta_j1_hat*X_1+beta_j2_hat*X_2+...+beta_jp_hat*X_p,(动画4)其中,公因子F_j_hat的得分函数中的系数行向量等于样本相关系数矩阵的逆矩阵*因子载荷矩阵A的第j列转置而成的行向量。这样,根据系数估计值与原指标变量的线性组合即可计算每个公共因子的得分,再根据公共因子的贡献率和得分值可计算每个样本的综合得分,对样本进行综合评价。(ppt16)同作为降维的一种技术,因子分析与主成分分析有何不同之处呢?下面从四个方面来做说明。(动画1)1.目的不同:主成分分析只是从空间生成的角度寻找能解释诸多变量的绝大部分的几组彼此不相关的新变量(主成分);而因子分析要从数据中查出对变量起解释作用的公共因子和特殊因子以及其组合系数。(动画2)2.假设条件不同:主成分分析中不需要有假设;因子分析的假设包括:各个公共因子之间不相关,特殊因子之间不相关,公共因子和特殊因子之间不相关。(动画3)3.提取主因子的方法不同:主成分分析只能用主成分法抽取;因子分析抽取主因子不仅有主成分法,还有极大似然法,主轴因子法,基于这些方法得到的结果也不同。(动画4)4.主成分与因子的变化:当给定的协方差矩阵或者相关系数矩阵的特征值唯一时,主成分是固定的;而因子分析中因子不是固定的,可以旋转得到不同的因子。(PPT17)接下来,我们通过一个案例来熟悉因子分析建模步骤。(ppt18)我国上市公司赢利能力的数据见表1。试用因子分析法对该企业进行综合评价。(ppt19)(动画1)首先要对原始数据标准化处理。(略)(动画2)2.计算相关系数矩阵,(动画3)见表2。(ppt20)(动画1)3.计算初等载荷矩阵(动画2,3)先由相关系数矩阵求得特征值及单位正交化特征向量,见表3。(ppt21)(动画1)选取特征值大于1的2个主因子,计算初等载荷矩阵A1.(动画2)A_1=[根号lambda_1*u_1,根号lambda_2*u_2],将标准正交特征向量u_1和u_2的值代入即可得到如下数值。从A1可以看出每行或每列的因子载荷的平方差别不明显,需进行因子旋转。(ppt22)(动画1)接下来进行因子旋转(动画2)用最大方差旋转法旋转A1,旋转后的载荷矩阵记为A2(动画3,动画4)从A2可以看出,第一公共因子F1与变量x1(销售净利率),x4(销售毛利率)高度正相关,说明F1对这2个指标的解释力非常高,而对其他2个指标就没那么重要了,根据x1和x4的特征,可取名为“销售能力因子”;而第二公因子F2与变量x2(资产净利率),x3(净资产收益率)高度正相关,根据其特征,可取名为“资产价值因子”。(动画5)旋转后的因子贡献和贡献率见表4。相差不大。(ppt23)(动画1)5.计算因子得分(动画2)根据前面计算的因子载荷矩阵A2,即可计算得分函数中的系数估计值(动画3)beta=(相关系数矩阵R的逆*A2)的转置(动画4)根据计算所得的数值,可得因子得分函数为:(动画5)公因子F1=0.506x1+0.1615x2-0.1831x3+0.5015x4;公因子F2=-0.045x1+0.5151x2+0.581x3-0.0199x4(PPT24)(动画1)利用综合因子得分公式(动画2)F=(44.49F1+41.68F2)/86.17计算综合排名(见表6):(动画3)表6从结果可以看出烟台万华盈利能力最强,湖北宜化盈利能力最弱。(PPT25)(动画1)最后我们简单看下模型应用(PPT26)(动画1)在我们的日常生活中,因子分析也经常用于研究消费者的习惯和态度,比如网上购物还是实体店购物,不同的年龄、收入对消费习惯的影响等。(动画2)也可以用于对服务行业服务质量的研究,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 品牌策划及执行策略手册
- 2026年电网数字孪生模型自动校核与更新机制研究
- 2026年食品安全管理体系审核员职业规划
- 2026年海关管理专业学生业务能力与职业发展报告
- 2026年员工晋升通道与职业发展规划
- 2026二建《机电工程管理与实务》简答200问(填空版)
- 吊顶安全施工方案(3篇)
- 流沙洗脸活动方案策划(3篇)
- 耕岩施工方案(3篇)
- 印象食堂活动方案策划(3篇)
- 无废工厂建设实施方案
- 美修斯增肌仪器培训课件
- 长度和时间的测量课件2025-2026学年人教版物理八年级上册
- 2026年保安员资格证理论知识考试题库
- 雨课堂学堂在线学堂云医学英语EMP( 安徽医科大)单元测试考核答案
- 2025年安徽林业职业技术学院单招职业适应性测试题库带答案解析
- 麻醉药健康宣教
- Jetpack Compose入门到精通完整版
- DB31∕T 1597-2025 老年人屈光不正社区筛查规范
- 蜱虫防治教学课件
- 药品供应链管理与安全
评论
0/150
提交评论