




已阅读5页,还剩51页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2019年5月18日2时23分,厚德载物 自强不息,1,生物医学研究的统计方法之十九 因子分析,2019年5月18日2时23分,2,因子分析,Factor Analysis,Factor Analysis,2019年5月18日2时23分,厚德载物 自强不息,3,主成分分析: 以原变量的线性组合将原变量组合成少数几个主成分。 因子分析: 将原变量分解成几个公因子的线性组合,从而更好地理解原变量的内在关系。,2019年5月18日2时23分,厚德载物 自强不息,4,回顾:主成分分析的任务,将彼此相关的指标变量转化为彼此不相关的指标变量; 将个数较多的指标变量转化为个数较少的指标变量。 将意义单一的指标变量转化为意义综合的指标变量。,2019年5月18日2时23分,厚德载物 自强不息,5,主成分分析的基本原理,寻找一个适当的线性变换: 将彼此相关的变量转变为彼此不相关的新变量; 方差较大的几个新变量就能综合反应原多个变量所包含的主要信息; 新变量各自带有独特的专业含义。,2019年5月18日2时23分,厚德载物 自强不息,6,相关性的另一个角度分析:,观测指标间存在相关性,是受某些不可观测的潜在因素的影响造成的. 如: 学生的语文,英语成绩相关,是受其语言能力的影响,学生的数学,物理化学成绩相关,是受其逻辑推理能力的影响。,2019年5月18日2时23分,厚德载物 自强不息,7,变量的可测性,可测变量(measured variable):可以直接观察或测量而得到的变量。 潜在变量(latent variable):不能或不易直接观测得到的变量。这种变量往往是根据某种理论假设的,所以也称为理论变量(theoretical variable)。,2019年5月18日2时23分,厚德载物 自强不息,8,仅包含一个潜在因子的探索性因子分析路径图,潜在因子,其他 影响 因子,2019年5月18日2时23分,厚德载物 自强不息,9,可测变量,潜在变量,2019年5月18日2时23分,厚德载物 自强不息,10,数学模型 假设原有变量有p个,标准化后分别用 表示,且每个变量的均值是0,标准差是1,现将每个原有变量用m(mp)个因子 的线性组合来表示,即:,因子模型,F称为公共因子,简称因子,其均值为0,标准差为1。因子可理解为高维空间中互相垂直的k个坐标轴;A称为因子载荷矩阵, 称为因子载荷, 是第i个原始变量在第j个因子上的负荷; 称为特殊因子,表示原始变量不能被因子解释的部分。,2019年5月18日2时23分,厚德载物 自强不息,11,因子分析数学模型,可测变量(measured variable) 潜在因子(latent variable),共性因子(common factor) 因子载荷(factor loading) 度量误差(measurement error),特殊因子(special factor),2019年5月18日2时23分,厚德载物 自强不息,12,因子模型矩阵表示,2019年5月18日2时23分,厚德载物 自强不息,13,因子模型假设,2019年5月18日2时23分,厚德载物 自强不息,14,共性方差和个性方差,共性方差(共同度):反映Xi信息中被潜在因子解释的比例,2019年5月18日2时23分,厚德载物 自强不息,15,共性方差和个性方差,2019年5月18日2时23分,厚德载物 自强不息,16,X1方差中的80.5%被潜在因子f所解释; X2方差中的92%被潜在因子f所解释; X3方差中的64.5%被潜在因子f所解释。,2019年5月18日2时23分,厚德载物 自强不息,17,因子贡献和因子贡献率,因子贡献:因子fj对所有原始指标的贡献 因子贡献率( ):因子fj对所有原始指标的方差贡献率,2019年5月18日2时23分,厚德载物 自强不息,18,因子分析的基本步骤,1、因子分析的前提条件; 因子分析的前提条件是原始变量之间应 存在较强的相关关系。 2、因子提取,计算因子负荷; 3、使因子更具有命名可解释性,解释变量间的关系; 4、计算各样本的因子得分。,2019年5月18日2时23分,厚德载物 自强不息,19,因子分析的步骤,估计因子载荷 确定因子个数 解释潜在因子的实际意义 计算因子得分,2019年5月18日2时23分,厚德载物 自强不息,20,估计因子载荷,求原始变量相关矩阵; 求相关矩阵的特征根(因子的贡献),并排序 计算所有特征根对应的所有线形无关的特征向量; 特征向量转置,乘以特征根的平方根,即得到因子载荷。,2019年5月18日2时23分,厚德载物 自强不息,21,确定因子个数,一般原则: 累积贡献率(累积方差)达到7085; 特征根1。,2019年5月18日2时23分,厚德载物 自强不息,22,解释潜在因子的实际意义,解释潜在因子的实际意义,一般以因子载荷的大小为依据。因子载荷大的指标变量受潜在因子支配的作用大。 如何判别因子载荷的大小? 当因子载荷大于或等于0.5时,可认为该因子f支配对应的指标X。,2019年5月18日2时23分,厚德载物 自强不息,23,2019年5月18日2时23分,厚德载物 自强不息,24,特征向量,Eigenvectors Prin1 Prin2 Prin3 Prin4 Prin5 Prin6 x1 0.522252 -.195699 -.189953 -.253741 0.226568 0.732908 x2 0.525559 -.080164 -.167681 -.388390 0.304015 -.667812 x3 0.511208 -.181857 -.103986 0.334729 -.758103 -.089540 x4 0.345993 -.046978 0.741653 0.456060 0.346103 -.015969 x5 0.188783 0.656595 -.470338 0.498021 0.252640 0.013219 x6 0.185358 0.699199 0.392072 -.465521 -.312900 0.091793 第一主成分: C1=0.522252x1+0.525559x2+0.511208x3+0.345993x4+0.188783x5+0.185358x6,2019年5月18日2时23分,厚德载物 自强不息,25,主成分分析法,因子模型(全分量模型)表达形式 由 C=Ax反解为x=AC 即 矩阵A称载荷矩阵,反映各成分对原始变量x各分量的贡献大小。,2019年5月18日2时23分,厚德载物 自强不息,26,主成分分析法,因子模型(全分量模型)表达- 主成分标准化变换,2019年5月18日2时23分,厚德载物 自强不息,27,x=Lc,lij是xj和ci的相关系数 SPSS输出的系数矩阵是L矩阵,2019年5月18日2时23分,厚德载物 自强不息,28,实例主成分分析法 特征值(方差)及其比例,2019年5月18日2时23分,厚德载物 自强不息,29,主成分分析分析法L矩阵,注意L矩阵的下标,是列在前,行在后,2019年5月18日2时23分,厚德载物 自强不息,30,主成分分析法L矩阵,注意L矩阵的下标,是列在前,行在后,2019年5月18日2时23分,厚德载物 自强不息,31,迭代主成分(主因子)分析法 1. 收集原始数据并整理为下表,2019年5月18日2时23分,厚德载物 自强不息,32,2.对各指标进行标准化 3.求指标间的相关系数矩阵RX 4.求指标间的约相关系数矩阵R* (1)R*的非对角线元素与相关矩阵RX的 非对角线元素相等 (2)R*的对角线元素为共性方差,2019年5月18日2时23分,厚德载物 自强不息,33,5. 求出约关系数矩阵R*所有大于零的特 征值及相应的特征向量 6. 写出因子载荷阵A,得出原始指标X的 公因子表达式,2019年5月18日2时23分,厚德载物 自强不息,34,要求: 1. 保留公因子个数q小于指标个数m,原则: j1 前k个公因子累积贡献率70% 2. 各共性方差 接近于1。 3. 各原始指标在同一公因子Fj上的因子载荷 之间的差别应尽可能大。,2019年5月18日2时23分,35,林登(Linden)根据他收集的来自139名运动员的比赛数据,对第二次世界大战以来奥林匹克十项全能比赛的得分作了因子分析研究。这十个全能项目为:100米跑( ),跳远( ),铅球( ),跳高( ),400米跑( ),110米跨栏( ),铁饼( ),撑杆跳高( ),标枪( ),1500米跑( )。经标准化后所作的因子分析表明,十项得分基本上可归结于他们的短跑速度、爆发性臂力、爆发性腿力和耐力这四个方面,每一方面都称为一个因子。十项得分与这四个因子之间的关系可以描述为如下的因子模型: 其中 表示四个因子,称为公共因子, 称为 在因子 上的载荷, 是 的均值, 是 不能被四个公共因子解释的部分,称之为特殊因子。,2019年5月18日2时23分,厚德载物 自强不息,36,2019年5月18日2时23分,厚德载物 自强不息,37,2019年5月18日2时23分,厚德载物 自强不息,38,一、主成分法,2019年5月18日2时23分,厚德载物 自强不息,39,2019年5月18日2时23分,厚德载物 自强不息,40,2019年5月18日2时23分,厚德载物 自强不息,41,2019年5月18日2时23分,厚德载物 自强不息,42,2019年5月18日2时23分,厚德载物 自强不息,43,2019年5月18日2时23分,厚德载物 自强不息,44,2019年5月18日2时23分,厚德载物 自强不息,45,2019年5月18日2时23分,厚德载物 自强不息,46,2019年5月18日2时23分,厚德载物 自强不息,47,2019年5月18日2时23分,厚德载物 自强不息,48,因子旋转 当各公因子的专业意义难以解释时,可以 通过因子旋转来解决。 如求得的因子载荷阵A不甚理想,可右乘 一个正交阵T,使AT有更好的实际意义, 使各原始指标在同一公因子上 之间 差别尽可能增大。称因子正交旋转。 正交旋转可保持各指标的共性方差不变; 各公因子互不相关。 常用方差最大旋转法等。,2019年5月18日2时23分,厚德载物 自强不息,49,假设公因子Fj的解释能力能够以其因子载荷平方的方差来度量,考虑两个因子的平面正交旋转,设因子载荷矩阵为:,正交阵,记,2019年5月18日2时23分,厚德载物 自强不息,50,经过旋转要求,两组数据的方差达到最大。,即,2019年5月18日2时23分,厚德载物 自强不息,51,将V对求导,并令其为零,经过计算,其旋转角度可按下面公式求得,其中,由此就可以得出的取值范围。,2019年5月18日2时23分,厚德载物 自强不息,52,几点注意 1.因子分析的解不唯一 (1)同一问题可以有不同的因子分析解: 主成分解、主因子解、极大似然解 (2)进行因子旋转以获得更为满意的解。 2.因子得分 不能直接进行计算,但可以估计。,2019年5月18日2时23分,厚德载物 自强不息,53,3.主成分分析与因子分析间的关系 (1)两者的分析重点不一致 Z=AX 主成分为原始变量线性组合,重点在综合原始变量信息。 X=AF+e 原始变量为公因子与特殊因子线性组合,公因子重点反映支配原始变量的不可观测的潜在因素。,重
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 患者发生阿片类药物中毒的应急演练脚本(2篇)
- 病区火灾应急预案演练脚本内容(2篇)
- 智能穿戴健康数据医疗研究平台创新创业项目商业计划书
- 资产后续维护管理办法
- pcba下单管理办法
- 国际贸易货物进出口发票开具及风险控制合同
- 环保产业销售总监聘用合同及业绩目标协议
- it加班调休管理办法
- 预售期房买卖合同含智能家居系统升级服务
- 《智能交通系统隐私权保护与用户数据安全合同》
- 非静脉抗肿瘤药物的安全性
- 科技课件教学课件
- 卫生和微生物基础知识培训课件
- “三支一扶”、村官农业农村基础知识1000题
- 家庭健康照顾
- 人教版五年级上册数学期末考试试卷含答案
- GB/T 44665-2024上下肢运动功能评估与训练设备通用要求
- GB/T 21220-2024软磁金属材料
- 肩周炎课件教学课件
- 《数字媒体技术导论》全套教学课件
- 园林制图-课件完整版
评论
0/150
提交评论