




已阅读5页,还剩27页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
主成分分析与因子分析 山西医科大学卫生统计教研室刘桂芬liugf66 多变量大样本分析中 变量间存在共线性 增加了分析的复杂性 若分别分析各个指标 分析有可能是孤立的 而不是综合的 盲目地减少指标又有可能损失很多信息 得出错误结论 欲采用较少指标 反映原资料大部分信息 可采用主成分分析和因子分析 主成分分析 概念 主成分分析 principalcomponentanalysis 是将分散在一组变量上的信息 集中到某几个综合指标 主成分 上的一种探索性统计分析方法 它利用降维的思想 将多个变量化为少数几个互不相关的主成分 从而描述数据集的内部结构 主成分的几何意义 x1 x2 p1 p2 x1 对应m个变量的q个主成分如下 其中 分别是变量相关阵的前q个特征根对应的特征向量 的方差分别是q个特征根 1 2 q 是第i个变量在各个主成分上的载荷 而实际上载荷往往是指 它是第i个变量在各个标准化主成分上的载荷 据此可用最小二乘法解得标准主成分得分 标准化主成分的方差为1 PCA常用统计量 特征根 i 各成分贡献率 前各成分累计贡献率 特征向量各成分表达式中标准化原始变量的系数向量 就是各成分的特征向量 因子分析 一 因子分析模型 设X x1 x2 xp 为可观测的随机变量 且有f f1 f2 fm 为公共 共性 因子 commonfactor 简称因子 factor e e1 e2 ep 为特殊因子 specificfactor f和e均为不可直接观测的随机变量 1 2 p 为总体x的均值A aij p m为因子负荷 载荷 factorloading 矩阵 通常先对x作标准化处理 使其均值为零 方差为 这样就有假定 fi的均数为 方差为 ei的均数为 方差为 i fi与ei相互独立 则称x为具有m个公共因子的因子模型 如果再满足 fi与fj相互独立 i j 则称该因子模型为正交因子模型 正交因子模型具有如下特性 x的方差可表示为设 hi2是m个公共因子对第i个变量的贡献 称为第i个共同度 communality 或共性方差 公因子方差 commonvariance i称为特殊方差 specificvariance 是不能由公共因子解释的部分 因子载荷 负荷 aij是随机变量xi与公共因子fj的相关系数 设称gj2为公共因子fj对x的 贡献 是衡量公共因子fj重要性的一个指标 二 因子分析的步骤 1 输入原始数据xn p 计算样本均值和方差 进行标准化计算 处理 2 求样本相关系数矩阵R rij p p 3 求相关系数矩阵的特征根 i 1 2 p 0 和相应的标准正交的特征向量li 4 确定公共因子数 5 计算公共因子的共性方差hi2 6 对载荷矩阵进行旋转 以求能更好地解释公共因子 7 对公共因子作出专业性的解释 三 因子分析提取因子的方法 主成分法 principalcomponentfactor 每一个公共因子的载荷系数之平方和等于对应的特征根 即该公共因子的方差 极大似然法 maximumlikelihoodfactor 假定原变量服从正态分布 公共因子和特殊因子也服从正态分布 构造因子负荷和特殊方差的似然函数 求其极大 得到唯一解 主因子法 principalfactor 设原变量的相关矩阵为R rij 其逆矩阵为R 1 rij 各变量特征方差的初始值取为逆相关矩阵对角线元素的倒数 i 1 rii 则共同度的初始值为 hi 以 hi 2代替相关矩阵中的对角线上的元素 得到约化相关矩阵R R 的前m个特征根及其对应的单位化特征向量就是主因子解 迭代主因子法 iteratedprincipalfactor 主因子的解很不稳定 因此 常以估计的共同度为初始值 构造新的约化矩阵 再计算其特征根及其特征向量 并由此再估计因子负荷及其各变量的共同度和特殊方差 再由此新估计的共同度为初始值继续迭代 直到解稳定为止 因子载荷 负荷 aij是随机变量xi与公共因子fj的相关系数 设称gj2为公共因子fj对x的 贡献 是衡量公共因子fj重要性的一个指标 四 因子旋转 目的 使因子负荷两极分化 要么接近于0 要么接近于1 常用的旋转方法 1 方差最大正交旋转 varimaxorthogonalrotation 基本思想 使公共因子的相对负荷 lij hi2 的方差之和最大 且保持原公共因子的正交性和公共方差总和不变 可使每个因子上的具有最大载荷的变量数最小 因此可以简化对因子的解释 2 斜交旋转 obliquerotation 因子斜交旋转后 各因子负荷发生了较大变化 出现了两极分化 各因子间不再相互独立 而彼此相关 各因子对各变量的贡献的总和也发生了改变 适用于大数据集的因子分析 五 因子得分 Thomson法 即回归法回归法得分是由Bayes思想导出的 得到的因子得分是有偏的 但计算结果误差较小 Bartlett法Bartlett因子得分是极大似然估计 也是加权最小二乘回归 得到的因子得分是无偏的 但计算结果误差较大 因子得分可用于模型诊断 也可用作进一步分析的原始资料 六 因子分析应用的注意事项 应
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年滨州邹平怀远学校教师考前自测高频考点模拟试题带答案详解
- 【中考专题】2026年中考数学专项提优复习:方程与方程组【附答案】
- 2025汽车融资租赁合同范例
- 2025昆仑数智科技有限责任公司春季高校毕业生招聘15人模拟试卷及完整答案详解1套
- 2025湖南怀化国际陆港辰溪港区发展有限责任公司招聘工作人员拟聘用人员考前自测高频考点模拟试题及答案详解(考点梳理)
- 2025年河北廊坊市农林科学院公开选聘博士研究生1名考前自测高频考点模拟试题及参考答案详解1套
- 2025第二季度贵州安顺市平坝区美农科技有限公司招聘9人考前自测高频考点模拟试题及答案详解(必刷)
- 2025北京首都师范大学实验小学招聘2人模拟试卷附答案详解
- 2025杭州市钱塘区教育局所属事业单位高层次人才引进15人模拟试卷及参考答案详解一套
- 2025福建厦门市集美区实验小学顶岗教师招聘1人考前自测高频考点模拟试题及答案详解(易错题)
- 浙教版七年级下册科学-优化训练-第二章单元测试卷
- 民办学校未来发展策划与实施方案
- 临床课题申报书范例范文
- 山体.施工合同样本
- 肺结核课件培训
- 收单外包管理办法
- 维力能醋酸钠林格注射液
- 五四制青岛版2022-2023五年级科学上册第四单元第12课《安全用药》课件(定稿)
- 直播场景搭建
- 专题复习七选五的解题技巧课件(共22张)-副本-副本
- 智能网联汽车环境感知系统课件
评论
0/150
提交评论