




已阅读5页,还剩25页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2020 4 18 1 多元统计分析 因子分析 2020 4 18 2 2020 4 18 3 多元统计分析 简称多元分析 是运用数理统计的方法研究多变量 多指标 问题的理论和方法 是一元统计学的推广 2020 4 18 4 因子分析的提出 为尽可能完整描述一个事物 往往要收集它的许多指标多指标产生的问题 计算处理麻烦信息重叠从众多的指标中剔除一些指标又会造成信息丢失 2020 4 18 5 因子分析是研究如何以最少的信息丢失将众多原有变量浓缩成少数几个因子 如何使因子具有一定的命名解释性的多元统计分析方法 其核心是用较少的相互独立的因子反映原有变量的绝大部分信息 2020 4 18 6 因子分析的基本思想 因子分析的基本出发点将原始指标综合成较少的指标 这些指标能够反映原始指标的绝大部分信息 方差是各变量值与其均值离差平方的平均数 是测度数值型数据离散程度的主要指标 这些综合指标之间没有相关性 2020 4 18 7 因子分析的基本思想 因子变量的特点这些综合指标称为因子变量 是原变量的重造个数远远少于原变量个数 但可反映原变量的绝大部分方差不相关性可命名解释性 2020 4 18 8 因子分析的基本步骤 确认待分析的原始变量是否适合作因子分析构造因子变量利用旋转方法使因子变量具有可解释性计算每个样本的因子变量得分 2020 4 18 9 因子分析的数学模型 数学模型 xi为标准化的原始变量 Fi为因子变量 k p 也可以矩阵的形式表示为 X AF F 因子变量A 因子载荷阵aij 因子载荷 特殊因子 2020 4 18 10 因子分析的相关概念 因子载荷在因子变量不相关的条件下 aij就是第i个原始变量与第j个因子变量的相关系数 aij的绝对值越大 则Xi与Fi的关系越强特殊因子表示了原有变量不能被因子解释的部分 其均值为0 相当与多元线性回归模型中的残差 2020 4 18 11 因子分析的相关概念 变量的共同度 Communality hi变量的共同度hi也称公共方差 Xi的变量共同度为因子载荷矩阵A中第i行元素的平方和 可见 Xi的共同度反应了全部因子变量对Xi总方差的解释能力 2020 4 18 12 可见 Xi的共同度反应了全部因子变量对Xi总方差的解释能力 2020 4 18 13 因子分析的相关概念 因子变量Fj的方差贡献SJ因子变量Fj的方差贡献SJ为因子载荷矩阵A中第j列各元素的平方和 可见 因子变量Fj的方差贡献体现了同一因子Fj对原始所有变量总方差的解释能力Sj p表示了第j个因子解释原所有变量总方差的比例 2020 4 18 14 检验原有变量是否适合作因子分析 计算原有变量的相关系数矩阵一般小于0 3就不适合作因子分析计算KMO检验统计量是用于比较简单相关系数和偏相关系数的指标 取值在0 1之间 KMO越接近1 意味着变量间的相关性越强 原有变量越适合做因子分析 0 9以上表示非常适合 0 8表示适合 0 7表示一般 0 6以下表示不适合 2020 4 18 15 计算巴特利特球形检验统计量以原有变量的相关系数矩阵为出发点 其零假设是H0是 相关系数矩阵是单位矩阵 巴特利特球形检验的检验统计量根据相关系数矩阵的行列式计算得到 且近似服从卡方发布 如果该统计量的观测量比较大 且对应的概率p值小于给定的显著性水平 则应拒绝零假设 认为相关系数矩阵不太可能是单位矩阵 原有变量适合作因子分析 反之 原有变量不适合作因子分析 原有变量是否适合作因子分析 2020 4 18 16 确定因子变量 主成份分析 主成份分析法的数学模型 该方程组要求 将原有的P个相关变量Xi作线性变换后转成另一组不相关的变量Yi 2020 4 18 17 确定因子变量 主成分分析 系数uij依照两个原则来确定yi与yj i j i j 1 2 3 p 互不相关 y1是x1 x2 x3 xp的一切线性组合 系数满足上述方程组 中方差最大的 y2是与y1不相关的x1 x2 x3 xp的一切线性组合中方差次大的 yP是与y1 y2 y3 yp都不相关的x1 x2 x3 xp的一切线性组合中方差最小的 y1在总方差中所占比例最大 它综合原有变量的能力最强 其余变量在总方差中所占比例依次递减 即 其余变量综合原有变量的能力依次减弱 2020 4 18 18 确定因子变量 主成分分析 2020 4 18 19 确定因子变量 主成份分析 主成份分析的基本步骤 将原始数据标准化计算变量间简单相关系数矩阵R求R的特征值 1 2 3 p 0及对应的单位特征向量 1 2 3 p得到 yi u1ix1 u2ix2 upixp 2020 4 18 20 2020 4 18 21 确定因子变量个数 确定k个因子变量根据特征值 i确定 取特征值大于1的特征根根据累计贡献率 一般累计贡献率应在70 以上 2020 4 18 22 确定因子变量个数 确定k个因子变量通过观察碎石图的方式确定因子变量的个数 2020 4 18 23 因子变量的命名解释 发现 aij的绝对值可能在某一行的许多列上都有较大的取值 或aij的绝对值可能在某一列的许多行上都有较大的取值 表明 某个原有变量xi可能同时与几个因子都有比较大的相关关系 也就是说 某个原有变量xi的信息需要由若干个因子变量来共同解释 同时 虽然一个因子变量可能能够解释许多变量的信息 但它却只能解释某个变量的一少部分信息 不是任何一个变量的典型代表 结论 因子变量的实际含义不清楚 2020 4 18 24 因子变量的命名解释 通过某种手段使 每个变量在尽可能少的因子上有比较高的载荷 即 在理想状态下 让某个变量在某个因子上的载荷趋于1 而在其他因子上的载荷趋于0 这样 一个因子变量就能够成为某个变量的典型代表 它的实际含义也就清楚了 2020 4 18 25 因子变量的命名解释 2020 4 18 26 因子分析的基本步骤 1 菜单选项 analyze DataReduction Factor2 选择参与因子分析的变量到Variables框3 Discriptive 分析是否适合做因子分析4 Extraction 选择构造因子变量的方法 默认主成分分析法 Extract框 指定确定因子个数的标准5 Rotation 择因子载荷矩阵的旋转方法 默认是不进行旋转 一般可以选择Varimax选项采用方差极大法旋转 2020 4 18 27 计算因子得分 因子得分是因子变量构造的最终体现 基本思想 是将因子变量表示为原有变量的线性组合 即 通过因子得分函数计算因子得分因子得分可看作各变量值的权数总和 权数的大小表示了变量对因子的重要程度 2020 4 18 28 因子分析的应用举例 因子分析在心理学上的应用因子分析在经济分析上的应用 2020 4 18 29 利用因子分析方法对贵阳市中学生进行女性性别角色期望调查分析 分析显示 传统的女性角色并不被现代中学生完全接受 无论是男中学生还是女中学生都在力图探求一种新的女性性别角色模式 但两性对这一新的女性性别角色模式的期望和把握
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 课件显示备注
- 2025年中国双层炉排立式蒸汽锅炉数据监测研究报告
- 口语内容考试题及答案
- 植物检疫工岗位操作技能考核试卷及答案
- 溶剂油装置操作工操作考核试卷及答案
- 酒吧经理考试题及答案
- 景泰蓝点蓝工异常处理考核试卷及答案
- 禁止超车考试题及答案
- 2025年中国复盖件数据监测报告
- 偏钨酸铵制备工岗前考核试卷及答案
- 2025 骨髓纤维化护理课件
- 电力营销考试题库及答案
- 监察法专题培训课件
- 人证网约车考试题目及答案
- 宗教法律法规课件
- 钣金冷冲压激光切割折弯检验作业指导书
- 综合安防管理平台操作手册
- 2025秋部编版(2024)八年级上册历史 【教学课件】第1课《鸦片战争》
- 【石河子】2024新疆石河子市事业单位笔试附带答案详解
- 矿山视频监控设备管理制度
- 2025至2030年中国微晶石墨材料行业市场运行态势及发展战略研判报告
评论
0/150
提交评论