




已阅读5页,还剩31页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2004 3 10 ExploratoryFactorAnalysis SPSSApplication 1 心理学研究方法 第十三章演示 数据简化技术 探索性因素分析及SPSS应用DataReductionTechnique ExploratoryFactorAnalysis SPSSApplication凤四海 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 2 提纲 第一节因素分析原理概述一 因素分析基本原理二 因素分析模型及条件三 SPSS因素分析功能选项第二节因素分析的步骤一 数据适当性考察和因素数确定二 求解因素模式三 因素的解释和命名 因子旋转第三节斜交旋转和因子值应用一 因子相关时的旋转 斜交旋转法二 因子值的意义及应用 可选讲 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 3 因素分析的主要目的 心理学研究中的一些心理特质 如自我 人格 智力等 往往都是一些 潜在变量 只能通过对一些可观测的 外显变量 的测量间接反应之 用一般的多元统计方法往往使得对数据的分析和描述陷入混乱 不仅如此 变量间的高度相关还会极大地削弱某些统计方法的效果 数据化简技术 主成分分析 对应分析 典型相关分析 多维量表法等 因素分析主要针对等距尺度变量 其主要目的 1 通过寻找或确定几个较少的假想 因子 来反映多个观测变量中蕴含的大部分信息 从而浓缩或化简观测数据 2 浓缩后的因子代表了数据间的基本结构 通过得到的因子估计值使研究者更方便地掌握数据的本质特质以及因子和观测变量之间的关系 多重共线性 返回 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 4 因素分析的发展历程 思想基础 包括启蒙运动 theEnlightenment 在内的思潮对绝对论 absolutism 的批判 任何实体都可能不是它表现出的模样 而是对其潜在现象的反映 符号主义 Symbolism 表现主义 Expressionism 19世纪兴起的对机械唯物主义的批判 提倡宏观论 发展历程 最早由KarlPearson 1901 引入 最早由CharlesSpearman在创立其智力理论时应用 Thurstone 1931 发展的 commonfactortheory 是其重要的理论基础 1940 s 1960 s是其发展的辉煌期 返回 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 5 因素分析的发展历程 三种主要应用观点 特质理论 Traittheory Spearman Thurstone Cattell回答 一组观测变量背后潜在的基本特质是什么 Dustbowlempiricism GodfreyThompson HenryKaiser回避了内容和理论 而关注应用聚类分析 Clusteranalysis Holzinger Tyron Bailey相信较低水平的观测 如项目 可以被整合成较高水平的具有理论价值的构念 返回 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 6 第一节因素分析原理概述 CommonFactorTheory及变异分解题项1 我对我的薪水感到满意 题项2 我对工作中的同事感到满意 题项3 我对工作中的上司感到满意 问题 我测量的是一个东西吗 因素分析假设变量的变异可分解成三个部分 公因子方差 各变量间的公共变异 特殊因子方差 不能由公因子解释的 变量特有的变异 误差方差 变量中不可信的 无法解释的变异 三者间的关系图示 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 7 1 h2指变量的变异中无法被公因子模型解释的部分比例因素分析使用变量间的相关 标准化数据的协方差 系数来估计公因子及连接因子和变量间的结构关系 因素负荷 一因素分析基本原理 可信的变异或 共同度 h2 独特变异 1 h2 因子F1 引起 或解释了题项1到4中的公共变异 l41指 变量4在因子1上的负荷 返回 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 8 主成分分析法 principalcomponentanalysis PCA 一种独立于因素分析的数据化简方法 SPSS默认的分析方法 用以寻找将变量以最优方式结合成少数几个成分 保持总变异 主成分数 变量数 主成分是变异的几何抽象 不一定复合真实情况 信息保留较多 主因子分析法 commonfactoranalysis PFAorCFA 假设公因子可以完全解释变量间的相关关系 而不一定能完全解释变量的变异 即不考虑特殊因子 用以确定变量背后的结构并估计因子得分 更符合实际情况 通常在主成分分析的基础上进行 只分析公共变异 常用于对变量方差不了解并不太考虑信息丢失的情况 一因素分析基本原理 简化数据 探索结构 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 9 一因素分析基本原理 将一组相关的观测变量转换成少数几个不相关的公因子 变换不改变变量的总方差 第一个主成分具有最大方差 随后抽取的主成分解释的数据变异量逐渐递减 如图13 1 第一 第二主成分分别是椭圆长轴 短轴 变量的变异用不相关的主成分表示 观测变量X Y可表示为因子空间f1f2f3中的向量 向量长度即共同度 向量在三个因子轴上的投影称因素负荷 变量间相关系数等于两变量共同度与夹角余弦乘积 各变量的因素负荷 夹角由公因素方差 相关系数决定 所谓的 求因素解 无非是在空间中设置适当的坐标轴 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 10 二因素分析模型及条件 公因子理论 p个观测变量 相当于一份问卷中的p个题项 它是一个随机变量 不同被试都将有p个不同的数据 m个公因子 其值称因子值 factorscore 代表残差 包括特殊因子和误差 是各变量中不能用公因子解释的部分 系数lij称为因子负荷 factorloading 表示第i个变量在第j个因子上的相对重要性 权数 正交模型因子间不相关 斜交模型因子间相关 返回 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 11 观测变量标准化 变量和因素的均值均为0 方差均为1 公共因素和独特因素间不相关 各独特因素之间也不相关 尤其在公因子分析法中 观测变量间线性相关 一般绝大部分应不低于0 3 正交模型要求公因子之间相互独立 尤其是主成分分析中 等距型数据 一些特殊情况下等级型数据也可以接受 最好是多元正态数据 尤其极大似然法 样本量越小 样本数据的分布和线性关系越需要加以检验 最好是100以上 二因素分析的假设条件 返回 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 12 三SPSS因素分析功能选项 返回 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 13 第二节因素分析步骤 筛选观测变量样本数据适当性考察确定因子数求解因素模式因子旋转 返回 因素分析适合度检验 参数估计 正交旋转 6 据结果调整旋转方法重复该过程至重复抽取过程 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 14 例13 1某研究者收集了100名被试对六种政策的回答数据 其中六个变量col1 col6分别表示 政府应当投入更多的教育经费 政府应当投入更多的经费减少失业 政府应当控制大企业 政府应当通过用校车送孩子上学加速废止种族隔离 政府应当增加少数民族的工作配额 和 政府应当扩展领先计划 例子讲解 分析之前 先要将原相关矩阵补齐 然后在相关阵前面增加两列标示变量ROWTYPE 和VARNAME 取值分别为CORR和6个变量名 再增加第一行数据 ROWTYPE 列取值N VARNAME 留空 其它6列变量取值100表明样本量 打开数据在SPSS因素分析菜单中按正常模式选择变量及其它选项后将命令粘贴到语句文件中 并将第二行语句改成 MATRIX IN COR 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 15 筛选观测变量 筛选观测变量是一个复杂的问题 它涉及到理论构想 编制量表前开放式问卷项目的归纳整理和项目分析等 模型中包含了无关的变量或者剔除了相关的变量可能极大地影响分析的结果 以下观测变量最好不选入模型 1 标准差低 通常表现为观测变量中被试的反应趋同 2 重测信度低 建议0 2 3 最大负荷值lij小 建议0 4 4 共同度hi2小 建议0 16 5 最大负荷值lij与共同度hi2之比小 建议0 5 6 最大两个负荷值lij与共同度hi2之比小 建议0 25 7 取样适当性系数 MSA 过小 8 多极变量 即一个变量在几个因子上的负荷都较大 返回 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 16 样本数据适当性考察 Bartlett球度检验 Bartlett stestofsphericity 近似 2检验 Ho 相关矩阵是单位阵 显然 其显著性水平要至少小于0 05 才能拒绝Ho 说明各个变量间存在相关 适宜进行因素分析 例子中 近似 2统计量 135 516 P 0 001 拒绝Ho 反映像相关矩阵 Anti imagecorrelationmatrix 其元素等于偏相关系数的负数 公因子存在时 偏相关系数实际上是特殊因子间的相关系数估计 应当接近于零 例子中绝大部分远离对角线的元素都小于0 1 可以接受 KMO取样适当性度量 Kaiser Meyer Olkinmeasureofsamplingadequacy 是变量间相关系数平方和占这两种系数平方和的比率 显然 KMO值越接近1越好 一般规定 0 9以上 极好 0 8以上 较好 0 7以上 一般 同时 每个变量的KMO值恰好为反映像相关矩阵的对角线元素 记为MSA MeasuresofSamplingAdequacy 例子中 KMO值为0 749 可认为比较好 Descriptives子对话框 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 17 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 18 确定公因子数 公因子数确定牵涉到很多问题 如变量数 模型拟合度 因子贡献等 因子数边界特征值准则 Kaiser准则 特征值 1 因子贡献 单变量 Joliffe准则 特征值 0 7 特征值 0 Cattell陡阶检验 也称碎石图 ScreePlot 检验 因子特征值中大的陡急坡度与缓慢坡度间的明显转折点 累计贡献率 建议 80 实际中40 60 也可做 在极大似然估计法中 使拟合度显著性水平不再减小 理论构想及公因子的可解释性也可作为参考 返回 Extraction子对话框 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 19 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 20 因素模式解法 PCA 对总体的分布没有什么假定 适用范围广 适合确定因子数作为初始解 初始共同度为1 PFA 需要估计初始共同度 常使用PCA的估计共同度 用每个变量和其余变量的复相关系数的平方R2 squaredmultiplecorrelation SMC 代替相关阵对角线元素 主轴因子法 Principalaxisfactoring 类似主成分法 a因子法 Alphafactoring 抽取 系数 0的公因子 映像分析法 Imagefactoring 利用映像理论 受抽样影响较大 最小二乘法 LeastSquares 剩余相关阵列向量元素的平方和达到最小 极大似然法 Maximumlikelihood 多维正态数据 似然函数达到最大求得因子解 返回 对角线元素的其它处理方法如 反复迭代法 最大相关系数法 参见有关文献 越需要准确地探求因素的场合 对共同度估计的要求越高 高共同度不一定高解释性 二者均利用MINRES原理 从模型拟合优度角度出发 回避了共同度估计问题 变量数较少 主成分法更好 随着变量数的增加 两种方法的差异越来越小 样本量很大时 后两类方法精度更高 可多种方法相互参照 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 21 例子求解和结果阅读 结果显示 共同度 communality 估计 观测变量xi方差中被公因子所解释的部分比例 说明变量能被所有公因子解释的程度 信度 等于模型 因素负荷矩阵中每行公因子负荷的平方和 记为hi2 上图为PCA结果 初始共同度均为1 抽取共同度 1 大多在0 6以上 下图为PAF结果 初始共同度很低 返回 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 22 因子解特征值及因子贡献率 因子贡献反映的则是单个因子解释的数据总方差 所有公因子的累计贡献等于所有变量的共同度之和 如果公因子数等于变量数 主成分分析 则也等于原观测变量的总方差 公因子j的贡献记为Vj 等于所有模型 因素负荷矩阵中每列因子负荷的平方和 更常用 贡献率 指标 相等 主成分特征值等于其因子贡献 例子求解和结果阅读 碎石图陡阶检验也显示抽取2因子 返回 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 23 因子负荷矩阵 表示第i个变量中第j个因子被反映的程度 衡量公因子相对重要性 相当于标准化回归系数 表示因子和变量间关系的密切程度 正交模型中 因素负荷矩阵 因素模式 factorpattern 等于因素结构矩阵 因素与变量相关矩阵 factorstructure 例子求解和结果阅读 抽取后变量共同度 行因子负荷平方和 0 7512 0 410 2 0 732 0 7352 0 404 2 0 704 0 6822 0 369 2 0 601 因子1贡献 列因子负荷平方和 0 7512 0 7352 0 6822 0 6522 0 5542 0 5752 2 633 重新计算变量间相关系数 r12 0 751 0 735 0 410 0 404 0 718 称为导出相关系数 Reproduced 看残差相关阵 返回 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 24 因子的解释和命名 因子旋转 因素分析的目的不仅是求出公因子 更主要的是要知道每个因子的意义 根据主成分法计算的因素模式解释很麻烦 因为大多数因子都和许多变量相关 因子旋转的目的 通过改变因子轴的位置 重新分配各因子所解释的方差比例 为了获得结构因子模式的 简单结构 simplestructure 在各因子上只有少数变量有较高的负荷 其它变量上的负荷 绝对值 很低 每个变量只在少数因子上有很高的负荷 任取两因子 负荷都低的变量尽量多一些 任取两因子 每个变量只能在一个因子上有较高负荷 简言之 就是调整因素负荷矩阵式中的行 列值向0和 1极化 使某些变量的负荷尽可能往某个因子上集中 而另一些变量的负荷尽可能往另一个因子上集中 以此类推 使得每个因子上仅 负载 几个变量 返回 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 25 正交旋转 因子轴之间保持90度角 因子不相关 SPSS提供三种基于 正交极大准则 的正交旋转法 方差最大法 Varimax 使各因子 列 上与该因子有关的负荷平方的方差最大 即拉开列上各变量的负荷差异 最常用 四次方最大法 Quartimax 使各变量 行 上因子负荷平方的方差达到最大 即拉开行上的负荷差异 易产生综合因子 大部分变量在该因子上都有较高负荷 平均正交法 Equamax 上两种方法综合 在Rotation对话框选择Varimax旋转 选中复选框因素负荷图 Loadingplot 在Options对话框选中将负荷较低 0 3 的值隐藏并按负荷大小排列 负荷量为0 3表示因素只解释了该变量方差的10 忽略 因子的解释和命名 因子旋转 返回 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 26 比较结果 旋转解保留了原来的2个因素 累计方差贡献不变 但各因素特征值大小平均了 相应地 所解释的方差比例相比抽出解也更加平均了 2因子各解释了约35 和30 的方差 因子的解释和命名 因子旋转 返回 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 27 典型的简单结构 可以看到变量col1 col2 col3和因子1有较大相关 变量col4 col5 col6和因子2有较大相关 变量对因子的归属一目了然 根据这些因子所解释的变量的含义 我们不妨将因子1 2分别命名为 经济政策 和 民族政策 因子的解释和命名 正交旋转结果 旋转图解 良好的旋转应当使得变量向量尽可能落在坐标轴附近 且各坐标轴附近积聚的变量数或者各因素的累计贡献应大致平均 二维坐标系中 正交旋转只需把坐标轴旋转到尽可能接近变量处即可 多维坐标系将因子空间分解成多个二维平面 分别进行简单结构的旋转 直到得出稳定 一致的结果 返回 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 28 第三节斜交旋转和因子值应用 对正交旋转的批评 实际研究中 因素间的关系往往很难满足因素正交要求 应考虑使用斜交旋转 斜交旋转因子间的夹角随意 因此理论上说 它对于解释因子更有利 斜交旋转的 高风险性 结果受分析者对斜交参数的定义影响 很大程度上取决于分析者的主观经验 同时也不利于研究结果的交流 替代办法 碰到因子间高度相关的情况 往往代之以减少因子数目或者做高阶因素分析 导致斜交旋转在实际应用中的功用被削弱 返回 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 29 一因子相关时的旋转 斜交旋转法 斜交旋转中的因素模式和因素结构因素负荷是向坐标轴平行投影 因素结构是向坐标轴的垂直投影 正交模型中 因素模式等于因素结构 简单模式结构和简单因素结构两种旋转标准 通常前者更方便 阅读斜交旋转结果的注意点 区分模式矩阵 patternmatrix 和结构矩阵 structurematrix 斜角解的因素负荷可能会超过1 计算因子贡献不能再使用负荷平方和办法 通常不给出 不给因素变换矩阵而代之以因素间相关矩阵 返回 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 30 SPSS斜交旋转法 直接斜交极小法 DirectOblimin 由参数 Delta 控制倾斜程度 该参数控制因子轴的倾斜程度 其中 0 8 一般 取大负值时表示因子间倾斜程度越低 越不相关 Promax法 Procrustes变换的一种特例 通过扩大初始简单结构中元素的大小差距 2次方或4次方 来取得简单结构 其参数 Kappa 即乘方数 1 此法比直接斜交旋转法的计算速度快 因此常用于大数据集 一因子相关时的旋转 斜交旋转法 强盗 旋转法 削足适履 返回 2004 3 10 ExploratoryFactorAnalysis SPSSApplication 31 二因子值意义及应用 某些情况下还要获得对因子的度量 如根据各因子得分对某个自变量或样本进行分类 评价 因子得分不能简单地将变量值相加 因为各变量在因子上的负荷不同 所以应当赋予变量不同的权
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 八年级物理下册 10.3 科学探究:浮力的大小(二)说课稿 教科版
- 1.3 民族 说课稿2023-2024学年人教版八年级地理上册
- 低延时与高可靠性通信技术的未来发展
- 管理考试题库及答案
- 关于ppp项目考试题及答案
- 计算机辅助设计与建筑工程管理的深度融合
- 工地员工考试题目及答案
- 影响施工进度的外部因素及应对策略
- 服装英语考试题及答案
- 改造历史建筑实现现代与传统的融合
- 新教科版小学1-6年级科学需做实验目录
- GB/T 8492-2024一般用途耐热钢及合金铸件
- 老年人认知障碍的早期识别与干预
- 《电子商务法律法规》课程标准
- 医院关于印发《即时检验临床应用管理办法》的通知
- EPC模式承包人建议书与承包人实施方案
- 主动防护网施工方案
- 三年级下册书法练习指导全册教案(湖南美术出版社)
- GB/T 17880.5-1999平头六角铆螺母
- 2023年陕西省直和西安市接收军转干部划分条件
- 客诉客退产品处理流程
评论
0/150
提交评论