《数据处理方法SPSS》PPT课件.ppt_第1页
《数据处理方法SPSS》PPT课件.ppt_第2页
《数据处理方法SPSS》PPT课件.ppt_第3页
《数据处理方法SPSS》PPT课件.ppt_第4页
《数据处理方法SPSS》PPT课件.ppt_第5页
已阅读5页,还剩192页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据处理方法 SPSS在教育中的应用 绪论 一 什么是定量研究 定量研究主要采取逻辑实证主义的观点 重视变量间的相关关系 重视假设检验法 强调受试样本的代表性 以使研究结果能有效推论到被试总体 通常使用抽样推断的策略 存在抽样误差和推断误差 推论结果存在犯错的概率 定量研究的过程 提出问题 理论假设 搜集资料 调查 实验 变量与变量值 分析资料 统计描述 统计检验 得出结论 验证假设 回答问题 二 变量的类型 变量指的是一种要研究的特性 内容或事项 变量的取值就是待处理的数据 变量有不同的类型 不同类型的变量 所适用的统计方法也不同 问题 家庭教养方式对学生成绩及性格影响的研究 有哪些变量 有哪些数据 如何获取这些数据 一 类别变量 名义变量 只说明某一事物与其它事物在属性上的不同或类别上的差异 例如 性别 种族 血型 气质观测方法 根据法则 标准确定数据形式 文字 符号 数字主要用途 用于分类比较统计方法 频数分析 二 等级变量 顺序变量 说明事物在某种属性上排列的等级或顺序 例如 等级分 学历 职称观测方法 根据法则 标准确定数据形式 文字 符号 数字主要用途 用于分类或累加统计方法 频数分析 等级排序 三 数值变量 数值变量 说明事物在某个属性上数量的大小 并且有相等的单位 例如 分数 智商 身高观测方法 测量数据形式 数字主要用途 用于量的计算与分析统计方法 描述统计 相关分析 假设检验 数值变量分类 数值变量 连续变量 离散变量 表示数量差异 分数 智商 身高 家庭人口数 报名人数 教室数 测量 计数 变量小结 大学生心理与行为调查表 一 基本情况1 性别 1 男 2 女2 家庭所在地 1 城市 2 城镇 3 农村二 态度与行为3 对现专业的态度 1 很满意 2 较满意 3 一般 4 不太满意 5 很不满意4 年均每月生活费用大概为元 其中伙食费约元 5 是否在做家教或兼职 1 是 2 否6 是否有恋爱对象 1 有 2 未明确 3 没有7 喜欢哪种教学方法 1 讲授式 2 自学式 3 研讨式 4 其它 大学生心理健康调查表 以下问题是为了了解您的健康状况 增进您的身心健康而设计的调查 请您根据自己最近或在一般情况下的态度和行为反应 对以下每一个符合您的项目 在题号前的括号内打 对不太确定的项目在题号前的括号内打 对不符合自己情况的项目 则不做任何记号 请您真实作答 心理咨询人员将严守秘密 并随时提供您所期待的帮助 1 非常看不惯某些同学的衣着打扮 行为举止 2 独立生活的能力较差 3 有一些别人不太接受的生活习惯 4 大学里消费很高 经济上的拮据常使我感到自卑 5 大学生活没有我以前想象的那样完美 6 特别想家和过去的朋友 7 学校里的学习资源利用得太少 8 感到还不太适应大学的学习方法 9 面临考试就会有莫名其妙的恐惧感 10 学习成绩不再名列前茅 感到十分苦恼 大学教师教学效果评价问卷 学生用 很不不很同同一同同意意般意意1 在老师所教的课中 我学到一些有价值的东西 2 通过老师上这门课 我对该学科的兴趣提高了 3 我学会并理解了老师所讲授的课程内容 4 通过上这门课 我提高了认识和分析相关问题的能力 5 通过上这门课 我提高了解决相关问题的能力 6 通过上这门课 我学会了如何学习该学科的方法 三 常用的统计分析方法 描述统计 频数分析 特征量分析 差异显著性检验 T 检验 方差分析 样本数据的分布研究数据的相关性研究 相关与回归分析 因子分析 四 数据预处理 定义变量 编码录入 存盘为原始数据 数据整理 审核数据 频数分析法 修改 处理异常数据 存盘 数据重编码 计算相关的统计指标 测量虚伪问题多选题的编码问题统计方案问题 进一步考虑的问题 五 设计统计方案 参考 统计方案是指对于特定的数据资料 根据研究任务的要求和已有的数据信息 所采取的有效的固定的统计策略 它所回答的问题是 对已有的数据资料应当如何统计 示例1 课程考试的统计分析 公管2000级学生52门课程考试的成绩任务 每门课程考试成绩的分布状态 同类课程的相关性程度 那些课程属于同类课程 考试成绩是否为正态分布 示例1的统计策略 由于考试成绩属于等距变量 因而可以作各种参数统计 对每一变量作频数分析 计算平均数和标准差对同性质的课程作相关分析对所有变量进行因素分析对所有变量作正态性检验 示例2 UPI心理健康调查 来自于日本的大学新生心理障碍筛选量表量表结构背景资料有 姓名 性别 专业 年级问题项目有62个 60个项目是关于各种心理感受和行为的 被试根据自己的实际情况回答有或没有 其中56个项目是症状题 4个项目是健康题 测伪尺度 不计分 另有两个问答题 问被试有无其它心理问题 示例2 统计任务 计分方法 56个症状题作肯定回答的记1分 测验完毕标出总分 筛选标准 有心理问题者 总分在25分以上者 第25题作肯定选择者应引起关注者 总分在20 24之间 第8 16 26题中有议题作肯定选择者 示例2 统计方案 总分及其分布状态 有心理问题的学生人数 比例 各项目的频数统计 不同学生群体之间的比较 第二次 三 SPSS的主要窗口 SPSS的主要窗口有数据窗口 输出窗口 语法窗口和脚本窗口四种 常用的是前两种 数据编辑窗口 DataView 变量格式设置窗口 VariableView 输出浏览器 Viewer 三 语法窗口 SyntaxEditor 存储分析过程中的命令程序 需利用各功能对话框中的 Paste 按钮 语法文件 SPS语法文件是由一系列命令行组成的 命令行中往往包括命令和子命令 前者确定基本功能 后者指示待分析的变量和处理方式等 打开已经存在的语法文件 File Open Syntax 四 脚本窗口 使用spss的脚本语言SaxBasic编写程序 用以扩展功能 四 SPSS的帮助系统 在使用SPSS进行统计分析遇到困惑时 可以借助于帮助系统 联机帮助 Help Topics 打开帮助主题对话框 在线帮助 在功能对话框中点击 帮助 按钮 图解帮助 Help Tutorial 右键提示 在对话框中对某个控件的用途不清楚时使用右键提示更为方便 五 对话框 变量列表 原始 工作 标准按钮其它选项 子命令 六 系统选项设置 参看p17思考问题 有哪些选项可以根据需要进行设置 思考与练习 系统设置中有哪些选项可以根据需要进行设置 Spss支持网提供的哪些附加安装包可能会在使用中用到 打不开 1 从数据编辑器输入数据 3 文件导出 导出的对象 全部或选择文档 导出格式 Excel Word HTML 文件名 统计结果引用时图标的编辑 每一项统计结果加上标题号 论文编排 去掉第一列 有效 缺失值 行 也可考虑删掉 为简洁起见SPSS17 0汉化版 可编辑统计结果 作业一 研究生心理健康调查 数据的录入与保存 一 数据的插入与删除 一 变量的插入与删除 二 个案的插入与删除 变量计算举例 考试调查 合计 测量知识 二 Count 统计符合某种条件的个案 将符合一定条件的变量值标注为1 并用新变量名表示 便于统计汇总 操作 Transform Count 将参与计数的变量选到numericvariable框中确定新变量名及标签targetvariable定义计数区间definevalues如需选择满足条件的个案 单击If 四 数据文件的分割 将数据文件按某个分类变量划分为不同的组别 以便进行各组数据特征的统计分析比较 操作 Data SplitFile Organizeoutputbygroups 选择分类变量 Ok 分别输出各组资料的统计分析结果 以便查看和选用 Data SplitFile Comparegroups 选择分类变量 Ok 比较 作业二 数据整理与编辑 三 偏度与峰度 前面讨论了分布的集中趋势和离散趋势 要全面了解分布的特点 仅了解分布的集中趋势和离散程度是不够的 还需要了解分布是否对称和集中趋势高低等特征 偏度和峰度就是对分布的进一步描述 一 偏度 skewness 所谓偏度是指反映频数分布偏态方向和程度的测度 从方向上看 偏度分左偏和右偏两种 当 0时 表示分布是正态的或对称的 当 0时 表示右偏或正偏 当 0时 表示左偏或负偏 越接近于0 表示分布偏斜程度越小 二 峰度 kurtosis 所谓峰度 指频数分布曲线高峰的形态 峰度就是用来衡量频数分布曲线的高耸程度的一个数字特征 当 0时 表示分布的峰度是正态分布的峰度 当 0时 表示分布曲线的高峰是尖顶高峰 当 0时 表示分布曲线的高峰是平顶高峰 四 交互分析 交叉分组下的频数分析列联表分析任务 分析两变量频数分布的列联表分析两变量有无关联 卡方检验示例 学生课外活动调查结果 连续性校正 2检验 仅适用于四格表资料 在n 40 所有期望频数均大于1 只有1 5单元格的期望频数大于1小于5时 Fisher精确概率法 在样本含量40 最小期望频数 5时 结论与Pearson 2基本一致 几种卡方检验的比较 四格表卡方检验 根据问卷做一个统计方案 写出计划进行哪些统计分析学过的方法运用一下可以写出考虑到的问题 比如多选题 数值变量 类别变量等 归纳问卷时将相似的问题进行总结归类例如 不同职称 年龄 性别对新课改的了解程度将统计结果放在WORD文档里面 并作简要的数据说明 描述统计练习 师德调查数据Sddc0 sav 数据整理 recodet7 t8 computet71 t72 t8频数分析交互分析 单因素方差分析 双因素方差分析 方差分析的基本思想 导致观测变量数据变化的原因有二 其一是控制变量不同水平所产生的影响 其二是随机因素所产生的影响 如果控制变量的不同水平对观测变量产生了显著影响 必然导致观测变量的数据发生较大的变异 反之亦然 例题 师德调查数据sddc sav关于我校师德问题的评价 不同政治面貌的老师之间有无显著差异 多因素方差分析 Univariate 是检验两个或两个以上因素变量 自变量 的不同水平是否给一个 或几个相互独立的 因变量造成了显著的差异或变化的分析方法 多因素方差分析包含一个因变量 至少两个自变量 因素 每个因素把被试区分为至少两个实验水平 因变量必须是连续型变量 多因素设计的方差分析过程通常分两步 首先对因素主效应和交互效应进行综合检验 如果效应显著 然后再作进一步检验 第一因素的主效应 在平衡第二因素各水平之间效应的前提下 因变量在第一因素各水平上的均值是否存在显著差异 第二因素的主效应 在平衡第一因素各水平之间效应的前提下 因变量在第二因素各水平上的均值是否存在显著差异 两因素的交互效应 因变量在第一因素各水平上的均值差异是否是第二因素各水平的变异函数 也就是说 在两个因素共同作用下 因变量在因素各水平上的差异是否显著 上述三类效应只要有一类显著 都需作事后检验 如果仅有因素主效应显著而交互效应不显著 需要进行多重比较 以发现具体差异发生在哪些水平之间 如果仅有交互效应显著 通常不需要解释因素主效应 而应对交互效应作进一步检验 多因素方差分析的目的是分析各个自变量的独立作用 各个自变量之间的交互作用和其他的随机变量对观测变量 因变量 的影响 统计学上的定义和计算公式 定义 多因素方差分析中的控制变量在两个或两个以上 它的研究目的是要分析多个控制变量的作用 多个控制变量的交互作用以及其他随机变量是否对结果产生了显著影响 例如 在获得教学效果的时候 不仅单纯考虑教学方法 还要考虑不同风格教材的影响 因此这是两个控制变量交互作用的效果检验 多因素方差分析不仅需要分析多个控制变量独立作用对观察变量的影响 还要分析多个控制变量交互作用对观察变量的影响 及其他随机变量对结果的影响 因此 它需要将观察变量总的离差平方和分解为3个部分 多个控制变量单独作用引起的平方和 多个控制变量交互作用引起的离差平方和 其他随机因素引起的离差平方和 以上F统计量服从F分布 SPSS将自动计算F值 并根据F分布表给出相应的相伴概率值 分析解释 SPSS中实现过程 研究问题 三组不同性别学生的数学成绩 实现步骤 第七章相关分析 一 相关分析的概念 连续变量之间是否存在相关关系 如果有的话 是什么样的关系 正相关与负相关 线性相关与曲线相关 高相关 中相关还是弱相关 相关分析就是要回答这些个问题 相关系数 相关系数是描述两个变量之间相关关系的统计指标 一般用r来表示 并且 r 1 r 0 表示零相关 r 1 表示高相关 r0 表示正相关 相关系数是否有统计意义还需做假设检验 二 相关分析三个过程 相关分析功能被集中在Statistics菜单的Correlate子菜单中 一般包括三个过程 Bivariate过程Partial过程Distances过程 略 操作选项 Variables框 至少选入需要进行相关分析的两个变量 CorrelationCoefficients复选框组 用于选择相关分析指标 Pearson Kendall stau b Spearman TestofSignificance单选框组 一般选双侧检验 Flagsignificantcorrelations 用于确定是否在结果中用星号标记有统计学意义的相关系数 一般选中 此时P 0 05的系数值旁会标记一个星号 P 0 01的则标记两个星号 Options钮 选择需要计算的描述统计量和统计分析 Partial过程 Controllingfor框 用于选择需要在偏相关分析时进行控制的协变量 如果不选入 则进行的就是普通的相关分析 偏相关分析的结果和普通相关分析几乎完全相同 非常容易看懂 第八章回归分析 回归分析用于解决实际工作中出现的一个因变量受一个或多个自变量影响的问题 我们希望建立一个数学模型 以便通过自变量的变化推测和控制因变量的变化 一 理论概要 回归分析 regression 作用 通过一个或几个变量的变化去解释另一变量的变化 通过散点图观察变量之间的统计关系 确定能够反映和拟合这种关系的数学模型 包括找出自变量与因变量 估计回归模型的参数 检验模型的有效性 估计预测等内容 一 线性回归模型 b0 b1x1 b2x2 bpxp a bx 二 回归分析一般步骤 确定回归方程中的因变量与自变量确定回归模型检验回归方程利用回归方程进行预测 二 一元线性回归 一 一元线性回归的前提条件 1 线性关系假设回归分析必须建立在变量之间具有线性关系的假设之上 2 正态性假设正态性的假设系指回归分析中的Y服从正态分布 3 独立性假设独立性假设有两个意思 一个是指不同X值对应的Y值之间没有关系 彼此独立 另一个是指误差项目独立 不同的X所产生的误差之间应相互独立 二 一元回归分析操作 三 实例解析 2000年悉尼奥运会上第一次列入女子举重的项目 各级别冠军的成绩如下 试利用这些数据组建模型 描述运动员举重的总成绩对运动员体重的依赖关系 根据模型分析哪些级别上运动员举重成绩还有较大的提高潜力 二 条件分析 1 线性分析 散点图 2 正态检验 非参数检验 3 相关分析 积差相关 三 基本操作 Analyze Regression Linear 打开 LinearRegression 对话框 选择变量和回归方法 1 设置自变量和因变量 2 设置回归方法为Enter方法 3 确认默认项Estimates和Modelfit 四 结果输出 测定系数回归方程检验回归系数检验 三 多元线性回归分析 一 多元线性回归的前提条件 线性 独立 等方差和正态性假设 此时的正态性假设是指在给定一组X后 Y的条件分布为正态分布 除此之外 在多元回归分析中 若自变量间存在相关性 称为多重共线性 回归分析应避免严重的多重共线性存在 二 回归分析原理 设y为因变量 x1 x2 xp是p个自变量 假设作了n次观测 即样本容量为n 则可得到如下数据 yi xi1 xi2 xip i 1 2 n回归方程 yi b0 b1xi1 b2xi2 bipxp i其中 b0 b1 b2 bp 是p 1个待定参数 i表示第i次观测中 随机因素对yi的影响 多元线性回归模型 y b0 b1x1 b2x2 bpxp 表明被解释变量y的变化可由两部分解释 第一 由p个解释变量x的变化引起的y的线性变化部分 第二 由其它随机因素引起的y的变化部分 bi表示当其它解释变量保持不变时 xi每变动一个单位所引起的y的平均变动单位 自变量作用分析 并非全部自变量都有必要纳入到回归方程内 纳入方程的自变量应满足三个条件 1 自变量作用显著 能引起Y显著变化 对回归方程作F检验 2 方程中回归系数的作用显著 对bi 0 作T检验 3 欲进入的自变量应当与已进入的自变量相关程度足够低 比如Tolerance 0 0001 表示相关低 可以进入方程 三 回归方程的有效性检验 回归方程的拟合优度检验 决定系数 回归方程的显著性检验 方差分析 回归系数的显著性检验 T检验 残差分析 略 回归方程的拟合优度检验 检验样本数据点聚集在回归线周围的密集程度 从而评价回归方程对样本数据的代表程度 取决于回归平方和在总平方和中的比例决定系数R2接近于1 表明拟合优度好 决定系数 测定系数R2开方后得R 它表示因变量Y与p个自变量线性组合之间的相关 叫复相关系数 可以通过复相关系数的显著性检验来对回归方程进行检验 复相关系数显著则回归方程也显著 偏回归系数的显著性检验 对于回归系数b进行显著性检验后 如果b是显著的 同样也表明所建回归方程是显著的 或说X与Y之间存在显著的线性关系 某一个偏回归系数不显著时 回归方程可能仍然显著 方差分析是对整个回归方程的显著性检验 与单独进行每个偏回归系数的显著性检验不一定等效 回归方程显著 每一个偏回归系数也不一定都显著 四 实例分析 本例书中计算有误 从10个居民点采集到一批数据 数据见实例8 2 因变量y是表示想购置某种高档时装的青年人百分比 自变量X1表示某居民点的青年人的受教育水平的某种指数 自变量X2表示青年人所在家庭的月人均收入 元 要求建立X1与X2共同估计Y的回归方程 时装消费调查数据 一 条件分析 1 线性分析 略 2 正态检验3 相关分析略 正态检验结果 二 菜单操作 Analyze Regression Linear 打开 LinearRegression 对话框 1 设置自变量和因变量2 选择回归方法Stepwise方法3 确认默认项 Estimates 和 Modelfit 4 选择偏相关分析 多重共线性检验选项 三 结果解读 1 测定系数 测定系数r2 0 849 即自变量可以解释因变量的84 9 的变异 2 回归方程的有效性检验 F 1 8 51 684 p 0 000 0 001 可以认为 回归方程非常显著 3 偏回归系数的显著性检验 相关分析多重共线性分析 此处结果有误 t 7 189 p 0 000 0 001 可以认为 自变量x1对y的影响显著 在相关分析列中 偏相关 部分相关和普通相关系数值相等 说明变异所解释因变量再不能被其它变量所解释 容忍度值为1 VIF值为1 无多重共线性问题 4 多重共线性分析 特征值为0 003 条件指数等于25 546 可能存在多重共线性问题 小提示 多重共线性检验指标分为四个 容忍度 Tolerance 该变量不能被其它变量解释的变异百分比 容忍度越小 多重共线性问题越严重 容忍度接近0时 多重共线性问题非常严重 方差膨胀因子 VIF 容忍度 Tolerance 的倒数 VIF越大 多重共线性问题越严重 一般情况下 VIF大于2 多重共线性问题严重 特征值 Eigenvalue 接近于0时 多重共线性问题非常严重 条件指数 ConditionIndex 其大于15时 可能存在多重共线性问题 其大于30时 多重共线性问题严重 实验作业一 一家汽车研究机构对国内汽车市场进行监测 收集了每个汽车品牌的年销售量数据以及汽车的各种性能指标 数据见实例8 3 研究者希望确切掌握影响汽车销售量的主要因素是什么 假设你是一位应用心理学专业人力资源管理方向的本科生 请你予以解决这个问题 实验作业二 以下给出了某班12名同学两次考试的成绩 求Y对X的线性回归方程 然后对所求方程进行方差分析 以检验其显著性被试号 123456789101112考试一 X 656367646862706668676971考试二 Y 686668656966686571676870 1 因子分析的目的 因子分析的主要目的是为了发现隐藏在一整套观测变量背后的主要因子或公共因素 主成分 在尽量保持原有信息的基础上 减少变量个数 简化结构 以求对整个变量集有更好的理解 当然 在求得这些因子之后 必须要对这些因子进行合理的解释 即 命名 2 因子分析的应用 因子分析的主要应用有两个方面 一是寻求基本结构 简化观测系统 二是对变量进行分类 3 因子分析模型的构造 假如从p个变量的数据文件进行因子分析得到m个共同因子 那么m个共同因子的变化可以解释各个变量的大部分变异 换句话说 用这m个因子可以在相当程度上预测每一个变量的变化 于是得到下列回归方程组 基于这样的假设 相应的因子模型为 x1 a11F1 a12F2 a1mFm 1x2 a21F1 a22F2 a2mFm 2 xp ap1F1 ap2F2 apmFm p式中 F1 F2 Fm为m个公共因子 1 2 p为特殊因子 aij为因子载荷 A aij p m 为因子载荷矩阵 4 因子的特点 因子分析以较少的信息丢失为前提 将众多的原始变量综合为较少几个因子 因子个数远少于原始变量的个数 因子能够反映原始变量的绝大部分信息 因子之间的线性关系不显著 因子具有命名解释性 5 因子载荷 因子载荷aij是第i个变量在第j个公因子上的载荷 或者说 第i个变量与第j个公因子的相关系数 载荷较大 说明第i个变量与第j个公因子的关系越密切 载荷较小 则说明第i个变量与第j个公因子的关系越疏远 同时 因子载荷aij也反映了因子fj对解释变量xi的重要作用和程度 6 变量共同度 公共方差 对某一个原变量来说 其在所有因子上的载荷的平方和就叫做该变量的共同度 它反映了所有公共因子对该原变量的方差 变异 的解释程度 如果因子分析结果中大部分变量的共同度都高于0 8 说明提取的公共因子已经基本反映了原变量80 以上的信息 因子分析效果较好 变量共同度是衡量因子分析效果的常用指标 7 公共因子的方差贡献 是某公共因子对所有原变量载荷的平方和 它反映该公共因子对所有原始总变异的解释能力 等于因子载荷矩阵中某一列载荷的平方和 一个因子的方差贡献越大 说明该因子就越重要 二 因子分析的基本步骤 确定原有变量是否适合进行因子分析构造因子模型 因子载荷矩阵的旋转 因子解释 计算因子变量的得分 1 因子分析适合度检验 因子分析的前提条件是原始变量间必须有相关 巴特利特球度检验 零假设为 相关系数矩阵为单位阵 如果经检验 p值小于 05 则拒绝零假设 原变量适合做因子分析 KMO检验 KMO越接近1 说明变量间的相关性越强 KMO如果小于0 5 不适合因子分析 巴特利特球形检验 BartlettTestofSphericity 该检验首先假设变量相关矩阵为单位阵 对角线为1 非对角线为0 然后检验实际相关矩阵与此差异性 如果差异性显著 则拒绝单位阵假设 即认为原变量间的相关性显著 适合于作因子分析 否则不能作因子分析 反像相关矩阵检验 Anti imagecorrelationmatrix 反像相关矩阵检验以原变量的偏相关矩阵为基础 将偏相关矩阵中的每个元素 偏相关系数 取反 即取负 得到反像相关矩阵 如果原变量间相互作用较大 则控制了这些相互作用后的偏相关系数较小 此时反像相关矩阵中的元素的绝对值比较小 则适合于做因子分析 反之则不适合于作因子分析 KMO Kaiser Meyer Olkin 检验 KMO值大 适合于因子分析 反之 KMO值较小 不适合做因子分析 Kaiser提供的判断标准是 0 9 KMO 非常适合0 8 KMO 0 9 适合0 7 KMO 0 8 一般0 6 KMO 0 7 适合度较低KMO 0 6 适合度很低 2 构造因子 因子分析的一个重要环节是要确定提取的公共因子及其个数 方法是多种多样的 但最常用的是主成分分析法 主成分分析法是对原相关变量进行线性变换 使之转换为另外一组相对独立的变量 这一组变量被称为是主成分 它与原变量具有线性回归关系 即可由原变量的线性组合得到 反之亦然 转换得到的每一主成分可以代表或解释一部分原变量的变化 按照其解释变量的量从大到小排列 一般选择主成分数是使解释变异量累加到80 以上 但有时又需要结合公共因子的可解释性来确定提取的公共因子数 也可以用碎石图来直观反映主成分数与其解释原变量的累加效果以帮助确定提取公共因子数 3 因子变量的命名解释 根据前述分析 因子分析得到的每个公共因子都对原变量中的每一变量作出一定解释 而解释程度的大小反映在因子载荷大小上 一般我们可以得到每一列的因子载荷中有一些是比较大的 而另一些比较小 就可以知道该列对应的因子主要解释了哪些变量 以此确定该公共因子的主要特征和内涵 但有时 因子载荷的大小差异不是非常明显 公共因子的命名和解释就比较困难 这时可以使用因子矩阵旋转对因子矩阵作变换 增加因子载荷的差异性 提高因子的可解释性 最常用的因子旋转是方差极大法 因为此种方法使因子载荷获得最佳分化 4 计算因子得分 计算因子得分就是先要根据因子分析建立每个因子的回归方程 然后将具体个案的原变量分数代入就可以求出该个案的各因子分数 三 因子分析的SPSS过程 第一步 准备数据文件 打开对话框 加载观测变量 数据文件主要是由较多的 一般在10个以上 可观测变量组成 个案数应比较大 然后点击 Analyze 选择 DataReduction 中的 Factor 打开因子分析对话框 将参与分析的所有观测变量加载到 Variables 下边的方框中 第二步 点击 Descriptives 设置描述性统计要求 这里关键的是要求输出因子分析适合度的检验 一般要求输出 计算相关系数矩阵 选中Coefficients 相关系数显著性水平矩阵 选中Significancelevels 反像相关矩阵检验 选中Anti image KMO和巴特利特球形检验 选中KMOandBartlett stestofsphericity 第三步 点击 Extraction 打开对话框设置因子提取方式 在界定因子提取方法中需要设置以下几个方面的参数 1 因子构造方法 大多数情况下认为因子是变量的线性组合 所以使用最多的是主成分分析法 Principalcomponents 2 提取因子数 选中Numberoffactors后输入一个因子数 如果还无法确定可以不设定因子数 先以默认状态进行尝试性分析 3 在 Display 下选中 Unrotatedfactorsolution 和 Screeplot 以输出未经旋转的因子载荷矩阵 碎石图 执行之后根据输出信息确定提取因子数 比如根据碎石图来确定 第四步 点击 Rotati

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论