高级心理统计讲义全套课件_第1页
高级心理统计讲义全套课件_第2页
高级心理统计讲义全套课件_第3页
高级心理统计讲义全套课件_第4页
高级心理统计讲义全套课件_第5页
已阅读5页,还剩397页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、高级心理统计讲义SPSS复习第一节 建立SPSS数据文件第二节 几种典型实验设计的数据录入第三节 数据变换第四节 数据的清洁第一节 建立SPSS数据文件1. 用SPSS Data Editor 建立数据文件变量命名 (Variable Name)以字母开头可包括字母,数字,, #, _, $, 或 period .长度不超过8 字符Period 不可在最后同样的变量命名不可在一个文件中多次使用不区别大小写(not case sensitive)定义变量定义变量类型:数值型/字符型定义变量测度:命名/等级/比例变量定义变量格式:小数点,列宽等变量标号值的标号变量类型 (Variable Type

2、) 默认 (default)Numeric8.2 变量标号 (Variable Label)输入变量值值标号 (Value Labels)SPSS 的值是大小写区别的(case sensitive)缺失值 (Missing Values)字符型变量无 system missing value,所以必须用 user-defined missing value 使用 copy paste插入变量或记录表 1.增加学费态度研究 Codebook名称 格式 变量标号/值标号ID F3.0 被试编号人口学变量 (Demographic variables)BIRTHY F4.0 出生年份GENDER A

3、1 性别/ “F” “女” “M” “男“CLASS F1.0 年级/ 1 一年级 2 二年级 3 三年级 4 四年级INCOME F6.2 月收入自变量 (Independent Variables)ESSAY F1.0 文章论题 / 1 “增加学费” 2 “增加税收“个体差异变量 CONS F2.0 Conscientiousness因变量 (Dependent Vvariables) SHOCK F1.0 心理学实验中应禁止使用电击/ 1 Strongly Disagree 2 “Disagree” 3 “Slightly Disagree” 4 “Slightly Agree”5 “A

4、gree” 6 “Strongly Agree” 9 “No Opinion on This Issue”TUITION F1.0 学费应该增加/ same value labels as SHOCKCOURSE F1.0 课业负担应该减少 / same value labels as SHOCK 存储数据文件SPSS 系统文件ASCII spreadsheet formats SPSS portable format 可用于 SPSS Unix, Vax, IBM mainframe version, SPSS/PC+, and SPSS version 7.0 用表格文件建立ASCII数据

5、文件SPSS9.0 或以下版本可读Excel worksheets, SPSS10.0或以上可读workbookSPSS9.0或以上可读取 xls4.0 文件SPSS9.0或以上系统文件可存储成 xls4.0 文件,用Excel 读取。SPSS OptionsEdit - OptionsGeneralVariable list - displayDataDisplay formats for new variablesSet century rangeViewerDisplay command in the log第二节 几种典型实验设计的数据录入组间设计组内设计列联表组间设计的录入一个变量在

6、一列,另设分组变量组内设计的录入变量的每次测量使用一列,n次测量就是n列列联表的数据录入下列是各类心血管疾病与A,B型人格分布的列联表 Weight cases 命令Weight by count第三节 数据变换 (Data Transformation)Compute由题目变量生成量表变量将变量转换以满足分布的某种特点Recode为方便起见,将连续型变量分组computecompute目标变量= 数值型表达式.Execute.IF (条件 )目标变量= 数值型表达式.对话框 TransformCompute少量可以用对话框,大量生成新变量则必须用syntax注意!每次做数据变换时,在code

7、book 或 variable label 中记录变量的表达式每次做数据变换时,开列一个原变量与新变量的对照表(包含少量但足够的cases),检查SPSS是否做的是所期望的compute运算的顺序()函数*,/+,-缺失值的处理对算术运算和算术函数,原变量任一值缺失,生成的目标变量该记录则为缺失值算术运算和算术函数算术运算算术函数SQRT (square root) - 平方根RND (round) - 四舍五入TRUNC (truncate)- 取整 统计函数function.n(variable list)SUM, MEAN, SD, MIN and MAX .n 表示记录中至少有n个有效

8、数据才计算,否则结果将输出为缺失值。.n的default 为1 或 2 (对离差函数如SD)变量间用,间隔“TO” 表达一系列变量 量表的分数计算应该用统计函数,不要用算术函数缺失值函数SYSMIS:变量有系统缺失值 =1;否则 =0。MISSING:变量有缺失值 =1;否则 =0。NMISS:点算所列变量缺失值的数目NVALID:点算所列变量有效值的数目VALUE:忽略user-defined 缺失值,将其视为有效值。 例:求均值的几种不同方法条件表达式If 表达式 compute只有符合条件时,才会生成新的变量用途:在不同条件时,变量有不同的操作方式recode将已有变量重新编码为同一变量

9、或新变量常见用途:将反题倒计分将数据按某一变量大小分为高,中,低组Recode 命令TransformRecodeInto Same Variables .Into Different Variables .可选择条件性重编码 IFRECODE atti01 atti04 (1=5) (2=4) (4=2) (5=1) 未提及的值不变注意每次做recode时,在codebook 或 variable label 中作相应的记录,才可save防止重复recode!建议总是recode 成不同变量RECODEatti01 atti04(1=5)(2=4)(3=3)(4=2)(5=1)INTO at

10、ti01r atti04r RecodeInto Different Variables 重新定义value label,missing value (user-defined)未提及的值会成为系统缺失值第四节 数据的清洁Explore: Statistics新的统计量5% trimmed mean 适用于有极端值或奇异值 (outlier)分布的偏度大interquartile range 75th percentile -25th percentile M-estimates: 给予中央位置以大的权重Explore: Charts直方图 (Histograms)与 Fre 相同,但不带有正

11、态曲线tests for normality 茎和叶图 (Stem-and-Leaf Plots)stem width显示分布形状箱图(Boxplots)Outlier:从矩形框始,在1.5 倍箱距的点之外Extreme:。3。箱图的组成处理outliers的原则 1.5 倍箱距的点之外的Outlier需要给予注意,如果是多于3个点位置很近,多数情况考虑保留3 倍箱距的点之外的Extreme value需要给予特别注意,如果是孤立的点,多数情况考虑可以作为缺失值计算一次,作为有效值计算一次。数据中不合理取值的认定涉及对于数据中所有变量取值范围的理解和确定如性别只能取值男和女有些心理量表要求答“

12、是”“否”,只能取值0和1如作一个跨文化的大学生被试的研究,在中国样本中年龄变量中的52取值已经可以认定为不合理取值,而在美国样本中就应视为有效值。 不合理取值可以定义为缺失值在遇到这些不合理取值时,如果条件容许,可以回到原始数据中去更正录入的错误。一般的情况下,在一个被试中,缺失值超过1/3时,该记录应该被视为无效而删去。 如何识别outliers综合几项信息确定 univariate outliers箱图Outliers 表列Z 分数与其他变量结合考虑 multivariate outliersOutliers 的原因输入错误数据不属于同一总体个别差异Outliers处理方法设为缺失数据转

13、换保留Tabachnick (1990)推荐了一套处理非常值的步骤包括非常值进行统计分析;先暂时将非常值定义为缺失值;重复作同样的统计分析,看定性的结果能否得到重复;如果定性的结果能得到重复, 即可得出结论非常值并没有歪曲结果。报告第一次统计分析的结果,并注名把非常值去掉不会显著地影响结果。如果定性的结果是不同的, 准确的解释需要更多的数据。同时报告两次统计分析的结果,说明对数据解释的不确定性。 非常值可能代表一个在被研究变量上效应不同的子群体。这一子群体可能需要特别的识别和处理。参考书 方差分析介绍方差分析(1)Oneway单因素 (Single-factor): 只有一个自变量Oneway

14、只用于组间设计 (between-subjects designs) 计划比较 Planned Comparisons 适用条件:预先有特定的假设设定 contrast 的规则为某一因素设定计划比较 时,必须为这一因素的所有水平设定 系数至少两个系数不能是 0所有系数的代数和必须为0。所有系数可同时乘以一个常数,所得contrast 是同样的事后检验 Post Hoc Tests Equal Variances Assumed 敏感:HSD保守:ScheffeEqual Variances Not Assumed Dunnetts T3选择适宜的事后检验成对比较 (pairwise) :所有可

15、能的两两组合 全距检验 (range tests):将所有组分成若干个 subsets; subsets 间的均值有显著差异,subsets 内的均值无显著差异。均值图 (mean plot)HSD pairwise test HSD range testOneway 不能提供的信息Oneway不能用于处理重复指标的设计 (repeated measures designs) .Oneway不包含每个单元格是否符合正态前提的检验因此 必须用 explore 来验证正态前提.如果不符合正态前提,Oneway不能提供其他的解决方法处理数据方差分析(2)General Linear Model (G

16、LM): 多元 (N-way): 有两个或以上自变量,也叫因素设计组间设计 (between-subjects designs)组内设计 (within-subjects designs)混合设计 (mixed designs)GLM的优势简单因素方差分析的局限不能有效地处理非均衡样本不能处理重复测量设计 (repeated measure design)一般线性模型(GLM)的优势可处理单变量和多变量设计ANOVA: 一个因变量MANOVA: 多个因变量有效地处理非均衡样本和空单位格最基本的 GLM 结果输出表1:组间变量及其各水平表列表2:方差分析表 sums of squares(和方)

17、F values (F值)significance levels(显著性水平)Effect sizeobserved power(实际效力)Intercept (截距):总均值是否与0 有显著差异Effect Size; 效应大小partial Eta squared (h2) 可归因于某个因素的总方差的部分对于单变量 F 检验 和 t 检验 h2 = (ssh)/(ssh + sse)ssh 是 假设的和方;sse 是 误差的和方如交互作用的效应:h2 = (144.00)/(144.00 + 330.00) = 144.00/474.00= .30430%的总方差可归结为交互作用的方差功效

18、(Observed Power)实际功效(Observed Power):是正确否定虚无假设的概率。如:交互作用的power 是 .630.如何增加功效? 增加样本量减少研究中的误差来源在例中可增加奖赏葡萄的最多数目解释显著的效应解释顺序:先交互作用,后主效应解释交互作用的方法简单主效应交互作用剖面图 交互作用表和图/PLOT = PROFILE( reward*drive ) /EMMEANS = TABLES(reward*drive)交互作用剖面图比较哪个变量当作横轴能更好地解释结果“对交互作用剖面图的考察表明:对于高驱力水平的动物,奖赏的数目对操作水平没有影响。而对于低驱力水平的动物,

19、奖赏的数目越多,动物操作水平越高。”交互作用的解释:简单主效应显著交互作用的存在说明一个因素(A)的效应取决与另一个因素(B)的水平即另一个因素(B)诸水平中自变量与因变量变化的模式不同将二因素实验拆分成一系列单因素实验来检验,称为简单主效应N个简单主效应的总和方应当等于该因素(A)的和方加上交互作用的和方处理不平衡设计的原则GLM 提供最有效处理不平衡设计的方法采用Type III 类型sums of squares (默认类型)报告未加权的边缘均值. Estimated Marginal Means option 。 unweighted means 事后检验都应在 Estimated M

20、arginal Means option 中进行. 不可用Post Hoc. 对话框不可用简单因素设计GLM中和方的类型Type I:层次化分解依据design 子命令校正,用于均衡设计中Type II:将正检验的效应除外校正,用于均衡设计中Type III:将所有其他的效应除外校正,可用于非均衡设计Type IV :为有空单位格的模型设计重复测量设计 (GLM Repeated-measures designs)两个水平称前后测 (pre-post design)记录被试在处理前后的一系列反应亦称组内设计 ,匹配组设计混合设计GLM Repeated Measures 的基本结果输出Mult

21、ivariate Tests Within Subjects Factors Mauchleys Test of SphericityTests of Within-Subjects EffectsTests of Within-Subjects ContrastsTests of Between-Subjects EffectsMauchly test of sphericity如果该检验不显著, 那麽将n 个单个自由度的估计量加在一起来代表n 个自由度的总体估计就是恰当的如果该检验显著,即sphericity前提不能满足,averaged F-tests 就过高估计了联系的强度。有两个办法

22、:忽略 averaged F-tests, 只报告 multivariate test of significance. 用 averaged F-tests 的校正公式. 如 Huynh-Feldt Epsilon解释显著的组内差异: 列出均值 选择描述统计 Display Descriptives 在组间因素的检验中,缺失值按 casewise 方法处理显示估计边缘均值 (estimated marginal means)Display Means for. 显示剖面图Plots. Horizontal Axis 解释显著的组内差异: 事后检验用比较主效应Estimated Margina

23、l Means Compare main effects 。注意所给出的比较是未校正过的Post Hoc. 对话框对检验组内差异不可用结果的报告 治疗对于改善 PTSD 的症状是有效的。 症状分数的均值从治疗前的 18.57 (SD = 8.29) 到结束治疗时的 6.00 (SD = 7.31, p .0005)。疗效在治疗后3个月和15个月的追踪时仍然保持。结束治疗时与治疗后3 个月,15个月追踪时的症状分数无显著差异 (M = 5.27, SD = 6.88, p = .422). 15个月追踪的症状分数 (M = 3.97, SD = 5.93) 与 15个月追踪没有分别 (p = .

24、114), 但显著地低于结束治疗时的症状分数均值 (p = .001)。混合设计 1个组内因素(2水平) X 1个 组间因素(2水平) Mauchley sphericity test 当组内变量只有两个水平Mauchley W statistic = 1.00df = 0 无显著性水平所有 epsilons = 1.00 校正后的df 与原来相同解释显著的交互作用: 列出均值Options. Esimated Marginal Means prepost 和 txcond 主效应 txcond*prepost 交互作用剖面图Plots. horizontal axis separate li

25、nes 结果的报告重复测量的方差分析结果表明: 前后测之间有显著的主效应, F(1, 74) = 73.11, p .0005; 并且前后测与处理条件间有着显著的交互作用, F(1, 74) = 41.45, p .001. 对于接受治疗的被试,治疗结束时的症状分数 (M = 6.64, SE = 1.426) 显著低于治疗前的症状分数 (M = 21.03 , SE = 1.458 ), F(1, 74) = 115.37, p 20 IV慎推广,须交互验证 层次回归:hierarchical 研究者根据理论假设确定次序,定义block因果顺序在前的,先进入方程欲考察的重要变量或者放在前,或

26、放在最后应选择 statistics R square change3. 多元回归的数据要求多元回归的数据要求 (1)因变量应为等距/等比型变量。 在实际操作中,如果有足够的水平,顺序型变量也可。如果因变量 是命名型,则须用判别分析或 logistic regression。 自变量应为等距/等比型变量。在实际操作中,顺序型变量也可。命名型若为 2水平 (dichotomies) 可直接用。命名型若为多水平, 可先转换为 dummy variables。因变量与自变量的关系应为线性。如果变量间关系是曲线的, 但具单调性 (递增或递减), 可通过转换达成线性。 如果是 U 型线,需特殊转换处理。

27、尽管自变量间彼此可以有相关, 其相关不可接近完全线性。否则称为 multicollinearity。多元回归的数据要求 (2)被试数目与自变量数目的比率为10:1 (根据不同情况在20:1至5:1 的范围中);被试数目 100没有 非常值 (Outliers)没有 Multicollinearity多元回归的统计前提3个前提:因变量残差正态分布残差与 预测值呈线性关系在因变量预测值的所有水平上,残差的方差相等散点图:纵轴为因变量的预测值(ZPRED),横轴为残差(ZRESID)残差图残差图告诉我们回归线在不同变量水平的拟合程度残差图提供的重要信息残差的系统分布提示有未被解释的系统性方差自变量增

28、大时,残差增大。变量间的关系不是线性的Multicollinearity Statistics. Collinearity diagnostics任何两个自变量间的相关在 .70以上, Collinearity 就会出现。Tolerance 75% 很好 ; 50-75% 不错; 25-50% 一般; 25% 不够 所有自变量总共与因变量有无显著关联? - F 虚无假设是 所有自变量与因变量均无关联。. 当其他自变量保持恒定时,每一自变量与因变量有什么样的关系? - B 回归系数。哪个自变量对因变量的影响最大? - beta 标准化回归系数(beta weights) 回归分析前,将因变量和自

29、变量都转换成Z分数。将所有自变量考虑在内后,每一自变量与因变量关系是否显著? - t 值报告回归分析的结果用同时多元回归的方法对数据进行了分析,性别,年龄,种族,教育年限作为预测变量。 回归模型的拟合度满意 (R2adj = 50.1%), 模型的总效应 (F4,466 = 159.2, p 0.0005)。当其他变量保持恒定时,教育年限与薪水有正相关, beta=.56,其效应是显著的(t466= 15.59, p 0.0005)。男员工的薪水高于女员工, beta=(-).26, 其效应是显著的(t466= 7.51, p 0.0005)。非少数民族员工的薪水高于少数民族员工,beta=.

30、12,其效应是显著的(t466= 3.75, p 0.0005)。年龄对薪水的影响不显著描述统计在前. 推论统计在后。先报告实际情况,后报告显著性检验: R2adj 在F 考验前, beta 在t 检验前 F 和 t 值 的自由度必须报告。增益R2的意义:研究举例 一位研究者欲说明预测管理人员的绩效,除能力倾向,学历,经验外,人格还起额外的作用。他作层次回归来解决这个问题第一层:能力倾向,学历,经验- R2 =51%第二层:人格- R2 change=6%6. 一个探索性路径分析的研究实例根据研究结果,大学生精神症状与自尊,社会支持和年级有关,而自尊水平可由社会支持和年级预测。计算社会支持和年

31、级对大学生精神症状的效应,自尊水平作为一个中介变量回归分析的结果调节变量和中介变量自变量因变量中介变量自变量因变量调节变量280 articles76 (27%)tested for mediation99 (35%)tested formoderation19mentioned the moderator implied a mediator. Incidence of tests of mediation and moderation in the Journal of Applied Psychology (volumes 84-86). 调节变量的定义(moderating effec

32、t)如果变量Y和变量X之间的关系是变量M的函数,则M称为调节变量调节变量可以是定性的(如性别,种族等)也可以是定量的(如年龄,刺激次数等)它影响因变量和自变量关系的方向和强弱.研究情境也称为边际条件 “boundary condition.”基于上述发现:不一致的发现.阻碍的条件.促进的条件.调节变量的例子(1)上级支持绩效高亲和需要员工低亲和需要员工调节变量的例子(2)Job satisfactionproactiveHigh HarmonyLow Harmony调节变量的例子(3)JobSatJobSatSalarySalaryPoliceStock Brokers调节变量亦即交互作用在模

33、型中有特殊的表达方法X1YMod如何检验调节效应: 取决于变量的类型如果自变量是二分变量,调节变量也是二分变量2x2 ANOVA二分变量的调节效应例:奖励食物数量影响动物的作业水平,内驱力是调节变量自变量或调节变量是连续变量比较复杂必须假定没有测量误差 效力较低必须有较大的样本容量不要将连续变量分成二分变量有些做法从均值或中数分成2组,这样作降低了检验的效力连续变量的调节效应中心化或标准化自变量和调节变量中心化为了降低共线性标准化容易用SPSS 程序计算连续变量的调节效应用两变量的乘积作为交互作用项在SPSS中建立一个新变量进行层次化多元回归第一层: 主效应第二层: 加入交互作用项解释结果因为

34、作了中心化,所以主效应是另一个变量在平均水平时的主效应解释显著的交互作用交互作用是否显著看加入交互作用项后的 R-squared change 如果交互作用显著,接下来做什么?绘制高低组的回归图1 SD 高于和低于均值一个例子Social supportJobSatHigh AffLow Aff连续变量的调节效应的完整程序标准化自变量和调节变量建立交互作用变量层次化多元回归绘制和解释交互作用项中介变量的定义(mediating effect)考虑自变量X 对因变量Y的影响,如果X 通过影响变量M 来影响Y,则称M 为中介变量。中介变量的意义是解释自变量对因变量的影响机制在模型中有特殊的表达方法

35、X1MedY研究情境当X 和Y 的关系给定后,目的是了解”为什么”的机制.递进的因果关系Y MXabcYXcc: X 和 Y的直接关系a: X和中介变量的关系b: 中介变量和Y的关系c: 当中介变量在方程中时X 和Y的关系分析过程要注意的问题整个模型的效力中介变量的信度这些问题都可以通过结构方程模型有效地解决传统方法如何检验中介作用考察自变量和因变量间的关系相关或回归求出“c”将自变量(IV) 向中介变量(DV)回归标准化系数 B 就是 “a”如何检验中介作用进行层次化回归 第一层: 放入 X第二层: 放入中介变量(得到 b)变量X的 降低的数量(c) 就是中介作用的大小完全中介, 变为 0

36、(n.s.)部分中介, 显著减小完全中介如果变量X对Y的作用完全被中介变量M引起的a和b路径所分解, 则称如果变量X对Y的作用被变量M完全中介.c0, c=0部分中介如果变量X对Y的作用完全被中介变量M引起的a和b路径显著, 而X至Y的路径仍显著,则称如果变量X对Y的作用被变量M部分中介.c0, c 0测量间接效应间接效应即中介作用的大小完全中介或部分中介 间接效应=(c - c)理论上, c - c = a*b但是,这些对于证实中介作用是不够的,需要有一个统计检验. 测量间接效应XYMXYcabc间接效应= a b 如果 a b = c, 完全中介模型如果 a b c, 抑制模型中介作用的S

37、obel 检验MacKinnon et al (2002)Sobel的计算:/statcalc/calc31.aspx依次检验方法的局限Journal of Personality and Social Psychology“Attitudes and Social Cognition”板块的主编Smith(2012)在今年第一期的主编评论(Editorial)中指出,基于旧有的Baron和Kenny(1986)的中介分析方法已经过时,建议投稿者使用新的更准确的、具有更强检验力的方法。依次检验方法的局限总体作用显著并不是中介作用显著的必要条件;我们只要直接检验间接作用即可发现是否有中介作用。研

38、究者按照Baron和Kenny因果步骤,会因为总体作用c不显著而停止余下的检验,可能错失发现间接作用 显著的机会Baron和Kenny的方法需要a和b都要显著,而直接检验间接作用 的中介分析(比如Sobel检验)却只需a和b的乘积显著即可。显然,拒绝两个虚无假设要比拒绝一个要困难。虽然Sobel检验直接检验间接作用a和b的乘积,但是这种方法建立在a和b乘积正态分布的假设基础上,而这种假设一般是不成立的。并且与重复取样的自抽样程序相比,Sobel检验的效力要低基于自抽样程序的中介效应检验所谓自抽样程序(bootsrap),是以样本(如,样本大小n=100)来代表总体,在此样本中进行放回抽样(已被

39、抽取的个体允许被再度抽取),直至抽取n个(如100个),组成一个样本。这样的程序反复进行多次(k次),亦即产生多个样本,每个样本都可以算出一个间接作用估计值,由此可以算出k个值,形成一个实际的分布。这个分布近似于从原始总体中取样的分布。一般建议最少抽样1000次(亦即k=1000),推荐抽样5000次 (Preacher & Hayes, 2008)。中介作用真值的统计推论根据这k个估计值产生的ci%置信区间得到。如果置信区间不包括0,那么中介作用显著,支持中介作用的假设;如果包括0,则不显著,不支持中介作用的假设一个中介变量的研究实例根据研究结果,大学生抑郁症状与消极应对有关,而消极应对可由

40、应激源预测。计算应激源对大学生抑郁症状的效应,消极应对作为一个中介变量中介模型DEPCOPSTR0.220.2800.296DEPSTR.358调节变量和中介变量的比较更复杂的模型(1)有中介的调节模型: A moderating effect is transmitted through a mediator variable (Baron & Kenny, 1986)X1MedYModX1MedYModX1MedYGroup 1 High ModX1MedYGroup 2 Low Mod自变量X调节变量U交互项UX中介变量M因变量YY=c+X+M+U+UX+M=c+X+U+UX+自变量X因

41、变量Y中介变量M调节变量U带中介的调节模型更复杂的模型(2)有调节的中介模型: A mediating effect is through to be moderated by some variable (Baron & Kenny, 1986)X1MedYMod自变量X调节变量U交互项UM中介变量M因变量YY=c+X+M+U+UX+M=c+X+自变量X因变量Y中介变量M调节变量U带调节的中介模型MANOVA and ANCOVA(Multivariate Analysis Of Variance and Analysis of Covariance)142ANOVA的复习143CBTNo

42、treatmentAnxiety AssessmentDrugs课程目标介绍 MANOVA 模型 ANOVA 加上更多的DV介绍 ANCOVA模型 - ANOVA加上协变量介绍 MANCOVA 的前提144Multivariate Analysis of Variance (MANOVA)145ANOVA vs MANOVA在所有的情况中, ANOVA 只有 1 个DV (ANOVA 也称为单变量检验(univariate tests)当我们有多于1个相关的因变量时,我们就需要做MANOVAMANOVA 可以是 one-way, two-way, between-groups, repeate

43、d measures 或 mixed146研究情境一位研究者想比较奥运的志愿者和非志愿者大学生及献血与未献血的大学生有什么区别.他想就以下方面进行比较: 对志愿者的态度,对志愿者的情感, 作志愿者的倾向性这3个变量概念上是相关的.147如何寻找适宜的检验方法?我们可以用分别用每一个因变量作3个ANOVA (或 independent t-test)这意味着作3 次检验 但是,每一次作检验我们都冒I类错误的风险148解决的方法作1次显著性检验评价各组在所有因变量上的差异这就是 multivariate testMANOVA则是考察类目型自变量在多个等距因变量的某种线性组合 (centroid )

44、 的组均值差异,其组合原则是使组的差异或交互作用最大第一个组合是使志愿者和非志愿者的差别最大第二个组合是使献血与未献血者的差别最大第三个组合是使志愿者组与献血组交互作用单元格的区分最大149例子一位研究者想比较奥运的志愿者和非志愿者大学生有什么区别及献血与未献血的大学生有什么区别他想就以下方面进行比较: 对志愿者的态度,对志愿者的情感, 作志愿者的倾向性这3个变量概念上是相关的.150151Two-Way Between-Groups MANOVAPillais Trace = 0.024; F(3,594) = 4.801, p = .003解释MANOVA 结果显示奥运的志愿者和非志愿者大

45、学生在以上3方面的因变量组合上有显著区别献血与未献血的大学生没有显著差异二者也没有交互作用在哪些因变量上有差别?Univariate tests153Univariate Tests解释在对志愿者的态度,对志愿者的情感奥运的志愿者和非志愿者大学生有显著区别但是,以前志愿者的倾向性对大学生作奥运志愿者无显著影响.影响的性质如何?155PlotPost Hoc Tests如果IV有2个以上水平, 需要作事后检验用 univariate ANOVA作事后检验157用哪一个统计量?158Wilks (W); Hotellings (H); Pillais (P); ; Roys (R) 转换成 F s

46、tatistic当 df=1 时F值都相同当 df1 通常显著性相同W, H , R 比P通常更有效力 , 而P 更有耐受性 (robust)交互作用一个自变量在复合因变量上的变化依赖于另一个自变量吗? 例: 给定3种治疗方法,是不是一种方法对男性有效而另一种方法对女性更有效?如果每个单位格样本数相等, 那么每一个交互作用与主效应独立,与其它交互作用也独立.159哪些 因变量是最重要的?如果存在任何主效应或交互作用,自变量的不同水平造成哪些 因变量最大的变化或差别?我们可以按照单变量检验中 F值的大小来确定一个因变量的重要性是最大,中等,最小,还是没有作用.160效应大小2, 可以大于1因为因

47、变量之间是相关的partial 2, 调整了高估的部分161协方差同质性Boxs M方差同质性Levenes Test162Mauchly test of sphericity163球形检验通过的条件为:MANOVA的优越性实验设计允许多个因变量指标防止I 类错误的膨胀在某种特定条件下效力会增强。164MANOVA的局限性很多情况下效力降低有更多的统计前提需满足有时解释困难165Repeated measures MANOVA166Repeated Measures MANOVA 的命令GLM aff_t1 aff_t2 aff_t3 att_t1 att_t2 att_t3 /WSFACTO

48、R = time 3 Polynomial /METHOD = SSTYPE(3) /EMMEANS = TABLES(time) COMPARE ADJ(BONFERRONI) /PRINT = ETASQ OPOWER /CRITERIA = ALPHA(.05) /WSDESIGN = time .167168169170GLM Repeated Measures 的基本结果输出Within Subjects Factors Mauchleys Test of SphericityTests of Within-Subjects EffectsTests of Within-Subjec

49、ts ContrastsTests of Between-Subjects EffectsMultivariate Tests171GLM Repeated Measures 的基本结果输出:Multivariate Tests172Mauchleys Test of Sphericity173Tests of Within-Subjects Effects174Mauchly test of sphericity如果该检验不显著, 那麽将n 个单个自由度的估计量加在一起来代表n 个自由度的总体估计就是恰当的如果该检验显著,即sphericity前提不能满足,averaged F-tests

50、就过高估计了联系的强度。有两个办法:忽略 averaged F-tests, 只报告 multivariate test of significance. 用 averaged F-tests 的校正公式. 如 Huynh-Feldt Epsilon175多变量结果 (Multivariate ANOVA Results) 四种多变量参数:Pillais Trace:合并效应方差Wilks Lambda:误差方差的合并比率/总方差Hotelings Trace:有效方差的合并比率/误差方差Roys Largest Root: 只用第一个维度,不考虑合并效应。如何选用?如果组的区别靠一个维度,W

51、ilks Lambda,Hotelings Trace更有效力如果组的区别分布在几个维度, Pillais Trace更有效力Pillais Trace 比较稳妥,适用于小样本,非均衡设计176解释显著的组内差异: 事后检验用比较主效应Estimated Marginal Means Compare main effects 。注意所给出的比较是未校正过的Post Hoc. 对话框对检验组内差异不可用177178Analysis of Covariance (ANCOVA)179协变量(covariate)协变量是一个连续变量,在实验中没有操控,但却对因变量有着显著的影响.协变量必须与因变量有

52、显著相关 选择协变量的标准:使我们解释更多的组内方差,增加检验的效力使我们去除混淆变量的影响造成的偏差180ANOVA181是否奥运志愿者志愿者倾向曾否献血ANCOVA182是否奥运志愿者志愿者倾向外向性曾否献血ANOVA Result183ANCOVA Result184前后测设计当随机化不能实现的时候, 组间的基线可能是不等的这些前测的差异可能成为混淆变量解决: 将前测分数当作协变量,这样就消除了基线的差异185MANOVA的前提条件186理论上的考量漂亮的统计不能弥补设计的缺陷因变量的选择要特别谨慎,高度相关的因变量会显著削弱分析的效力187被试数目和效力每个单位格中的被试数目应大于因变

53、量数目 如果任何一个单位格中的被试数目小于因变量数目,单位格就成为奇单位(singular)而不可能进行倒数运算.如果被试数目/因变量数目比值很低, 那么协方差同质的前提很有可能被拒绝.如果被试数目/因变量数目比值很低, 效力也会很低.188多元正态性假设各个因变量在各单位格的均值及其所有线性组合都正态分布.很难明确地表示出来.189多元正态性在单变量检验中,当df20, 且设计均衡时, 对多元正态性的违反是可以耐受的.如果在最小的单位格中,n20, 而设计不均衡,对多元正态性的违反还是可以耐受的.如果被试少,且设计不均衡,多元正态性的假定一般不能满足190没有 outlier需要在每一个单位

54、格中识别univariate & multivariate outliers191线性关系MANOVA 和 MANCOVA 假定所有因变量,所有 协变量和所有因变量/协变量对之间的线性关系.线性关系的偏离降低统计的效力因为:因变量线性组合不会使组间的差别最大化.协变量不能最大限度地调整误差.192协方差矩阵的同质性(Homogeneity of Covariance Matrices)假定设计中的每一个单位格都是从同一总体中抽取的以利于它们合理地合并在一起, 形成误差项.如果样本容量是均等的, MANOVA 对违反协方差矩阵的同质性具有耐受性,所以这种情形下Boxs M test 可以忽略.1

55、93协方差矩阵的同质性(Homogeneity of Covariance Matrices)如果样本容量不等, 按照 alpha 1 的规则抽取直交旋转因素负载只显示.40的,整齐结构1.因素的抽取2. 因素个数的确定3. PCA结构矩阵所包含的信息4. 因素的命名5. 因素转轴6. 因素分析的统计假定7. 主成分分析和因素分析8. 探索性因素分析和验证性因素分析1.因素的抽取(factor extraction) 主成份分析法(principle component analysis)以线性方程式将所有变项加以合并,计算所有变项共同解释的变异量,该线性组合称为主要成份。第一次线性组合建立后

56、,计算出的第一个主成份估计,可以解释全体变异量的最大一部份。其所解释的变异量即属第一个主成份所有,分离后所剩余的变异量,经第二个的方程式的线性合并,再抽离出第二个主成份,依此类推,所剩余的共同变异越来越小,每一成份的解释量依次递减,直到无法抽取共同变异量为止。主成份分析法适用状况于单纯为简化大量变项为较少数的成份时,以及作为因素分析的预备工作。 主轴因素法(principal axis factors)分析变项间的共同变异量而非全体变异量。将相关矩阵中的对角线,由原来的1.0改用共同性(communalities)来取代。目的在抽出一系列互相独立的因素。第一个因素解释最多的原来变项间共同变异量

57、;第二个因素解释除去第一个因素解释后,剩余共同变异量的最大变异;其余因素依序解释剩余的变异量中最大部分。直到所有的共同变异被分割完毕为止。最小平方法(least squares method)利用最小差距原理,针对特定个数的因素,计算出一个因素型态矩阵(factor pattern matrix)后,使原始相关矩阵与新的因素负荷量矩阵系数相减平方后数值最小,称为未加权最小平方法(unweighted least squares method),表示所抽离的因素与原始相关模式最接近。 最大似然法(maximum-likelihood method)相关系数经变项的残差(uniqueness)加权

58、后,利用参数估计(paratemer estimation)原理,估计出最可能出现的相关矩阵的方法。主成分分析 (PCA) 与 主因素分析 (PFA)的适用条件目的方面:PCA用于分类; PFA用于探讨结构PCA解释一组变量的总方差 (独特方差+共同方差 )可用于对一组变量进行分类是最常用的因素分析选择。PFA解释一组变量的共同方差(独特方差被设定为0)可用于确定一组变量的维度如量表中的一组题目特别是用于检验一个 因素 能否解释一组变量的共同方差缺点是有时会得到负的特征值, 是无意义的. 因素分析中的共同方差,独特方差和误差方差2.因素个数的确定因素个数的确定是探索性因素分析中的一个非常重要的

59、决定,因为一旦因素个数确定模型的拟合度也就确定了,不随以后因素的旋转而改变 。Kaiser 法特征值代某一因素可解释的总变异量,特征值越大,代表该因素的解释力越强。特征值以1为标准。低于1的特征值,代表该因素的变异数少于单一一个变项的变异数1,无法以因素的形式存在。常常导致抽取因素过多碎石图(scree test)法其方法是将每一个因素,依其特征值排列,特征值逐渐递减当因素的特征值逐渐接近,没有变化之时,代表特殊的因素已无法被抽离出来当特征值急遽增加之时,即代表有重要因素出现,也就是特征值曲线变陡之时,即是决定因素个数之时。 碎石图 543210#PCs12345最大似然法的模型拟合度由因素个

60、数从多到少考察最大似然法的模型拟合度当拟合度由不显著变为显著时,此时的因素数目即合适的因素抽取个数因素所能解释方差的百分比所有因素所能解释方差的累计百分比应超过40%。Browne 提出了以下的程序考虑研究者在理论中是否事先假设了因素个数考虑一些简单方法如Kaiser 法,Scree Test 所提供的信息考虑由最大似然法所产生的模型拟合度的信息根据以上三方面的信息将可能的因素个数压缩到一个比较小的范围内根据4 分别抽取不同个数的因素比较旋转后因素负荷的可解释性以作出最终决定这是一个相对比较全面的程序。研究者可以批判性地采用总之因素个数的确定并不存在着唯一 正确 客观的答案3. PCA结构矩阵

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论