心理学考研大纲解析-心理统计_第1页
心理学考研大纲解析-心理统计_第2页
心理学考研大纲解析-心理统计_第3页
心理学考研大纲解析-心理统计_第4页
心理学考研大纲解析-心理统计_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

考研考业傭大綱解析図理統计学心理统计大纲解析ー、描述统计心理统计中常见的基本概念厶变赍及其种类(1)变量变冨!又称随机变量,即不断变化的,可取不同值的量。如实验中出现的自变量、因变量与额外变量(2)变量与数据的区别心理统计学中,一旦对变量进行了观测,或者进行了取值,这个数值也就是这个变量的一个观测值,即随,ー个变量可以有无数多的数据值。(3)变量和数据的分类.根据变量性质的划分①名称变量:如性别、颜色等,也称类目变量,若属性只有两种结果,亦称二分名称变量。其所属数据是计数数据,即各类属的数量。②顺序变量:按事物的某ー属性的大小或多少按顺序排列起来的数据,相邻两个等级的间隔是不等距的,只有等级上的差别,无单位又无绝对〇点。③等距变量:这类数据只有相等的单位,而无绝対〇点,如测验分数、温度等。④比率变量:又称等比变量,是ー种既有相等单位,又有绝对零点的变量,如距离、时间、人的身高、体重等。后三种变量的数据都是用一定的测量工具或测量标准测量时所获得的数据,统称度量数据.根据变量的连续性划分①连续变量:即可无限划分的变量,如长度可划分为千米、米、厘米、微米等②离散变量:指测量单位间不能再细分的数据,常取整数,如名称变量.根据变量间的关系划分:即自变量、因变量与额外变量的划分2統计ネ得初步厠利是指具有某些共同的,可观测特征的ー类事物的全体恒是构成总体的基本单位或单元,又称元素或个案因困即从总体中抽出的一部分个体,一般30以上的样本称大样本,30一下的称小样本惨面是总体的特征量数,一般只是理论假设时存在,实际无法测量,如ド(总体平均数)、0(总体标准差)、p(总体相关系数)等国计国则是直接从样本计算出的量数,代表的是样本的特征,如M(样本平均数)、S(样本标准差)、r(样本相关系数)等(-)统计图表统计表和统计图都是对数据进行初步整理,以简化的形式加以表现的两种最简单的方式。在制定统计图表之前,一般首先要对数据进行以下两种初步整理:(1)数据排序:按照某种标准,对收集到的杂乱无章的数据按照一定顺序标准进行排列,其具体方法一般有如下三种:①顺序分布法:将数据按大小排列,后用频数f表示相同数据的出现次数②等级分布法:先按顺序排列数据,后以事物本身的性质标上相应的等级R,若有重复等级时,应在划分等级时根据其实际的排序位置求平均等级③次数分布法(2)统计分组:根据被研究对象的特征,将所得到数据划分到各个组别中去刀統計囹统计图I:用点、线、面的位置、升降或大小来表达统计资料数量关系的ー种陈列形式组成:坐标轴、图号、图题、图目、图尺、图形、图例、图注图形的种类:直条图(条形闇)和圆形图(饼图)都是用于绘制离散型数据的统计图次数多边形图(线性图)与直方图是用于绘制连续型数据的统计图散点图则是用于表示对事物相互关系的统计图此外还冇茎叶图、测量中用来,示结果的剖面图等2统計表统计表I:将要统计分析的事物或指标以表格的形式列出来,以代替烦琐文字描述的ー种表现形式组成:隔开线、表号、名称、标目、数字、表注分类:简单表、分组表、复合表次数分布表的编制过程与方法:(1)求全距(Range,R)人=x111ax-Xmin(2)定组数和组距经验法是根据经验将数据分为10〜20组,其中10〜15组为最佳,组距一般选择2、3、4、5、10等当数据来自于ー个正态分布的总体时,可以用计算法:k=1.87(N-l)§;i=%或i=("十%;其中i为组距,k为组数(3)定组限邈!是指每ー组的起止点表达界限:即根据第二步人为确定的上下限精确界限:上限or下限分别+/-0.5(或0.05、0.005)所得的界限(4)登记与汇总即写出各组频数f与总数Ef(-)集中量数集中量数|即表示集中趋势的ー种参数或统计量,反映的是频数分布中大量数据向某一点集中的情况。ハ算木牛的報(1)定义算数平均数[:即所有观察值的总和与总频数之商,简称为平均数或均数。レX=-^—N(2)特点①在一组数据中每个变量与平均数之差的总和等于零:2(X-X)=0②在ー组数据中,每ー个数都加上一个常数C,所得的平均数为原来的平均数加常数C:-Z(X.+C)=X+C③在ー组数据中,每一个数都乘以ー个常数C,所得的平均数为原来的平均数乘以常数C:-s(x,c)=xc(3)意义算数平均数是应用最普遍的ー种集中量数,它在大多情况ド是真值最好的估计值。2ナ超(1)定义:画:按顺序排列在ー起的一组数据中居于中间位置的数,在这组数据中,有一半数据比它大,ー半数据比它小,以Md或Mdn表示。(2)算法:①数列总个数为奇数时,第(N+D/2个数就是中数②数列总个数为偶数时,可取位于中间的两个数的平均数作为中数③分布中有相等的数时,将重复的数字看成一个连续体,利用中间分数的精确上下限使用插值法注:冇相等数数列的中数计算:不容易,要自已好好摸索,我通常是釆取如下方法:总个数为奇时取第(N+D/2个数的组中值:总个数为偶时取第N/2个数的精确I:限与第(N+D/2个数的精确ド限的均值3.众扱众数:在次数分布中出现次数最多的那个数的数值,以Mo表示。众数可能不只一个。均数、中数、众数的关系与应用比较:(1)关系当数据分布呈正态时:M=Mdn=Mo呈偏态分布时,众数位于峰值最高点上,中数位于均值与众数之间,且有Mo=3Mdn-2M即正偏态分布时Mo<Mdn<M:负偏态分布时M<Mdn<Mo(2)比较与应用ー个优良集中量应具备以下六个条件:I,感应灵敏;2.严密确定;3.意义简明;4.容易计算:5.适合代数法则处理以便进ー步运算:6.受抽样变动的影响较小。三种集中量数的比较:平均数中数众数优点.符合优良集中量:的仝部要求.便于加权处理.统计推断结果更可靠稳定.符合优良集中量的2346条要求.少受极端值影响1.符合优良集屮量的第3条要求应用.加权平均数.离差、相关计算,进行统计推断等.用于等距、等比数据.数列中有极端数值时.测量单位的性质不确定时.上下端距离不确定时.采用百分体制时.用于顺序量表1.粗略估计时2,出现多峰分布时不足.易受极端值影响.组距不确定时无法计算.易受抽样偏差影响.不适合代数运算补充:其他集中量数(1)几何平均数Mr=>lXl'X2主要用于:1.ー组数据中有少数数据偏大或偏小,多用于心理物理学的等距与等比量表中;2.ー组数据彼此间变异较大,且几乎是按ー定比例关系变化时。(2)调和平均数多用于描述速度方面的集中趋势(三)差异量数离差I:分布中的基点到均值得距离,其符号表示了某分数与均值之间的位置关系,而数值表示了它们之间的绝对距离。x=Xー〃ー数列中所有数的离差之和始终为零,因此不同数据间差异无法用离差来比较。TOg:次数分布中所有原始数据与平均数绝对离差的平均值。缺点:进行了绝对值处理,无法进行下ー步代数运算2方差与标港差由于离差正负值互相抵消无法代表离中趋势,我们引入和方的概念画I:每ー个离差值平方求和ss=£(ムー〃)2=シ;_Z・ス(〇总体的方差和标准差gg:每个数据与该组数据平均数之差乘方后的均值,即离均差平房后的均数作为样本统计量用符号べ表示,作为总体参数用符号『表示,也叫均方。2SS

=—

N标准差I:方差的平方根作为样本统计量用符号s表示,作为总体参数用符号0表示。(2)样本的方差和标准差样本的变异性往往比它来自的总体的变异性要小。为了校正样本数据带来的偏差,在计算样本方差时,我们用自由度来矫正样本误差,从而有利于对总体参数更好的无偏差估计:ペ宀

n-\方差、标准差的合成:s;=乙メS+ZM%^n其中d=(アアーアJ(3)性质①每ー个观测值都加一个相同的常数c之后,计算得到的标准差等于原来的标准差②每ー个观测值都乘以一个相同的常数c,所得到的标准差等于原标准差乘以这个常数(4)意义方差与标准差是表示一组数据离散程度的最好指标,它们是统计描述与统计推断分析中最常用的差异量数3.变异糸報当遇到下列情况时,不能用绝对差异量来比较不同样本的离散程度,而应当使用相対差异量数,最常用的就是变异系数。①两个或两个以上样本所使用的观测工具不同,所测的特质相同②两个或两个以上样本使用的是同种观测工具,所测的特质相同,但样本间水平芥异较大变异系数I:ー种最常用的相对差异量,为标准差对平均数的百分比cv=4xioo%使用变异系数时应注意:①所用数据应都是等比数据;②只能用于描述,不可进行统计推论。各种差异量数间的比较:方差与标准差全距平均差优点.感应灵敏.严密确定3,适合代数法则处理4,受抽样变动影响小.意义简明.计算简单.意义简明.计算简单.严密确定缺点.原理难理解,计算复杂.受极端值影响较大.极易受极端值影响.无法反映全部数据的差异情况.易受极端值影响.不适合代数运算应用.反映数据离散程度.进行推论统计和检验使用价值很小少用.用「判断数据可否舍弃.计算CV、Z和标准误(四)相对量数I.石令佐超百分位数[:在整个分布中,在某一值之下或等于该值的分数的百分比所对应的分数,实质上就是在某个百分位置上的数值。第p百分位数就是指,在某值为p的数据以下,包括分布中全部数据的飕。2节今昔做I百分等级I:常模团体中低于该分数的人所占总体的百分比:^=ioo-1QO/?~50 N其中R为某一原始分数在按大小排列的数列中的名次百分等级的应用:1.建立百分等级常模:2.衡量考绩的优劣:3.比较群体间成绩的优劣。3.希苑今惑.(1)定义标准分数I:以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数,也叫Z分数,表示原始分数在平均数以上或以下几个标准差的位置。Z-X1S(2)性质①Z分数无实际单位,是以平均数为参照点,以标准差为単位的一个相对量②组原始分数转换得到的Z分数可正可负,其分布形状与为转换前的原始分布相同③原始数据的Z分数分布标准差均为1④若原始分数呈正态分布,则转换得到的均值为0I标准差为1的标准正态分布(3)应用①比较不同测量单位时变量值的相对位置②计算不同质的观测值得总合或平均值,以表示在团体中的相对位置③异常值的取舍(通常在ー个正态分布中,若一个数据的取值落在土3°之外,则在整理数据时可将此数据作为异常值舍弃)学习时需要记忆几个经典Z分数及其对应的百分比值:1S=34.14%;2s=47.72%;3s=49.875%;1.64S=45%;1.96S=47.5%;2.33S=49%:2.58S=49.5%(4)导出分数导出分数梗是为克服Z分数的某些不足而对其进行线性变换所得的分数,其转换形式为Z=aZ+b,转换后分布均值为b,标准差为a。儿种常见的导出分数:正态化标准分数:T=10Z+50注:分数分布的转换有两种,一种是正态化转换,即根据原始分数计算出百分等级,再查正态分布表得到每个数据的P值,由此将整个分布转换为正态分布,这是ー种非线性转换:另ー种即是由Z分数经公式直接转换为T分数,这就是线性转换了,若不经正态化,其分数分布仍与原始分数的分布形态一致。ー组非正态数据若要转换为正态化标准分数,则同时需要以上两步转换过程。韦氏成人智力量表:IQ=15Z+100 比奈一西蒙量表:ZL16Z+100(五)相关量数由于实验・法适用范围的限制•有的时候我们只能对变量间进行相关研究,也就是看两者是杳有互相跟随的变化关系。相关研究所得到的是ー种描述统计,我们仅仅姐用其描述两个变更互相跟随的程度大小,至于他们之间是否有因果关系或者是共交关寐则不可・妄下定论。相关系魏两列变量间相关程度的数字表现形式作为样本的统计量用r表示,作为总体参数一般用p表示。正相关:两列变量变动方向相同负相关:两列变量中有一列变量变动时,另一列变量呈现出与前一列变量方向相反的变动零相关:两列变量之间没有关系,各自按照自己的规律或无规律变化测定系数I:相关系数的平方,用以说明两列变量的变异中一方能由另一方解释的程度。如两组数据间相关为0.8,那么我们可以说当以A来预测B的变化趋势时,64%是正确的。使用相关系数时应注意:①相关系数受样本量n影响,n最好不小于30;②相关系数不是等距数据;③计算相关要求成对数据:④相关可能是线性也可能是非线性。刀积麦相关积差相关是直线相天中最基本的方法,山英国统计学家提出,因此也叫Pearson相关,用"表示,廿宀匡口 X和共同变化的程度和的第方差其头ゆ是:r= = 'ワX和各自变化的程度和設自的方差(1)使用前提①数据要成对出现,即若干个体中每个个体都有两种不同的观测值,且每对数据与其它对相互独立②两列变量各自总体的分布都是正态的,至少接近正态③两个相关的变量是连续变量,也即两列数据都是测量数据④两列变量之间的关系应是直线性的(2)公式ぐジ£ド一一SP "ーセヤ 殍よ^SSxSSy»£ぐはX)ー归2(ZりN2塔秋相关等级相关是根据等级资料来研究变量间相互关系的方法,按因变量个数的多少分为用于分析两列量的斯皮尔曼相关和用于分析多列变量的肯德尔等级相关(1)适用范围①当研究考察的变量为称名数据或顺序数据时②虽是等距或等比数据,但总体分布不是正态,或者两者间关系不是线性时(2)公式:将原始数据转化为顺序型数据,后用Pearson相关公式或以下公式计算6\D2r=\4—" N(N-1)其中D为同一个体的X和丫各自排序后的等级差,N为成对等级变量的对子数3.3德尔等無相糸(1)肯德尔W系数也叫肝德尔和谐肅,原始数据资料的获得一般采用等级评定法,即让K个被试对N件事物进行等级评定,或同一个人先后K次评定N个事物。其原理是以评价者评价的一致性除以最大变异可能性。Ri!评价对象获得的K个等级之和 N:等级评定的对象的数目 K:等级评定者的数目。(2)肯德尔U系数与肯德尔W系数所处理的问题相同,但评价者采用对偶比较法,即将N件事物两两配对,即配成N(N+l)/2对,分别对每对中两事物进行比较,优者记1,劣者记〇,最后整理所有评价者的结果。ご(ムー⑵丄]

N(〃ー1>K(K-1)用为对偶比较记录表中i>j格中的择优分数。注:U系数的取值范围在。〜1之间,为1时,意味着评分者的意见完全一致;当U为--(奇K数)或一一—(偶数)时,意味着评分者意见完全相反,而U取值的正负并不表示一致的方向。,豈二列相关S二列相关(1)点二列相关适用于一列数据为正态等距变量,另一列为离散型二分变量的情况,可用于计算二分计分题目的区分度。v。是与二分称名变量的一个值对应的连续变量的平均数Y“是与二分称名变量的另ー个值对应的连续变量的平均数P与q是二分称名变量两个值各自所占的比率,st是连续变量的标准差(2)二列相关适用于两列变量都是正态等距变量,但其中一列变量被人为地分成两类。„.尤ー兄pq

rh チyy为标准正态曲线中p值对应的高度,查正态分布表能得到5中粕关适用于两个变量都是二分变量的情况,不论是真正的二分变量还是人为的分为两类。ad-be

r— ^J(a+b)(a+c)(b+d)(c+d)其中a、b、c、d分别为四格表中左上、右上、左下、右下的数据(详见卡方检验一章)补充:r的取值范围为ーl〈rく1,一般认为〇〜±0.40为低度相关;±0.4〇〜±0.70为中度相关:±0.7〇〜±1.00为高度相关对事物关系的解释和说明并非纯粹依据所计算出的相关系数来进行,因此在解释相关关系时应谨慎对待:首先,要从逻辑上判断事物之间是否真正存在关系;其次,要注意随着样本容量的增大,达到相关显著的相关系数数值会变得越来越小:此外,还应注意要在一定的时空范围内解释相关系数。(若样本量足够大,无论什么样的两组数据间都必定会出现相关显著,故应用时应考虑清楚)二、推断统计(-)推断统计的数学基础厶犍率(1)事件与概率事件是ー种数学语言,通俗地说就是事情或现象。大致分为确定事件、模糊事件和随机事件三类。随机事件|虽然在每次试验中可能发生也可能不发生,但是当试验次数很大时又会表现出统计的规律性。ー种随机事件的发生次数与总试验次数的比值就成为睡,而概率[则是随机事件在试验中发生可能性的程度或可能性的大小,以P表示,概率的定义有统计定义和古典定义之分。概率的统计定义是指通过实除试验所得频率来计算的概率,由于它是由实际经验得到的,又称经验概率;而根据问题本身所具有的理论特点直接计算的概率,则是概率的古典定义,又称先验概率。小概率事件|是指在ー次试验中发生的可能性极小,但在大量重复试验下终究会发生的事件,一般认为概率小于或等于。.05的随机事件为小概率事件。(此概念是区间估计与假设检验的基础)(2)概率分布及其类型经验分布是根据观察或试验所获得的数据而编制的次数分布或相对频率分布,它往往是一个总体的样本,故又称样本分布;理论分布或指数学模型,或指按某种数学模型计算出的总体的资料分布,故又称总体分布。2正态台布(1)正态分布与标准正态分布正态分布|就是中间量数次数分布多,两端分布少,呈对称型的概率分布。其中,平均数日和标准差。决定着曲线的位置和形状:。越大,曲线越是“低阔”;◎越小,曲线越是“高窄。标准正态分布恻是。为1,n为〇的正态分布。(2)特点①正态曲线的形状就像一口挂钟,呈对称分布,其均值、中数、众数实际上对应于同ー个数值。②大部分的原始分数都集中分布在均值附近,极端值相对而言比较少。③曲线两端向靠近横轴处不断延伸,但始终不会与横轴向交。④正态分布曲线转化为z分数后人以z分数与零点对应曲线下面积固定。(3)用法①依据Z分数求概率,即已知标准分数求面积。②从概率求Z分数,即从面积求标准分数值。③已知概率或Z值,求概率密度,即正态曲线的高。3,二项今布二项分布I:对于ー个事件有两种可能A和B,但我们对这ー事件观察n次,事件A发生的总次数的概率分布就是二项分布(是ー个离散型分布)性质:①当p=q=n时,不论n的大小如何,二项分布曲线都是对称的;②pWq,且n相当小时,图形显偏态;③当n相当大(n230)时,二项分布曲线会逐渐接近正态分布(计算上可以简化为p<q且np25或p>q且nq25时,二项分布接近正态分布)。二项分布的均值为ル=卩〃方差公式为メ=何 标准差的公式为び=イ法4I台布ー、抽样分布理论及其定理注意:此标题下各概念都极其重要,是以后学习统计推论的理论基础(1)总体分布、样本分布与抽样分布总体分布ト总体内个体数值的频率分布样本分布I:总体中一部分个体数值的频数分布抽样分布I:总体中可抽取的所有可能的特定容量分布的统辻量所形成的分布(就是说如果我们从总体里面进行很多次抽样,每次抽样都能得到ー・个分布,那么所有的每ー个这样的分布的均值凑在ー块也会构成一个高低错落有致的分布,这就是抽样分布。其他统计量如方差、相关系数等亦是如此)(2)几个重要概念

①随机样本:即从总体中经随机抽取所得的样本②馳样误差I:以样本均值为例,则是样本均值ア与总体均值ル间的差异。其取值范围为:〃-Z().o%'SEヌ最大允许抽样慑翦是评价抽样结果精确度的一个指标,用d表示,通常为:d=1.96S4。③|标准误卜由于抽样研究中存在抽样误差,需要估计其大小,而所用的量SE.便是抽样分布的标准差,称为标准误,可用SE或びマ表示。标准误越小,说明样本对总体的代表性越好。同样以样本均值为例,びえ便等于マ与〃间的标准距离。④自由度(Degreeoffreedom):用df或バ表示,是ー组数据中可以独立自由变动的数目。(这个概念我们放到实验中来理解可能更清晰些,例如有一个实验要我们分配4名被试,那么我们在分配前3名被试时,他们的位置都可以是自由的,比如第一位被试可以放在1234任何ー个位置上,但最后一名被试则是没得选择,只能放在最后那个位置,因此他是“不自由”的,于是自由度便等于nT了。自由度的计算中,n是原有的样本容量,而减去的则是受限制的数目,此处乍看好像是最后一名被试受到限制了,但实际上是全体被试受到了可分配数目的限制,也就是说自由度总是受到ー些参数或统计量的限制,涉及的参数或统计量越多,往往可以自由变动的数目,也就越少)(3)中心极限定律7n(我不知道这公式怎么来的,有兴趣的同学可以询问高人或查阅其他统计资料)7n由此uj得以ド定律:大数定律):样本容量n越大,标准误越小;总体方差越大,标准误就越大中心极限定律I:对于任何均值为〃,标准差为び的总体,样本容量为n的样本均值分布,会随着n趋近无穷大时趋近均值为〃,标准差为ワ/厂的正态分布。(2)常用抽样分布常用的抽样分布包括正态及渐进正态分布(样本平均数分布)、t分布、卡方分布、F分布等<一>t分布t分布I(学生氏分布)是由小样本统计量形成的概率分布,其分布形态与方差无关而与自由度有关,很类似正态分布,我们可以将正态分布看作t分布当自由度为正无穷时的特例。统计定义:若一样本X为标准正态分布,另ー样本Y为自由度为n的卡方分布,则随机变量・=—,服从自由度为n-1的t分布。师总体分布为正态,方差未知时,样本平均数的分布为t分布:特点:①对称,均值为0;②形状随自由度改变,是一簇曲线;③理论上n趋于无用时,t分布以标准正态曲线为极限;n逐渐减少时,分布离散程度变大,其峰顶逐渐下降,尾部抬高®t分布t值均有对应的p值。应用:①总体正态,总体方差未知,目.n<30时,样本均值分布呈t分布;②总体呈非正态,总体方差未知,n〉30时,样本均值分布呈t分布或渐进正态分布;③总体方差未知时,两样本均值之差的分布、样本相关系数的分布、回归系数的分布在一定条件下也服从t分布。<->£分布1分布|的构造是从ー个服从正态分布的总体中每次抽去n个随机变量,计算其平方和之后标准化的ー个分布。统计定义:几个相互独立的,均服从正态分布的随机变量的セ方烈的分布。特点:①正偏态,自由度趋近无穷大时,f分布为正态分布;②具有可加性(工力ユ是一个服从カ"=力i+ガZ+ +/的ピ分布;③イ值都是正值④ガ>2时,/分布平均数ルズ=^ガ,方差b:=2/":@%2分布是连续性分布,但有些离散性分布也服从X2分布。应用:计数数据的假设检验,样本方差与总体方差的一致性检验等。うア台布如果有两个正态分布的总体,我们从其中各自取出两个样本,各自计算出ド,贝リ:统计定义:设有两个总体X、Y,分布符合自由度分别为,和!?的/分布,且x与YV/〃相互独立,则随机变量ド=一・服从第一自由度为ド,第二自由度为ピ的F分布y/〃2将/公式代入以上定义式,分析可知F比率其实为样本方差各除以其总体方差的比率,而如果我们所计算的F两样本取自相同总体,即of=b;,则上式可化简为:特点:①正偏态,随若与明的增大而趋向正态分布;②F总为正值;③当分子自由度为1时,F值与分母自由度相同t值(双侧)的平方相等,即F=④ -2.58xS/W<び<Sn_.+2.58x3/应用:总体方差齐性检验、多组之间均值差异检验等6,并存ギ构叔今布样本平均数分布是ー种抽样分布,服从正态或渐进正态分布根据中心极限定律,样本平均数分布的平均数和方差与母体的平均数和方差有如下关系:①为=〃; ②③〃|之〃2应用于以下情形:.总体呈正态,总体方差已知,则样本均值分布呈正态分布:.总体呈非正态,总体方差已知,样本容量n足够大(n230),样本均值分布为渐进正态分布。样本的方差及标准差的分布也渐趋于正态分布,其分布的平均数与标准差和总体有如下关系:

a,兄=cr72nCTa,兄=cr72n.抽稗魚理易抽料方は(1)抽样原理抽取样本的基本原则是随机性原则,即在进行抽样时,总体中每个个体被抽选的概率应完全相等。由于随机抽样使每个个体有同等机会被抽取,因而有相当大的可能使样本保持和总体有相同的结构,或者说,具有最大的可能使总体的某些特征在样本中得以发现,从而保证由样本推论总体。(2)抽样方法<->概率抽样方法①简单随机取样法:对整个总体进行完全随机抽样,通常有抽签法与随机数字法两种缺点:1.总体很大时无法使用:2.常忽略总体已有信息,降低了样本代表性。②系统随机取样法(等距抽样):把总体中所有个体按一定顺序编号,后依固定间隔抽样缺点:1.若总体有周期性变化,则效果不好;2.也容易忽略已有信息。③分层随机取样法:根据需要将总体分层,再从各层中分别随机抽样,在每层中抽样数目可以是不同的,应适当考虑总体比例抽取,分层原则是层与层间变异越大越好。分层抽样最佳抽取人数计算:%=5或か其中m为所求该层应抽数目:n为样本容量:Ni为i层的总人数;N为总体人数:5为i层标准差;。为总体标准差。④多段随机取样法(整群抽样):先在第一层总体中抽取样本群体,再在抽得的各群体中进行随机抽样,适用于大规模调查。〈二〉非概率抽样方法方便抽样:随便抽,想怎么抽怎么抽;判断抽样:通过某些条件过滤后再抽。(二)参数估计厶堂佶孙、区间佶的易粽車篌|参数估计|就是根据样本统计量去估计相应总体的参数。(1)点估计国前是直接以样本统计量作为总体参数的估计值,良好点估计量有一定前提条件;1.无偏:即样本容量固定,统计量的分布的均值和被估计的参数相等;2,二致:指样本容量无限增多时,估计量趋于被估计参数(即所谓的数学期望);.直效:当总体参数的无偏估计量不只一个时,抽样分布方差小者较为有效;.充分:指一个容量为n的样本统计量不充分地反映了总体的信息。(2)区间估计由于我们永远无法排除抽样误差的存在,因此点估计不能提供正确估计的概率,因此就需要区间估计。|区间估计|是让据估计量以一定可靠程度推断总体参数所在的区间范围,它是用数轴上的一段距离来表示未知参数可能落入的范围。总体参数可能所在的这个范围便是置信区间,上下端点为置信界限。置信区间表明过了区间估计的准确性。估计总体参数落在某一区间时,可能犯错误的概率为|显著性水平],用a表示,1-a为置信園或冏量正!。置信度表明了区间估计的可靠性。区间估计的原理是样本分布理论。进行区间估计的计算及解释估计的正确概率时,依据的是该样本统计量的分布规律及其样本分布的标准误。分布提供概率解释,而标准误的大小决定了区间估计的长度。标准误越小,置信区间的长度就越短,估计就越准确,总体参数就越应该落入样本统计量所界定的区间中,而不落在其中的概率即为显著性水平a。置信度与置信区间长度有一代偿关系,即置信度越高,置信区间就越宽,反之,我们的估计要求越是精确,置信区间越窄,置信度就越小,正确估计的把握就越小。(3)估计的标准误标准洌:即样本平均数分布的标准差,其平方,即样本均值分布的方差,则称为变异误总体方差未知时用估算的总体方差计算标准误。ax=~T

7n参数估计的基本步骤:①分析条件,判断方法:②求标准误;③求置信区间;④结果解释。2总体ギ崎扱的佶计总体平均数的估计方法大致有三种,对比如下:正态法(Z)t分布法近似正态法(Z')条件0•2已知0"2未知总体正态,n不论大小:或总体非正态,n230总体不论正态与否,n230标准误a6又=〒\jnS寸不TS S叫=GTF求得置信区间ル二X±1.96。テ卩=X±2.58,びテ从=X±%T)〇,外〃=X土々〃T)0,01,〇又H-X±1.96•びマ卩=X±2.58-0,^・注:0•ユ未知,n<30时,必需用t分布法3根灌姜S方爰的区间佶计(1)总体方差的估计由于样本方差与总体方差之比的分布呈/分布,因此有:——<cr2<'2ノ<df=n-l)/% ム1-%(2)总体标准差的估计S根据抽样分布理论,n》30时,样本标准差分布近似正态分布,且SE式q)=*,v2n则有:在对标准差的总体进行估计时,可先对其方差进行估计(用イ),求得方差置信区间后,再开平方。(三)假设检验/.假祓检验的凍理(1)差异及差异显著性检脸当两个事物之间出现差异时,有可能是抽样误差,也有可能是实质性的差异,如果经过统计检验发现差异超过了统计学所规定的某ー误差限度时,则表示差异已经不属于抽样误差了,统计上将这样的情况称为差异显著,反之即是差异不显著。由于在进行差异检验时需要先对事物是否存在差异做出假设,再作统计检验,因此这ー过程便称为|假设检验|。(2)假设检验的统计学原理〈ー》假设与假设检验统计学中的假设一般专指统计学属于对总体参数所作的假定性说明。在进行任何ー项研究时,都需耍根据己有的经验和理论先对研究结果作出ー种预想的希望证实的假设。这种假设叫科学假设,记作H„又叫备择假设由于证实远比证伪困难,在统计学中,不对乩的真实性直接检验,需要建立与其对立的假设,成为|虚无假设I,记作H。。假设检验的问题就是要判断虚无假设是否正确,因此虚无假设就是统计推论的出发点。注意:备择假设总是要假设对比两者间是有差异的,例如单总体检验样本均值与总体均值是否有差异时,我们的备择假设就是ア’〃,对应备择假设,虚无假设总是假设两者并无差异,即表示为ア=ル。〈二〉显著性水平显著性水闸指的是拒绝虚无假设的小概率值,用a表示。也就是说,如果一件事情发生的概率小于我们设定的这么ー个显著性水平,我们就将其归为“小概率事件”,也就是认为它是一件“几乎不可能发生”的事件。く三〉小概率原理假设检验的基本思想是概率性质的反证法,基于统计学中广泛采用的小概率原理,该原理认为“小概率事件在一次实验中几乎是不可能发生的”,由此假设检验首先假定虚无假设为真,在虚无假设为真的前提下,若导致了违反常理或不合理的现象出现,则表明“虚无假设为真”的假定错误,必须拒绝虚无假设。而若没有,那就认为“虚无假设为真”是正确的,即要接受虚无假设。(3)差异显著性的检验方法〈ー〉双尾检验双尾检验的实际意义是值推断差异是否存在,而不断言差异的方向。其显著性水平标记为:a=0.05/2或a=0.01/2〈二〉单尾检验单尾检验是研究者根据已有的资料事先能够预料到谁优谁劣,检验只是为了进ー步确证而选择的方法。(即是说研究者已经不只能够判断出“有差异”,而且可以判断出“A比B好/优/大/快”的情况下所采用的方法)其中当预料到ー个总体参数大于另ー个总体参数时,采用右侧检验:而当预料到是小壬时,则采用左侧检验。单尾检验与双尾检验的区别在于:①问题的提法不同。双侧检验的提法是:ド与已知常数即是否有显著差异?单侧检验的提法是:卩是否显著地高于/低于已知常数即?②建立假设的形式不同。双侧检验的零假设和备择假设为:Ho:4H〃2;H>!从=〃2;单侧检验的零假设与备择假设为:Ho:〃階ル2;川:从〉〃2或Ho:从2也;H1:从<死。③否定域不同。如Z检验中双侧检验的否定域为Za/2;而单侧检验为Za。使用时一定要根据研究目的所规定的方向性来确定使用何种检验,若该用单侧检验的问题使用了双侧检验,其结果不仅可能使结论由''显著”变为“不显著”,还会增大P错误。反之用单侧检验代替了双侧检验,虽然缩小了B错误,但却使得无方向性的问题人为地变成单方向问题,有悖于研究目的。差异是否显著,是由观测值和临界值(如z值、t值等)相比获得的。观测值大于临界值,则结果在相应的显著性水平上是显著的。(4)统计决策的两类错误接受H()拒绝H()Ho为真正确决策I型(弃真、a)错误Ho为假II型(取伪、P)错误正确决策之前已经介绍过,a其实就是用来定义小概率事件的ー个概率值,在这里也就成了拒绝H()的概率,同时也就是会犯拒真错误的概率。如图,显著性水平a与犯II型错误的概率p间又存在密切关系:①减小了犯I型错误的风险,必定会增大犯H型错误的风险,反之亦然;②a+p不一定等于I,在其他条件不变的情况下,a与口不可能同时减小或增大;③可以通过增大样本容量和增大处理效应来同时减小两类错误。对于I型错误来说,可以通过控制显著性水平来减小犯错误的概率II型错误与I型错误不同,影响p值大小的因素主要有三:ー、在参数检验中,。依赖于参数的实际值与假设值之间的距离,两者相差越大,0越小;二、a越小,卩就越大;三、当a与n固定时,根据研究问题的性质选择适当的检验类型可以减少。。(详见统计效果量一章)(5)假设检验基本步骤①根据问题要求,提出虚无假设和备择假设②确定显著性水平,确定单尾还是双尾,确定自由度,查表求临界值③计算样本的实际观测值④比较样本实际分数与临界分数⑤对Ho作出结论⑥报告结果

(6)假设检验与参数估计的联系与区别假设检验是当样本统计量超过一定标准时,就说统计显著,是检验两事物差异是否显著的ー种方法;而参数估计是要找到总体值所可能落入的可靠范围,是利用样本统计量对总体参数所作的估计。而作为两者的代表性指标——显著性水平和置信水平也是从不同角度回答了相同的问题。2档洋号总休年崎扱爱异的检脸由于样本均值分布服从正态分布、t分布或者渐进正态分布,因此检验ア与"差异时,根据不同情况便有三种可选择的方法检验步骤:①确定单双尾②明确总体方差是否已知③分析总体分布是否正态④根据下表选择适当的检验方法检验方法总体情况标准误检验值Z检验正态ク〇・〇已知S0=夕y/nSE叉t检验CT(,未知SELgt ー出SE]7:检验非正态〇・〇已知se,=夕yjnフ、ーマー4〇且n230b:未知"S'SE云3两科存ヰ构扱差异的检险(1)检验逻辑与公式两个样本间的关系可以有如下两种:独立样本I:即两个互不相关的样本,往往来自不同总体,即是不同组别间相同性质的比较,如某校初三(1)班的语文成绩与初三(2)班的语文成绩。相关样本I:即两个样本间是存在某些联系的,往往来自同一个总体,即是同一个组内产生的两种不同类别的数据,例如初三(1)班学生的语文成绩与数学成绩。检验逻辑:用样本的均值估计总体均值,用相减后的值来作为两均值之差的分布的均值,由于这一分布在不同情况下符合正态分布、t分布或渐进正态分布,因此计算时也应根据不同情况慎重选择。是两样本平均数检验的通用公式,所不同的仅在于标准误的计

算。算。实际上标准误的计算公式也是相同的,即:"=产+ウ”。己,不同的只是两独立样本情况下,样本间数据相关r=0,于是公式出现了差异。下面分两种样本详述计算公式。(2)独立样本间平均数差异的检验①两总体方差已知,用Z检验:②两总体方差未知,且方差齐性,用独立样本t检验:使用条件:1.观察间彼此独立;2.两总体均为正态;3.两总体方差齐性(经齐性检验同质)。公 式 :SE_径S;_Iss,+SS21SS,+SS21_ln,S-+n2S2n,+n2DXマ〃]n2ydf}+df2为df}+df2n2n,+n2-2n,n2(df(df=勺+%—2)③当山和小都是大样本(大于等于30)时,不管方差是否齐性,都可用近似Z,检验:(3)相关样本间平均数差异的检验

①两总体方差已知,用Z检验:Z°bsxt-xZ°bsxt-x2aDX②两总体方差未知,用相关样本t检验:a.相关系数未知:—1にびか”為HW)”其中D为每ー对对应数据之差D-0Sb(df=nD-0Sb(df=n—1,n为对子数)S片口—型2b.相关系数已知:°V〃ー1 ,计算公式同上。,方专弄槌的检験(1)样本方差与总体方差当从正态分布的总体中随机抽取容量为n的样本时,其样本方差与总体方差比值服从弋分布:2nsV= -[由自由度ガM〃ー1查£表,依据显著性水平判断(2)多个总体间的方差齐性检验以方差最大的样本方差为分子除以方差最小的样本方差,所得比值与F表中临界值作比较S2maxぐ2»〃ー1(小)比值服从第一自由度为ガ大k〃-1,第二自由度为ガ小尸〃ー1的F分布,为单侧检验(F大于2时多半就不同质)。5相关糸扱的更著槌检险(1)积差相关①当p=0时①当p=0时:其中ガ=n-2②当时〇时:先通过査表将「和P转化为费舍乙和Zp然后进行Z检验。(2)点二列相关3ー尸时,ス在。。水yjn①3ー尸时,ス在。。水yjn②若n>50!则卜M〉ア时,rpb在0.05水平显著:卜>平显著(3)等级相关和肯德尔W系数在总体相关系数为零时:查各自的相关系数表,判定样本相关显著。

(四)方差分析乙方是今折的原理与泉冷过福(1)方差分析的含义与前提在科学研究中,实验涉及的变量越多,便越能接近于现实情况,进而作出更加可靠有效的解释和预测,因此单纯的单因素两水平间的对比一般不能满足研究人员的需要,而若运用用多个t检验来检验多个水平间均值的差异时,相当于从t分布中随机抽取了多个t值,这样落在临界范围之外的可能将大大增加,犯I型错误的机会也就大大增加。避九责就是对多个平均数进行比较的ー种统计方法,又称变异数分析,即ANOVA。它既避免了增加犯错误的概率,又可以对多个变量间的差异进行分析,是社会科学研究中运用最广泛的ー种方法。方差分析的使用前提:①总体分布的正态性(总体非正态时可转换为正态或用非参数方差分析)②各个实验组的方差齐性(出自同一总体)③变异的相互独立性(保证变异的可加性)(2)方差分析的基本原理<->方差分析中的几个概念因素I:实验中的自变量称为“因素”迎:某一个因素的不同处理情况称为因素的“水平”处團:包括量差和质别两种情况,按各个“水平”进行的重复实验称为实验的各种处理。比如现在我们要区分小白和小黑哪个能比较有效地吸收阳光的能量,这样的ー个实验中除开额外变量便只有一个因素,即“颜色”;而小白和小黑则是这一因素内的两个不同水平;至于我们把他们抓到太阳地下晒,就是实验的“处理”了。<->基本逻辑方差分析的理论基础即方差的可分解性(详见描述统计部分)。<->基本逻辑方差分析的理论基础即方差的可分解性(详见描述统计部分)。方差分析的目的是对多组平均数差异的显著性进行检验,看他们之间是否存在差异,实际也就是探测实验处理是否发挥了显デ个体差异总差异组内差异 组间差异随机误差著功效。若研究数据的总变异是由处理效应造成的,那么组间变异便应占较大比例。具体操作时,以F检验来推断组间差异与组内差异的比值,若比值较大,则各组均值的差异就越显著。(3)方差分析的过程<->各变异的内容与表达根据各变异关系及方差分析的可加性,有:总变异=组间变异+组内变异总变异的数学意义是每ー个原始分数(x)与总平均数(x,)的离差:Z(x-£):组间变异的数学意义是每ー组的平均数(月)与总平均数的离差:Z(兄一ア,):组内变异的数学意义是每ー组内部的各原始分数与该组平均数的离差:Z(xー兄)。〈二〉总变异的分解及各部分的计算方差分析的内容很多,因此我们将方差的分子和分母分别计算,然后再合成。.平方和的分解与计算①平方和的定义式根据变异的可加性,对于任何ー个原始分数,有:(X-£)=(兄ー£)+(x-兄)把某组的n个数据的平方和相加,得:Z(x-£)2=zk£_^)+(x—£j2则对于总共k组而言:ZZ(x-£)2=ZZ1(兄ー£)+(x-兄)】2=2Z(兄ー£)2+2±Z(*ー£)びー兄)+ZZ(xー兄)2•.•平均数离差和为〇,即工(无一兄)(x-£)=0.•・原式为:ZZ(x-匕)2=ZZ(兄ー£)2+zz(xー兄)2即:ss,=ssh+ssw②平方和的计算式总平方和:ss,=ZZ(x_£)2=zzx2_(%x)组间平方和:ss尸zz(兄ー£)2=苫ル——‘生,_ Yx2组内平方和:ss”=ZZ(x-£)2=ZZx2-Z——=ss「sSbn2,自山度的分解总自由度:df,=N-\组间自由度:dfh=k-\组内自由度:dfw=df,-dfh=N-l-(k-l)=N-k3.变异的分解总变异:S;=MS,="df.组间变异:S:=MSb=孔dfh组内变异:S:=M5w=q=S;-S;dfw'bく三〉变异率与F分布变异率即是ー类揭示组间变异所占比例的统计量,以F表示:变异率 ー实验处理变异歩差变异=MS°ー误差变异一MS,,若实验处理未产生影响,则F=l。F检验就是检验F值中分子大于分母的ー种检验方法,属单尾检验,若计算得FW1,则无需查表即可直接做出差异不显著的结论:而若F远大于1,则需查F临界值表,查F.dfゴ宀;若采用双尾检验的方法,则查F……/。自此方差分析告一段落,方差分析结束后,需将其步骤和结果归列成一I方差分析表),由变异来源、平方和、自由度、均方、F值和P值构成。(4)方差分析基本步骤总结建立假设,陈述H0和H1;②确定显著性水平a:③计算并确定自山度;④查表找出临界F值;⑤计算统计量:@比较与决策:进行F检验,作出判断,若是多因素方差分析,还应作交互作用分析:⑦列方差分析表:⑧若有需要,还应进行事后检验。2完全随机核计的方爱合折(1)完全随机设计秃圣丽筱讦!就是随机地抽取研究对象并随机将其分配至各种实验条件进行实验的设计形式,每ー随机组接受ー种实验处理,所以也成独立组设计或被试间设计。若实验结果出现组与组之间差异显著,就可以认为实验处理的效应显著。(2)完全随机设计的方差分析分为样本容量相等与不等两种情况,应注意不同情况下N值的计算,其余均与上一节所述一致。(3)特殊数据的方差分析有时欲分析的资料只有各组的兄、S:及〃,・等样本特征值,也可以按方差分析基本思想与概念进行推导:①求总体均值:sSb=Z%•(无ー无);ss,—l)=Eれ「s;ni3超机区俎微计的方麦台斯(1)随机区组设计随机区组设计|是指每个区组均随机地接受全部实验处理或因素水平的实验涉及类型,又称相关设计。(详见实验部分)(2)随机区组设计方差分析的原则与原理在方差分析基本原理中,我们把组内变异笼统地视为ー种误差,而实际上却是实验误差与个体误差同时造成的。根据完全随机区组设计的思想,将个体差异再从中分离,剩余的误差则成为ー种较纯的随机误差,由此提高了分析的精度。即:组内变异=区组变异+误差变异;公式如下:SS,=ssh+ssw=ssh+SSR+sseSSe=SSw-SSRS5r=Z(ZR)_(ZZx)(n为区组数,k为组间数,R为各区组分数,X为各R厶〃 nk处理分数)自由度也分成三部分:

df,=dfh+dfR+dfedfR=n-hdfe=df,-dfh-dfR=nk-l-(k-l)-(n-1)=(n-1)(k-l)(3)随机区组设计方差分析的过程其基本过程与完全随机设计ー样,只是误差分解不同,F值的计算不同:F=風

MSe,イ办方赛台新(1)协方差分析的性质在实验过程中,我们经常会遇到ー些光靠实验操作难以控制额外变量的情况,如果这些变量与因变量之间存在共变关系,我们就可以运用协方差分析对数据进行统计控制。协方差分析本质上可以视为线性回归与方差分析的综合使用,即在原有的方差中减去那些与因变量早.线性关系的变量与因变量的协方差,从而消除这些额外变量的影响,以达完善实验的目的。(建议扎实学习完方差分析与线性回归后再来学习这ー节)(2)协方差分析的一般步骤①经过线性回归的显著性检验,得到x确实向y回归,且意义显著;②在假定各组的回归与总体回归一致的前提下,分别求出组内、组间及总的均积(均积是样本统计量,其对应的总体参数为协方差,记作。xy或cov(x,y));Z£(x一巧)(y-p)=XE(x-玲ケ-y)+Z(x一区)(丫ー「)力即:Sp,=Spb+Sp・.算出未经调整的组内、组间、总体和方;sst=ssb+ssw④算出三种经过调整的和方:SS%=b,-Sp,SS%=b,-Sp,=SSIXp,sslxSSfw=bK-Spw=^-Spw=^-wx wx:.SS'1y=SS「SSy,=SS,—M(ガン=剛ー1)IXSS1=SS.「SS加(ガ[=朗,一1)SS'by=SS\-SS'wy(df'b=dfh)⑤用已矫正的方差值进行F检验。r=MS'by_SS'hy/dfh一MS、「SS;/(d九一。经过处理,若原先y的差异是由x造成的,那么矫正后y之间将没有显著差异;反之若y的变异除掉x造成的变异后仍存在不同处理间的显著效应,则可以认为y’间确实存在显著差异。注意:矫正后由于y'与x已不再相关,ヅ和原y各值的大小顺序可能也会不一致。由此可见,协方差分析能够提高实验的准确性和精确性,从而使数据更真实地反映实验实际。5.多因米方是今折(1)多因素实验设计多因素实验设计是实验者同时操纵两个或多个自变量的一类设计的总称。ー个多因素实验设计与单因素实验设计最重要的区别在于前者可以估价交互作用的影响,从而可获得比单因素实验更加丰富的信息。交互作用的估价对于研究的深入是非常重要的,在几个因素同时作用的时候,经常会出现这样的情况:ー个因素的各水平在另ー个因素的不同水平上变化趋势不一致,以致如果只区分每个因素単独的作用,并不能揭示因素水平之间的复杂关系。多因素方差分析即是多因素实验中所用到的统计方法,包括对主效应的检验,对交互作用的检验以及对因素内各水平间差异的显著性检验等。鉴于离开实验来叙述多因素方差分析并没有什么实际意义,且此部分计算过程繁杂,研究生入学考试一般来讲不可能出现那么费时的题目,以下我便只结合各种实验设计,简单分述各种多因素方差分析的一般特点。(参考资料:《心理与教育研究中的多因素实验设计》——舒华)(2)二因素完全随机实险设计<—>基本方法随机分配被试接受两个因素的实验处理的结合,每个被试接受一个实验处理的结合。若A因素有p个处理水平,B因素有q个处理水平,n为每个处理组合中接受处理的被试人数,则总共需要N=npq个被试。〈二〉被试分配示意图TOC\o"1-5"\h\z8.1 31 31 32 32 32bi b2 b3 bi b2 b3Si S2 S6S7 S« S12S13 S14 S18S19 S20 S24く三〉平方和与自由度分解图SS总变舁(df=npq-1)ISSftgM(df=pq«1)I— SS处及内| /r_ 厂 .. *—i “ / SSa(df=p-1)SSB(df=q-1)SSAB(df=(p-1)(q-1))SS,M,df=pq(n-1))く四〉各平方和的含义SS处理网:指所有由实验处理引起的变异。在两因素实验中它包括A因素、B因素及其交互作用引起的变异。SSa:A因素的处理效应。SSB:B因素的处理效应。SSab:AB间的交互作用。SS.内:指所有不能由实验处理解释的变异。完全随机设计中不对处理内平方和做进ー步分解。SS忖讷:指实验中接受相同实验处理的被试之间的变异之和,其均方可用作该实验设计中所有F检验的误差项。注意:当方差分析表明两个因素的交互作用是显著时,研究者常常需要进一步了解交互作用的含义是什么,这就需要作进ー步的检验:另外,方差分析只能提供几个变量之间是否存在显著差异的结果,而各水平两两之间,或各因素对其他因素的影响作用却无法体现出来,因此在ー些情况下便需要做进ー步的检验。这些检验方法将在这ー节的最后ー并详细阐述。(3)二因素随机区组实验设计二因素随机区组设计使用了区组技术,在估价两个因素的处理效应及其交互作用的同时,还可以分离出ー个无关变量的影响,大大减小了残差变异,使得F检验更加敏感。但使用时要注意,这个无关变量与自变量之间不可以有交互作用。くー》基本方法事先将被试在无关变量上进行匹配(如果这个无关变量是被试变量),然后将选择好的每ー组同质被试随机分配,每个被试接受一个实验处理的结合。若A因素有p个处理水平,B因素有q个处理水平,n为每个区组中接受处理的被试人数,则总共需要N=npq个被试。く二〉被试分配示意图dl di di d2 d2 d2bi 62 bs bi b2 ba区组1SuS|2S|3S|4S|5S16区组2021 022 026区组3031 032 S36区组4041 042 S46く三〉平方和与自由度分解图(df=npq-1)ISS*un(df=pq-1)I- SSi;,tIdf=pq(n-1)) r * C_ " _ , r I SS*(df=p-1)SSe(df=q-1)SS*b(df=(p-1)(q-1))SS1)tl(df=n-1)SS^z(df=(n-1)(pq-1))く四〉各平方和的含义SS处嘶"指所有由实验处理引起的变异。SSa:A因素的处理效应。SSb:B因素的处理效应。SSab:AB间的交互作用。SS处理内:随机区组设计中,处理平方和被进一步分解为区组效应和残差平方和两部分SSKffl!区组效应:SS畑本:即误差变异,其均方用作其他均方F检验时的误差项。(4)二因素混合设计当每ー个实验中,每个被试仅接受ー个实验处理时,叫非重赁测量实验设计或者被试问设计,完全随机设计与随机区组设计都属此类。在这种设计中,误差变异的ー个重要来源是被试的个体误差。由于接受不同处理水平的是不同的被试,因此处理效应与被试之间的个体差异混淆在ー起,很难区分处理效应中是否包含有被试个体差异引起的变异。•种更好的控制被试个体差异的方法是让每个被试只接受一个变量的所有的处理水平,这就是重复测量设计。在两因素实验设计中,当有一个因素是重复测量的,而另•个因素是非重复测量的时,叫做!混合设计当两个因素都是重复测量的时,就叫|被试内设计!。混合设计是现代心理与教育实验中应用最广泛的ー种设计(也是考研考察的重点,几乎每年都有几个连在ー起的选择题,08年更是以此出了最后一道分析题),卜.面介绍几种需要运用混合设计的情况:①当研究中的两个变量中有一个是被试变量时:②当研究中的一个自变量的处理会对被试产生长期效应,如学习效应时:③有时选用混合设计是出自对实验的可行性的考虑,如当实验中两个因素的水平数都较多,使用完全随机设计所需要的被试量很大,而选用被试内设计,每个被试重复测量的次数很多,会带来疲劳、练习等效应,这时混合设计便可能是一个很好的选择。〈ー〉基本方法首先确定研究中的被试内变量和被试间变量,将被试随机分配给被试间变量的各个水平,然后使每个被试接受与被试间变量的某ー水平相结合的被试内变量的所有水平。若被试间因素B有p个水平,则二因素混合设计共需被试N=np个,比ー个二因素完全随机设计(N=npq)少,而比ー个二因素被试内设计(N=n)多。〈二〉被试分配示意图bi b2 baaiSi Si SiS2 S2 S,S3 S3 S3Si Si Si32S.5 S.5 S5Se Sfi SeS7 S7 S7s« s« s«く三〉平方和与自由度分解图SSr受算(df=npq-1)SShucm<df=np-1) 丄 SSは试内(df=np(q-1))SSa(df二p-1)SSf._(A)1df=p(n-1))SSb(df=q-1)SSab*df=(p-1)(q_1))SSb-k:u-.a1df=p(n-1)(q-1))〈四〉各平方和的含义SS 两因素混合实验中,被试间平方和包括被试间因素引起的变异和与被试间因素有关的误差变异。SSa:被试间A因素的处理效应。SS««):与被试间因素有关的误差变异,其均方用作A因素ド检验的误差项。SS时在两因素混合实验中,被试内平方和包括被试内因素的处理效应、被试内与被试间因素的交互作用,以及与被试内因素有关的误差变异。SSB:被试内因素B的处理效应。SSab:AB间的交互作用。SSbx^^a):与被试内因素有关的误差变异,其均方用作B因素及AB交互作用的误差项。〈五〉SS協.®和SSbx欲试5的实质SS被WA,实质上类似于ー个完全随机实验中的SSn岫,它相当于嵌套在a和az水平内的两个单因素完全随机实验的组内误差之和。而SSBxtm®类似于ー个随机区组实验中的SS讨,在ー个单因素重复测量或随机区组实验中,由于实验设计假设自变量与被试(区组)之间有没有交互作用,交互作用的残差平方和是随机误差,因此,我们用它做实验误差变异的估价。在混合实验中,它相当于嵌套在ai和aク水平内的两个单因素重复测量(或随机区组)实验的残差平方和之和。由于在一般情况下,MSbxS«(A)要比MS枝.®小得多,所以被试内因素及其交互作用的F检验一般要比被试间因素的F检验敏感的多,因此在可行的情况下,研究者通常会把较为重要的变量放在组内变量中。(5)两因素被试内设计采用重复测量的两因素被试内设计时,实验中只有两个被试内因素。在实验条件允许的情况下,被试内设计能分离出所有由被试个体差异引起的变异,达到减少实验误差,提高结果精度的目的,是•种很好的设计。<—>基本方法每个被试都接受所有的实验处理的结合。实验刺激呈现给被试的先后次序是随机的,或按拉丁方排序的。く二〉被试分配示意图aiaiaia2a2a2bib2b3bib2b3SiSiSiSiSiSiS2S.3S2SaS2S3S2S3S2S3S2S3s4S4s4S4S.1く三〉平方和与自由度分解图く四〉各平方和的含义SS枝刎:两因素被试内实验中,被试间平方和包含了所有由被试个体差异引起的变异。SS拔狀内:两因素被试内实验中,被试内平方和包括所有由实验处理引起的变异及误差变异。SSa:被试间A因素的处理效应。SSax«u:残差,其均方用作A因素的F检验的误差项。SSB:被试内因素B的处理效应。SSbx»w:残差,其均方用作B因素的F检验的误差项。SSab:AB间的交互作用。SSb・枝试:残差,其均方用作B因素的F检验的误差项。

SSmbx拔求:残差,其均方用作AB交互作用的F检验的误差项。SSax被试、SSb«极试和SSaxb"拔试虽然在计算上略有不同,但实质上都是残差平方和。(6)对交互作用的进ー步检验当方差分析表明一个两次交互作用显著时,应进ー步做丽和|简单效应检蚁以确定交互作用的实质。当ー个三次交互作用显著时,应进ー步做丽荷单效应检验|或者丽司互作用检芻!。简单效应检验与主效应检验大不相同,反邈!检验是在忽略其他因素的情况下检验ー个因素的处理效应。简单效应检验则是指分别检验ー个因素在另一个因素的每一个水平上的处理效应,以便具体地确定它的处理效应在另ー个因素的哪些水平上是显著的,在哪些水平上是不显著的。当交互作用不显著时,做简单效应检验是没有必要的。交互作用不显著表明一个因素在另一个因素的不同水平上的影响是一直的。在这种情况下,只进行主效应检验即可。而当交互作用显著时,表明一个因素在另•个因素的不同水平上的影响不一致,就需要简单效应检验来帮助研究者进ー步说明这种不一致。一般来说,不需要同时做两组检验,而选做哪ー组检验,则与实验目的有关。但是,简单效应检验只能得出处理效应显著或不显著的结论,它的意义是什么?差异的方向如何?还要通过图解来了解。因此对交互作用的检验一般第一步先做图解,对交互作用的性质有一个直观的了解,然后再用简单效应检验做进ー步的统计检验。(7)事后检验当方差分析表明一个主效应显著时,它只能提供几个变量之间是否存在显著差异的结果,而各水平两两之间,或各因素对其他因素的影响作用却无法体现出来,因此在ー些情况下便需要做进ー步的检验,即|事后检验|。注:①两因素方差分析中每个因素若都只有2个水平,则无须进行事后比较;②若多因素交互效应显著,则主效应间必须进行事后比较:③交互作用的事后比较包括单纯的主效应比较和达到显著性水平后的多重比较。由于多重t检验会使得I型错误犯错概率大大增加(犯错概率p=l-(l-a)n),我们只能采取其他办法,事后检验的方法有许多,通常使用的是以下两种:N-K检验(q检验)N-K检驰本质上就是找出每对平均数之间差异的标准误,然后用标准误检验两均值间的ハ= 任意两均值之差 =兄ー%,:厶]任意两均值间差异的标准误 SE」其中SEマ=其中SEマ=(n为样本容量相等时的小组容量)算得q统计量后,将其与q表查得的临界值相比较便可得出结果。查q表时需查阅qgね.,其中r=クーウ+l(r为要比较的各个均值按大小排序后所得的次序等级)HSD检验法由于q检验法需要计算多个q值,稍嫌麻烦,经过简化,便产生了HSD检验法,其基本过程如下:将要比较的各个均值从小到大作等级排列;查表得相应q值:计算临界值HSD=q^MSe/n(各水平间容量不等时1 1,—+—+ 4--n2 nk④把要比较的两均值之差与相应比较等级(就是查q时用的r)的HSD比较,若超过则可认为两者差异显著。(五)统计功效与效果量1,统计功效统计功效I,亦即统计检验カ,是指在假设检验中,拒绝原假设后,接受正确的H1的概率,由于取伪错误的概率为。,故统计功效等于1ー仇统计功效大小取决于多种因素,如检验的类型、样本容量、a水平以及抽样误差的状况等。对统计功效进行分析应是以上诸因素结合在ー起的分析。通常影响统计检验カ的因素有如下几种:①样本大小:样本小,检验カ低;②a大小:a越小,p错误越大,检验カ越低:③因变量误差变异的大小:标准差越大,标准误也就越大,达显著性水平时p也就越大,1-P就越小。.数累黄效果量[是・个能测量自变量和因变量间关联强度的效果量数。常用的效果量数有如下几种:d效果量”是ー种比率,本质上等同于信号检测论中的ク,计算公式为:d尤实验•ー・対照组 d_ス0独立样本: s对照组 : 相关样本:s。(2)あ是点二列相关系数的平方,可以确定两独立样本实验的效果量,也可以确定两相关样本实验的效果。计算公式都是ー样的,不同的只是自由度计算,前者自由度为ガ=/十%-2;后者为ガ(D为对子数)。公式如下:M_①独(t)2+df以上两种效果量均运用于t检验。(3)ガワ是ー种相关量数,它可以表示两个变量之间的相关程度,无论是直线相关还是曲线相关。ク系数的取值范围是[0.00,1.00],不存在负的曲线相关。ク是用来解释样本的自变量与因变量关联程度的描述统计量。方差分析中,ク的计算公式如下:ク=~ss~

a总ク越大,说明自变量对因变量的影响效果也就越大。如果ク很小,便说明即使假设检验统计上有显著性,也没有实际效果。0,是与ガ对应的总体参数,是解释总体的自变量与因变量关联程度的指标。(4)以上三种效果量的临界定义小中大d0.20.50.8片,0.010.0590.138ガ0.060.16(六)一元线性回归分析ムーえ钱程向忸方程的建立、检驗及应用一、一元线性回归分析(1)回归分析及其意义

通过变量之间存在的关系,根据ー个已知变量来预测另ー个变量均值的方法,称作!!回其中,只有一个自变量并且统计量成大体一次函数的线性关系的回归分析叫一元线性!回归分析。回归分析的内容:①建立回归方程:②检验方程的有效性;③利用方程进行预测;④进行因素分析。相关与回归的区别:①.相关表示两个变量双方向的相互关系,回归只表示一个变量随另ー个变量变化的单方向关系:②.回归中有因变量、自变量的区分,相关并不表明事物的因果关系,对所有的研究变量都平等对待,不做因、自变量的区分。(2)一元线性回归方程的建立<—>一元线性回归方程的基本形式Y=a+bX其中a为截距:b为斜率,b又称回归系数,其意义表示当其他变量不变时,该自变量变化时ー个单位时因变量变化的单位数;而デ则是X对于ド的估计值。〈二〉b和a的求解原则与方法.最小二乘法所谓最小二乘法,就是如果散点图中每一点沿Y轴方向到直线的距离的平方和最小,则认为这条直线的代表性最好,即将其作为回归方程。这样做的目的是为了使得最小。Y=a+bX其中;荘区,jX-x)("り;ssxxZ(x一五)a=Y-bX.其他计算方法①最小二乘法计算式:①最小二乘法计算式:bn=yxy-②相关系数法:byx=r•%;bXY=r*_ \XY-nXY③均数和标准差计算法:%=ム 2

(3)解释和计算相关与回归时的ー些问题<—>决定系数决定系数即相关系数的平方,是衡系冋归有效性高低的指标,是回归平方和与总平方和的比值:解释相关系数是否显著时,应谨记随着样本容量的增大,达到显著性的相关系数会越小;且即使相关系数是显著的,若决定系数不够大,用这一方程作预测的作用也不大。〈二〉两列变量的一致性问题生是指两列变量对应的点必须均匀地落在回归线的附近。只有当数据均匀地分布在回归线附近,相关系数才能真正表明两列变量之间的关系。二、一元线性回归方程的检验(1)方程效果的检验<—>检验原理线性回归方程的方差分析是针対因变量观测值离均差平方和的分解进行的,下面以Y=a+bX为例:40Y=a+bX为例:40-35-XA»sTide总平方和(SSJ如图,可将变异分解为:ss,=SSR+SSe即:Z("か2=z(”y)+—(y—か2其中,SS,为Y的总平方和:SSr为回归直线解释的那部分离差平方和;SSe为偏离直线那部分的平方和。〈二〉检验过程①建立假设:Ho:方程效果不显著:H1:方程效果显著②方差分析:公式如下表SS dfms

总N—1回归ss.=Z(屋庁=かX(xーマ)(ドーネ)=か(2スドー2ハ£%)=「Z(x-めユ*(Zx-Zx%)1SSr//dfR误差SS,=Zd)2=SS,-SSR^-2ssj/dfeMS/7g③比较与决策④列方差分析表(2)回归系数的显著性检脸先前介绍过,样本回归系数分布服从t分布,因此回归系数的显著性检验就由t检验来完成①设总体回归系数为タ,则Ho:夕=0;曰:夕エ〇②回归系数标准误的计算:估计标准误:sYX=而s,=Sy•Ji-产由估计标准误得b的标准误:讦-_sn///ssx-7な(Xぶ③回归系数的t检验:b-/3b_SEbSEb-/3b_SEbSEbCdf=N-2)整理可得:t=-f 1-r2N-2故仅知道相关系数即可进行方程回归系数的显著性检验。比较与决策计算决定系数,以衡量方程有效性高低。三、一元线性回归方程的应用建立回归方程的最终目的是利用方程从一知事实推测相应的未知事实,即预避,也就是将已知变量值作为自变量代入相应回归方程推算出另ー变量的估计值及置信区间。对因变量的|点估计值即是?:区间估计|有两种,即对所有具备同一条件案例的均值的预测和对单个因变量实测值的预测,前者总是比后者置信区间要小,也就是更精确些。2可化名ー无佚器回用的曲佚方程(1)曲线方程曲线方程回归ク雨的基本任务是通过两个相关的变量x与y的实际观测数据建立曲线回归,以揭示x与y之间的曲线联系。确定x与y之间是何种曲线关系通常有一下方法:①利用相关知识经验确定(如感觉测量可用对数或恭函数);②用数据在直角坐标系作散点图,观察其分布与哪ー类已知函数曲线最接近,然后用以拟合数据;③若找不到与已知的函数曲线接近数据的分布趋势,这时可用多项式回归,通过逐渐增加高次项来逐步逼近。(2)可化为一元线性回归的曲线方程.多项式曲线Y=bn+b[X+b2x2+ +bpxp令X]=X,X2=X) , xp=xp1则多项式转化为;Y=%+ム玉+b2x2+ +bpXp.对数函数y=。+人•logx令ス'=k)gx,则曲线转化为:y=。+。ス’・对数函数的特点是随着X增大,X的单位变动对因变量y的影响不断递减,若数据分布符合此种规律,就可以尝试使用对数函数。.指数函数y=aebx或y=ae^x(a>0)对方程两端求对数,得:lny=ln〃+ん:令y'=lny,优=ln〃,则方程转化为:ダ=优+bx.事函数y=axb(a>0)对方程两端取对数,得:logy=log。+ク10gx令y'=logy,a'=logo,x'=logx,得:y'=a'+bx'.双曲线函数by=a+—x令x'=丄,得:Xy=a+bx'.成长曲线模型1y= a+伙7令ダ=丄,£= 得:yy'=a+J3x'(3)曲线回归模型的应用通常一组数据会符合多个曲线方程的形貌,选取最佳拟合曲线要看其决定系数r2值,应选取r2值最大者作为最佳拟合。在变量转换完成后,便可对新的回归直线进行参数求解及显著性检验,最后再将新变量还原为原变量,将回归方程还原。(七)卡方检验厶切合な检蛉(1)X2的基础知识〈ー〉x2的意义X2是表示实测次数与理论次数(即期望次数)之间差异程度的指标,其基本数学定义是:实测次数与期望次数之差的平方与期望次数的比率。若以f°表示实测次数,fe或f1表示期望次数,则:メー(ーーん)2Je卡方检验的本质就是检验实测次数与期望次数是否一致。<->X

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论