心理统计公式汇总_第1页
心理统计公式汇总_第2页
心理统计公式汇总_第3页
免费预览已结束,剩余31页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、心理统计公式汇总心理学考研分为:心理学学硕和心理学专硕(又称“应用心理硕士”、“心理专硕”)。心理学学硕和心理学专硕考试科目不同,但是都会考察到心理学统计,(部分自主命题院校不考察心理学统计,考生需要提前了解院校信息。)无论是对本专业还是跨专业心理学考研的同学而言,心理学统计始终是比较难懂的一块。博仁教育老师为考生分章节整理出心理学统计公式,方便考生进行复习与记忆。第三章集中量数1、几个集中量数的公式计算 一览表算术平均数(M)nXi未分组:X= i 1n分组数据:“fi ?Xci平 均fi加权平均数(单位权重不相EW?Xi数(M等的情况)几何平均数lgXi ;rX.(解决增长率的 问题)Mg

2、N 1 -; Mg 牛Xi,K ,Xn Xilg MgNV调和平均数倒数的算术平均数的倒数:MhN ;(解决速度的问1 ;题)Xi无重复值N=奇数N 1中数即 N '位置的数;2N=禺数中数即中间两个数的平均数;若重复值没有位于中间,则求法与无重复值时未分组:一致;若重复值位于中间,则(P62):中数(Md)有重复值图示:思路:连续性数字,不是一个点,是一个区间;有几个重复的,则将组距除以几;分组Md Lb(7Fb)?jfMd众数(MO1、直接观察法。2、公式法。(皮尔逊经验法 &金式插补法) 皮尔逊经验法: Mo 3Md 2M ; 金式插补法:Mo Lbfai ;fa fb【

3、组中值的计算】第四章差异量数百分位数(点)PpLbP N Fb100 b百分等级未分组:Pr 100(100R50)Nf(X Lb)】i四分位差分组:Pr 100NQ = Q3 Qi ; ( Q3与 Q1 即 P25 与 P75) 2未分组:A.D.平均差分组:A-D-;(Ixln为各组中点值对平均数离差的绝对值)2未分组:s(X X)2原始数据代入:(NX2 2X ( X)方差与标准差2分组:s2f(Xc X)2N2Ld-N2 2总方差与总标准差:2StN iSi NidiN;(di Xt Xi)标准差 的应用差异 系数sCV = 100% X标准分数X X x Z ss第五章相关关系相关系

4、数适用资料公式rXy(N为成对数,x、y为离均差);NSxSy成对的数据(30对);原始值代入:积差相关连续变量;正态双变(皮尔逊)量;线性关系;XYXYrNJ X2(X) N2Y2 ( 丫)TN1、等级差数法:R=1-62D( D为对偶等级之差)n(N1)2、等级序数法:3rR=r? 一4RxRy (N 1)斯皮尔曼1N(N 1)两列具有线性关系的等级3、出现相同等级时:等级相关或顺序变量;222(两列)xyDr rc22等2? Jx ?y级32相 关其中,x2:=N -N=12C.Cn(n 1)X, CX12(N为成对数据数目,n为各列变量相同等级数)肯德尔W系数(和谐系数):1、基本公式

5、:A/s;(K为评价者数,N肯德尔等级相 关(多列)为被评对象数)Vv丄K 122(N 3N)K个评分人评N个对象, 分析K个评分人的一致性 程度;2同一个人先后 K次评价 N个对象,分析其前后一致 性;W 加 3(N1);51(Ri为评价对象获得的 K个评价者给的等级之和,2 2R2 ( R)2s(R)R2 ' “ );NN2、相同等级时:W=s;其中,s的意义同上,T如丄 K2(N3 N) K T12下:3Tn n ;( n为相同等级数)12肯德尔U系数(一致性系 数):对偶比较法:将 N个事物 两两配对,可配成N(N-1)/N 对,然后对每一 对进行比较,择优选择, 优者记1,非

6、优者记0;8( r: K rj) U=JJ1;N(N 1)?K(K 1)N为被评价对象数目(即等级数),K为评价者数目,riJ为对偶比较表中i >J (或i vj )格中的择优分数。(几个评价者认为i比J好,则为几)质 与 量 的 相 关点二列相关 正态连续变量 &二分名义变 量(真正的)【用于非类测验(得分只 有两种结果,答对得分, 答错不得分)的测验内部 一致性,每道题与总分的 相关等问题;】X pX q °rpb ?Jpq ;St(其中,p、q二分称名变量两个值所占比例,Xp与Xq为二分称名变量各自对应值的平均数,St为连续变量的标准差);二列相关 两列数据均正态

7、 一列为连续变量,一列 为二分变量(人为划分);.XP Xq c pq 亠.XP Xt c PStySty其中,y为标准正态曲线中p值对应的咼度,查正态分布 表可知。多列相关适用于两列正态变量,其 中一列为连续变量,另一 列被人为地划分为多种类 别(名义变量);r(yL yH)?Xi其中1 sO> 丿、1?s (yL yH)sPiPi为每系列的次数比率,yL与yH分别为每一名义变量下(上)限的正态曲线高度,可由pi差正态表得知;品 质 相 关四分相关两列都是连续正态变量, 且都人为地被划分为两个 类别。相关资料可以整理 成四格表;180°r; cos()JbC1 J-ad ;或

8、 rt cos亍 )Y bev ad v bc系数(列联系数)两夕列变量均为真正的二分 变量;(四格表)(与卡方检验联系)ad be ad ber j; Q ;J(a b)(a e)(b d )(e d)ad beVad VbeVad Vbe列联表相关数据属于RC表的计数数 据,欲分析所研究的二因 素之间的相关程度时使用皮尔逊定义的列联系数(常用):c J2另:T jYJ(R 1)(C 1)N第六章概率分布1几个基本概念(1)概率:表明随机事件出现的可能性大小的客观指标。(2)后验概率(统计概率):先验概率(古典概率):(3)概率分布:对随机变量取值的概率分布的情况用数学方法(函数)描述。2、

9、概率的基本性质:探概率的公理系统:任何一个随机事件的概率都是非负的;在一定条件下必然发生的必然事件概率为1 ;在一定条件下必然不发生的事件,即不可能事件的概率为0.探概率的加法定理探概率的乘法定理3、概率的分布类型划分划分标准分类备注依据随机变量是否具有连续性离散分布:离散随机变量的概率分布。(如: 二项分布)离散随机变量:随机变量 只取孤立的值。(即计数数据)连续分布:连续随机变量的概率分布, 即测量数据的概率分布。(如:止态分布)依据分布函数的来源来分经验性:据观察或实验获得的数据而编 制的次数分布或相对频率分布。理论性:一是随机变量概率分布的函数 (数学模型),二是按数学模型计算出 的总

10、体的次数分布(总体分布)。依据概率分布所描述的数据特 征而划分基本随机变量分布。常用的有二项分布 和正态分布。统计量(随机变量的函 数):平均数、平均数之 差、方差、标准差、相关 系数、回归系数等。抽样分布:样本统计量的理论分布。4、几个重要分布正态分布(1)特征: 正态分布的形式是对称的,对称轴是经过平均数的垂线。 正态分布的中央点即平均数最高,然后逐渐向两侧下降;曲线形式先向内弯,再向外弯,拐点位 于正负1个标准差处,曲线两端向基线无线靠近,但不相交。 正态曲线下面积为1。 正态分布是一族分布。平均数决定其位置,标准差决定其形态。标准差越小,曲线越狭高。 正态分布中各差异量数值间有固定比率

11、。 正态曲线下,标准差和概率(面积)有一定的数量关系。(2)正态分布表的利用 已知Z分数求概率p,即已知标准分数求面积。 已知概率P求Z分数。 已知概率或Z求概率密度y,即曲线的高。【直接查表即可。注意已知的y是位于中间部分,还是两尾。】(3)次数分布是否为正态的检验方法(4 )正态分布理论在测验中的应用 化等级评定为测量数据 标准测验题目的难易度 在能力分组或等级评定时确定人数 测验分数的正态化二项分布(贝努里分布)(1)几个重要概念理解2个结果;共有n次实验,n是事先给定的二项试验:必须满足几个条件一一任何一次实验恰好只有一个正整数;某种结果出现的概率在任何一次实验中都是固定的。二项分布:

12、试验仅有两种不同性质结果的概率分布。(两个对立事件的概率分布)。具体定义如下:设有 n次试验,各次试验是彼此独立的,每次试验某事件出现的概率都是p,某事件不出现的概率都是q,即(1-p),则对于某事件出现 X次的概率分布为:b(x,n, p) C:pXqn x ;Cnn!x!(n x)!)表示在n次试验中有X次成功,成功的概率为 p。(2 )二项分布的性质 二项分布是离散型分布,概率直方图是跃阶式。(p=q与pzq) 二项分布的平均数与标准差当p < q, np> 5,二项分布接近正态。此时有,卩=np ,e=npq(3 )二项分布的应用当p < q, np5, 二项分布接近

13、正态。用其概率分布计算当npv 5,直接用二项分布函数计算5、抽样分布一览表【样本分布:指的是样本统计量的分布。】正 态 分 布样本 平均 数的 分布总体分布为正态,总体方差已知,样本平均数分布为正态分布。22【x =;变异误 x =;标准误(SE) X =;】n(n总体分布为非正态,但总体方差已知,样本足够大(n>30),样本平均数渐进正态分布。【; x 石】T分 布含义 及基 本公 式学生式分布。左右对称、峰态比较高狭,分布形态随样本容量n-1的变化而变化的一、x x2族分布。【t 1; S=J】s/J n 1V N分布 特点1、平均值为0;2、 以平均值0左右对称分布,左侧 t为负

14、值,右侧为正值。3、变量取值在4、当n趋近于无穷大时,t分布为正态分布,方差为 1 ;当n-1 > 30 , t分布接近正态分布,方差大于1,随n-1的增大而渐趋于1;当n-1 v 30, t分布于止态分布相差较大。分布 表的 使用t0.05 (双侧)=t 0.025 (单侧)总体分布为正态,总体方差未知时,样本平均数为t分布。样本平均数的【Sx寻学,其中,Sn1匚】Vnl Vn耳 n 1分布总体非正态,总体方差未知,右n>30,则近似正态分布。随机变量平方和的分布;或随机变量转为标准分数,标准分数的平方和的分布也服从2分布。概念与公2(X-)【2-2或用样本平均数估计总体总体平均

15、数卩时为2式2_(X-X) ns2 -分 布= 2 2】1、正偏态分布。df趋近无穷大时,为正态分布。分布22、值都是正值。特点2 23、分布的可加性。即卡方分布的和也是分布。应用计数数据的假设检验;样本方差和总体方差差异是否显著的检验;含义与公2 2 , 2 2r 匸1 / dfi厂Sni 1 /1lSni 1F分 布式【F2 /从;F2/2;F2;】2 / df2Sn2 1 '2Sn2 1分布 特点1、正偏态分布;2、F总为正值;应用F检验:考察任意两个样本的方差是否取自冋一整体;方差齐性检验与方差分析;第七章参数估计1几个重要概念点估计、区间估计、置信区间、显著性水平(a)、置信

16、度(置信水平即1- a)、标准误(平均数的离散程度):一乂=育2、参数估计步骤总结(1)分析条件,选择方法,计算样本统计量;(2) 计算样本平均数的标准误;【是关键!】(3)确定显著性水平,求置信区间;(4)查找Z值或t值;(5)计算置信区间;(6)结果解释。X Z(1)/2 ? Xt(1)/2? X正态分布表:X Z/2? x X Z/2? x 或 X Z(i )/2? XT 分布表:X t/2? X X t /2? X 或 X t(i )/2? X3、参数估计一览表总 体 平 均总体方差已知(正态估计法)总体正态分布。总体非正态,n> 30 (近似正态估计法)。标准误为 X -=X亦

17、数总体正态分布。总体非正态,n> 30 (近似t分布估计法)。的 估 计总体方差未知(t分布估计标准误采用样本的无偏方差作为总体方差的估计值即ssn 1法)VnlVn法1 :采用总体方差估计区间的平方根。法2: n>30 (样本标准差的分布为渐进正态),标准差标准差的平均数为 Xs,标准差分布的标准差为s -;=,x/2n标准则置信区间为:Sn ! Z /2 ? sSn ! Z /2 ? s差自正态总体中,随机抽取容量为n的样本,其样本方差和总体方差的比值的分布为与 方2 2 2 2分布,故可直接查表来确定/2和(1 )/2,置信区间为:1方差差(n-1 ) s: i2(n-1 )

18、 s: i2P P2的区/2 (1 )/2间2 2 2置信区间为字p = pF/2字;估计F /2sn2 12sn2 1一总体方差之2比可推论二总体方根据样本方差估计2在1上下一定区间内(即区间是否包含 1),2差相等。若只关注两个总体方差是否相等则用单侧,若要比较二者谁大谁小则用双侧。相 关 系 数积差相关【思路:先总体相关r"2即 =0时。样本相关系数分布为 t分布,rLJn 2置信区间为:r t /2rr t /2r ;系数为0的假设区 间 估 计=0, 求出置 信区 间,若 不包含 0,说明 假设错 误,再 根据 不为0 的情况 来解 题。】总体 相关 系数 不为01 r 2

19、当 n > 500,”.;置信区间为:r Z /2rr Z /2r利用费舍Z函数分布计算(应用广泛,不论是否为0,不论样本容量n的大小)。步骤: 将样本相关系数转换为 Z函数。1 1 r1 r法 1:公式法。Zloge或 Z 1.1513 log10()2 1 r1 r法2 :查r- Zr转换表,直接由r值查Zr值。1 计算标准误:SEZ= JVn3 计算乙的置信区间:Zr Z /2 SEz ; 将Zr的置信区间转换为相关系数。(公式法或查表)等级相关(斯皮尔曼) 当9W nW 20时,rR的分布近似为df n 2, SE;R的t分布。Jn 2置信区间为:rR t /2电;r (df n

20、 2) Jn 2/TV 当n>20时,rR的分布近似正态分布,标准误为SE RJn 2置信区间改为:rR Z /2= (df n 2)dn 2比 率 及 比 率 差 异 的 区 间 估 计比率的区间估 计当npf 5,标准误p或SEp-Pq ;置信区间为P Z /2 ? SEp p p p p Z /2 ?SEp【ps :样本比率p=x/n,是总体比率p的点估计值,可代替总体比率。故p】r )当np 5,此二项分布不接近正态,此时置信区间的估计直接查二项分布计算的统计表。比率差异的区间估计当n1p15,n2p25时,比率差异的置信区间可用正态分布概率计算。Pi置信区间为(Pi P2)(P

21、1P1当 P1P2P2时,标准误为P2)P2P1 P2H-P1 P2q2 ;置信区间为nin2Z /2PiP2 ;P时,标准误为 dpPiP2(n 1 O1 P °°2)(门得n282).mn 2( n1n2)(P1 P2)Z /2 R P2 ;P,总体比率之差为 0,对于它的置信估计可理解为,样本比率之差在多大范围内可以认为是取自比率差为0的总体。第八章假设检验【假设检验】,即差异显著性的检验,包括总体和样本之间的差异以及样本和样本之间的差异。1、几个重要概念假设检验小概率原理、1型错误&n型错误、统计检验力(1- B)、双侧8单侧检验、2、假设检验的步骤根据问题

22、要求,提出H0 和 H1;选择适当的统计检验量;确定显著性水平a;计算检验统计量的值;(计算标准误,计算临界的Z或t值)做出决策;5、假设检验一览表(4种主要的检验方法:Z检验、t检验、F检验、2检验)平均数的显著性检验(样本 是否来 自总 体)总体正态1、总体方差已知:【Z (卩)检验】临界值X2、总体方差未知:【t检验】临界值t= Z=X 0SEx0,其中,SEx(卩),其中,SEXSExssn 1n 1、n总 体 非 正 态1、当n30 (样本容量足够大)总体方差已知可用 Z检验。(因为是近似正态,故用Z'表示,公式方法同上)总体方差未知时,可直接用样本标准差S代替总体标准差 0

23、,其他不变)2、当nv 30,不可用Z或t检验,只能选择非参数检验。平均数两两个差异的个总体显著性总1 方差检验体都已X1 X 2121、独立样本:临界值 Z SEdxDxdxSEdx(两个都知【Z】|22样本是正其中,SEdxs2否来自同一总态斗n1nxDxDX1 X 212体)2、相关样本临界值同上为ZX-X亠/ 7 ?SEdxSEd*其中,s立.佯-22n2赤?叢1、独立样本。两个总体方差一'致或相等。(齐性)临界值t= X1 Xx(dfR| n2 2)SEDx其中,S&X ,|sp (-丄);其中,sp为联合方差,sp2 2 msnxs?n1n2 2X ynx一、 ,

24、、 、, 2(联合方差Sp是总体方差取好的估计值)两个总体万差不齐性。-柯克二-柯克斯t检验t'X1 X2X1X2=(用各自的无偏估计量)12 2龟 1Sr丄12S12nn12 Vn11nx1两个总体SEx ?ti()seX?t2()t"'1 ' '八2;(查 t 值时,df=1 )方差SEX1seX2都未知【t】【PS:若实际得到的t '1> t,则认为两个样本的平均数在a水平差异显著】2、相关样本。相关系数未知。t X2 ( df n1);(用d表示每一对数据对应的数据之差。)S&X(d 亦 d2(d)2其中,SEdx 12n

25、Cn 1Sdnn相关系数已知。X-X21).其中一/s? s2 2rs1s2t(df nSEdx uX Vn 1两当样本容量足够大时:【Z】1、独立样本:个Z'X1 X2 或 Z' X1 X2方差木知时以样本方差代替各自的总体方差)总i 22J 22j 12S1 S2体* nn2n1n2非正2、相关样本:态Z'X1 X2或 Z'X1X212f 2r 1 2S2 s£ 2rs1S>qnYn2样本t、'八tr、”rr、/x z, t、,厂八亠、22 ns止态总体中样本,其样本方差与总体方差比值的分布为分布,即2与总0方差的体从表中查 /2、(

26、1/2) ( df 1 ,),当彳 2 f2/2 或 2 P(2/2),差异显著。差异检独立样本:【F检验】F '2S大1、验2s小样本之间2、相关样本:【t检验】tJ2S1S2( (dfn 2)42S2(1 r2)n21、p =0( r的分布近似正态)【t检验】r 0t -= (df n 2)1 r2V n 2积差2、pM 0,将r和p都转化为费舍Zr ,然后再进行【Z检验】Z ZZ相关J-1相关系n 3数的显著性检【总结思路】:题目若未说明P是否为0,则先假定p为0,若计算得出要拒绝 H0 (=0 ),验则必须重新再用pM 0的方法来算一遍。1、点二列相关2、二列相关其他3、多列相

27、关类型4、四格相关相关5、斯皮尔曼等级相关6、肯德尔W系数相关 系数 差异(仅 论积 差相 关情 况)1、r1和r2分别由两组彼此独立的被试得到。Z1Zr2j 11将r1、r2分别进行费舍 乙的转换。【Z检验】2、两个样本相关系数由同一组被试算得12、首先计算3列变量的两两相关系数12、23、Z-23、13 ,nn-i 3 n2 313,检验 12与然后进行【t检验】3)13的差异。t(r12r13)?J(n 3)(1r23)gfJ2(112r13r232? r12 ?r13 ?r23 )比率) )的显1、n pf 5 ,【Z检验】Zp P0著性2、fPo?qoV nnp 5,直接查表一项分布

28、置信上下界限比率1、独立样本:差异Ah曰若统计假设仅假设 p1=p2,不涉及具体数值时,的显著性临界比率z-p1 p2 ;其中标准误 Dp p(n1 Pn2 O2 )( n1<0)1n2 & )检验pHM2"I 1pip2Vmn2( n1 n2)比率的显著性若统计假设还假定了具体的比率时(p1 p2PD,pD为正负1之间的任意数。)检验Z:(0102)- pD-",其中标准误为p1 p2I'P1 q1P2q2P1 P21n1n22、相关样本:步骤:将实验结果整理成四格表,将其中前后两次不一致的项目的格内数字标以A或D;Ho : P1 P2 0 H1 :

29、 P1 P2 0 :应用下式求临界比率(条件:A+D-心10,kp > 5)Z:A DDA-或启q ;若不满足上面的条件,则用二项分布计算PAD(或q)以上的概率VA D VA D和,若概率和小于 0.005或0.025为差异显著(这是双侧。单侧为小于0.05 及 0.01 )第九章方差分析1、几个基本概念【方差分析】即变异分析。本质仍然是假设检验。主要功能在于分析实验数据中不同来源的变异对总变异的贡献大小,从而确定实验中的自变量是否对因变量有重要影响。【方差分析的要求】总体分布呈正态;每个实验组的方差齐性;变异具有可加性;方差分析依据的基本原理】即方差(或变异)的可加性原则借以对两组以

30、上的平均数进行差异检【方差分析目的】 通过F检验讨论组间变异在总变异中的作用, 验。【方差分析的步骤】(1)齐性检验;(哈特莱最大 F比率法)( 2 )构建综合虚无假设;( 3)计算平方和;( 4 )计算自由度;( 5)计算均方;( 6)确定检验统计量(计算 F 值);(7)确定显著性水平的临界值(查F值表进行F检验);( 8 )做出统计决断;( 9)陈列方差分析表2、方差分析一览表即单因素分析。安排被试的一般格式处理1处理2处理k被试11被试21被试k1被试12被试22被试k2被试13被试23被试k3需要计算的统计量基本公式一览表宀 完 全 随 机 设 计 的 方 差 分 析计算平方和计算自

31、由度计算均方计算F值总变异ss =x 2(X);组间自由度组间均方:心、乂丿丨Ob 人,nkdfB k1 ;SSB组间变异SS= ( X)2(X)2组内自由度MSb ; dfBFMSBnnkdfwk(n 1);组内均方:MSw组内变异2( X)2SSv=SSr SSBX2 n总自由度:dfT dfBdfw nk 1MSw fdfw完全随机设计(单因素)方差分析表变异来源平方和自由度均方FP组间VVVVV组内VVV总变异VVPS:有以下几种应用各实验处理组样本容量相同各实验处理组样本容量不同(此时总数据个数用nk用N来表示)随 机 区 组 设 计 的 方 差 分 析即组内设计的方差分析。【每个组

32、均接受所有的实验处理】 安排被试的一般格式处理1处理2处理k被试1被试1被试1被试1被试2被试2被试1被试3被试3随机区组设计的方差分析表变异来源平方和自由度均方Fp组间VVVVV区组VVVVV误差VVV总变异VV利用样本统计量进行方差分析需要计算的统计量基本公式一览表计算平方和计算自由度计算均方计算F值总变异组间均方:x2 (X)2R/IQSSB组间方差是SSr =变异)组间nk(X)2nk总自由度:组间自由度区组自由度dfTN 1dfBk 1dfR n 1dfB区组均方:否大于误差 项的方差:(一般)X)2nSSb=(SSbMSr dfR匚MSbF Bmse区组变异误差自由度j 1 R检验

33、区组效n (SSR)2(R)2误差均方:应:1knkdfE (k1)( n 1)LMSrwSSEfrr误差项平方和msedfER mseSSe SStSSbSSrPS:实验原则:同一区组内的被试应该同质。区组效应:被试之间性质不同产生的差异。区组效应显著说明分组成功。在方差分析基础上,若结果是拒绝了虚无假设,即差异显著,但究竟是那几对平均数存在差异,则需要进行事后检 验。(事后多重比较)注意:事后多重比较并不限于方差分析,只要是对多个平均数进行两两比较,都可以采用此方法。N-K检验法:即q检验法。步骤如下: 把要比较的平均数从小到大做等级排列;可列表如下等级 1 (最小) 23456平均数X下

34、标X下标X下标X下标X下标X下标可列出具体数值事 后 检 验 根据比较等级r,自由度dfE,查附表(q分布的临界值表)中对应的q°.05 (或0.01水平)的值;(比较等级r是被比较的两个平均数的等级数之差再加1,即r ri rj 1。dfE即方差分析中的误差自由度,与完全随机设计中的组内自由度 dfW相等)。 求样本平均数的标准误:SEX JMSe (其中,MSe为组内均方,n为每组容量。完全随机设计时用MSw),V n完全随机设计,各组容量不同时使用: SEX ?q°.05就是对应于某一个r值得两个平均数相比较时的临界值。若两个平均数的差异(SEX ?q0.05),则认

35、为这两个平均数在 0.05水平差异显著;可列表如下: 表中数值表示平均数两两之间的差数,显著可加*号。比较时,注意对应的是哪个r值。X下标(数值)X下标X下标X下标X下标(两平均数差)X下标VVX下标VVVX下标VVVV第十章 2检验1、相关知识点2【 检验】是对类别数据的检验, 对数据总体的分布形态不做任何要求,实际上是一种非参数检验。处理的是一个因素两项或多项分类的【实际观察频数】与【理论频数】(即期望次数)是否一致。2 的假设】 分类相互排斥,互不包容;观测值相互独立;(要求每个被试只有一个观测值)期望次数的大小;(每一个单元格中的期望次数至少在5个以上)类别配合度检验即无差假说检验。用

36、来检验一个因素多项分类的实际观察数与某理论次数是否接近。 涉及的是某总体的分布是否与某种分布相符合。(当对连续数据的正态性进行检验时,此法也称正态吻合性检验。)独立性检验用来检验两个或两个以上因素各种分类之间是否有关联或是否有独立性的问题。(交互作用。例如:性别与对某个问题的态度是否有关联等)同质性检验检定不冋人群母总体在某一变量的反应是否具有显著差异。基本公式2_( fo-f)fe基本步骤2提出假设;计算值;查表,比较并做出决断。小期望次数的连续性校正1单元格合并法;2、增加样本数;3、去除样本法;4、使用校正公式;2X 2列联表中, 若单元格的期望次数在 5到10之间,则用耶茨校正公式;

37、若期望次数低于 5,或样本总人数低于 20,则用费舍精确概率检验法; 若单元格内容涉及到重复测量设计(如前后测设计),则使用麦内玛检验;2、检验一览表配 合 度 检 验一般问题1、统计假设。H 0 :fo fe = 0 或fo =feH 1 :fo fe 丰 0 或fo 丰fe2、理论次数的计算:无差假说。即理论次数=总数X( 1/分类项数);按照某种理论分布。3、 自由度:分类项目减去计算时用的统计量数,一般为分类项目减去1.。应用检验无差假说无差假说,即各项分类的实计数之间没有差异,也就是各项分类间机会相等(概率相等),理论 次数完全按概率相等的条件算,即理论次数=总数X( 1/分类项数)

38、检验假设分布的概率假设某因素各项分类的次数为正态分布,检验实计数与理论上期望的结果之间是否有差异。吻合性检验即拟合度检验。针对连续性数据,检验其是否符合某种理论分布。比率或百分数的.针对搜集到的资料是用百分数表示的情况,方法与上冋。2 2只是将最后的 2值乘以后,再查 2表。(亦可先将百分数转换为实际频数来计算)100二项分类的 配合度检验2二项分类的检验与比率显著性检验相同,配合度检验更为简便。2的连续性校正当期望次数小于5时,比率的显著性检验不能用近似正态而应用二项分布概率计算。 或采用耶茨提出的校正公式为:2= (f0 fel-1/2 )2fe1、统计假设。一般多用文字描述。虚无假设为因

39、素间无关联(或独立的),备择假设则为因素间有关联(或差异显著)。一般问题与 步骤2、理论次数(直接用列联表中数据推算)(fx为每行之和,fy为每列之和)3、自由度:df (R 1)(C 1) ; ( R为每一行的分类项目,C为每一列的分类项目)1独立样本。(相当于独立样本比率差异的显者性检验) 独立样本的四格表示意:N( AD-BC2类型 独立性检验四格 表独 立性 检验当 fe > 5 时,2=(df=1 )(A B)(C D)(A C)(B D)当某一个fe v 5时,用校正公式:2N(|AD-BC N)2=(A B)(C D)(A C)(B D)2、相关样本。(相当于相关样本比率差

40、异的显著性检验)(a D)2当fe > 5时,2= (df=1 )。其中A、D为两次实验或调查中分类项目不同的两个格的A D实计数。(如,学生测两次成绩,第1次答对但第2次答错&第一次答错但第二次答对。)当某一个fe V 5时,用校正公式:2 _(|A-D|-1 )2 =A D3、四格表的费舍精确概率检验法。(期望次数小于5时,除用校正公式,亦可用此法) P314RX C表独 立性 检验2基本公式为2二(f0ifei),其中fei fei较简便的公式为2 N(ff 1)【无需计算理论次数】xi yiPS:允许实计数为0,最小的理论次数为 0.5即可。若不满足,一般采用合并项目的方

41、法,而不 用连续性校正公式。多重 列联 表分 析变量类别多于两个以上时使用。需要将其中一个变量作为分层或控制变量,分别就控制变量下的 每一个水平的另两个变量所形成列联表来比较分析。分别就两个列联表各自的统计量进行计算。(一般以人口学变量等不易受到其他因素影响的为分层变量,如男、女)同 分析几种因素间是否有实质上的差异或几次重复实验的结果是否同质。 质 几次或几组实验数据合并的问题性因素A分类1分类2分类1ABA+B分类2CDC+DA+BB+DN=A+B+C+D因素B步骤:2 计算各个样本的值和自由度; 累加各样本组的1、简单合并法; (1) 条件:各分表某特征的相应比率接近;各分表的都未达到显

42、著性水平(齐性);(2) 方法:将所有数据合并到同一两格表或四格表中,然后计算2量,并进行假设检验。22、相加法;(常用,但反应不灵敏)方法:将各分表的2值相加,查2表(df=分表数),确定显著性水平。 、. 2即值相加法;条件:各样本容量相差不超过2倍;表中各相应比率在 0.20.8之间。方法:用公式Z= ;其中,K为分表数目,=,.2 (即各分表的、,2的开方)4、加权法;条件:不满足3的条件时使用。适合大样本。值,计算其总和和自由度的总和; 将各个样本的原始数据按照相应类别合并,产生一个总的数据表,并计算这个总的数据表的单因素分类数 据的同质性检 验2 值和自由度; 计算异质性 2值(即

43、累加的 2值与计算的总的2值之差),其自由度为累计自由度与总自由度之差; 查2值表,判断异质性 2值的显著性;可列分析表如下变异原因2自由度p合并2值VVV2异质性值VVV总计VV计数 数据 的合 并万 法两格表及四格表的合并方法同质性检式'方去同上。(应用列联表形式的2值计算公式)wa方法:用公式z , 1;其中,K为分表数,dipi1 Pi2 , pi1、Pi2为2X 2表的比JWiPiqi率,wini1 ?ni2为各样本加权数,ni1、ni2为两边缘数。ni1 ni2步骤:求P;求Wi ;求di ;求Z;加权法计算及各符号含义:样本组A非AniA的比率diwiqi 1 Pi59男

44、135713+57(n11)13/70(p11)女32326 (n12)p12168096 (n 1)P1d1 (p11-p12 )w1q11012男265682 (n21)p21女112940 (n22)p223785122 (n2)P2d2w2q21315男155671 (n31)p31女22729 (n32)p321783100 (n3)P3d3w3q35、分表理论次数合并法;(没有其他方法,不得已时采用此法)方法:分别计算各分表中各格的理论次数,再将各分表对应格的理论次数相加,作为简单合并 表的理论次数,据此计算2值。1、简单合并法;2RX C表数据 的合并条件:各分表相应比率接近;各分表的都未达到显著性水平(样本齐性)2、分表理论次数合并法;方法:分别计算各分表中各格的理论次数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论