心理统计学重要知识点_第1页
心理统计学重要知识点_第2页
心理统计学重要知识点_第3页
心理统计学重要知识点_第4页
心理统计学重要知识点_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、心理统计学重要知识点第二章统计图表简单次数分布表的编制:Excel数据透视表列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel数据透视表直方图(histogram ):直观描述连续变量分组次数分布情况,可用 Excel图表向导的柱形图来绘 制散点图(Scatter plot ):主要用于直观描述两个连续性变量的关系状况和变化趋向。条形图(Bar chart ):用于直观描述称名数据、类别数据、等级数据的次数分布情况。简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。圆形图(circle grap

2、h )、饼图(pie graph ):用于直观描述类别数据或等级数据的分布情况。线形图(line graph ):用于直观描述不同时期的发展成就的变化趋势;第三章集中量数集中趋势和离中趋势是数据分布的两个基本特征。集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。集中量数:描述数据分布集中趋势的统计量数。离中趋势:是指数据分布中数据分散的程度。差异量数:描述数据分布离中趋势(离散程度)的统计量数常用的集中量数有:算术平均数、众数(MO)、中位数(M)x1 .算术平均数(简称平均数,M X、Y) : X Excel统计函数AVERAGEn算术平均数的重要特性:(1) 一组数据的离均差(离差

3、)总和为 0,即 (xi x) 0(2)如果变量X的平均数为X ,将变量X按照公式y a bx转换为Y变量后,那么,变量Y的平均数Y a bX2 .中位数(median , M):在一组有序排列的数据中,处于中间位置的数值。中位数上下的数据出 现次数各占50%3 .众数(mode, M): 一组数据中出现次数最多的数据。wiWn正偏盍分布6 .调和平均数(harmonic mean , MH): 一组数值倒数的平均数的倒数。Excel统计函数HARMEANXi(1)用于描述同一个体 (或一组个体)不同时间段的平均学习速度、平均工作效率。(2)用于描述不同能力水平个体的平均学习速度、平均工作效率

4、。7 .几何平均数(geometric mean , Mg)是指n个观察值连乘积的n次方根.(1) 一组数据中少部分偏大(或偏小),数据分布呈偏态时,几何平均数比算术平均数更能反映数据的集中趋势。Mg n X1X2XnExcel统计函数GEOMEAN(2)用于计算平均学习进步速度、平均发展速度(平均发展倍数),即环比的几何平均数。Mg 口1”为巴士n1包(X1、X2、Xn为各个时间段的成果数据)X1X2X3Xn 1, X1平均增长率:M q 1 g第四章差异量数差异量数:描述一组数据离散程度(离中趋势)的统计量数。差异量数较大,说明数据分布得比 较分散,数据之间的差异较大;差异量数较小,说明数

5、据分布的比较集中,数据间的差异较小。 差异量数还能反映平均数对一组数据的代表性。差异量数越小,平均数的代表性越好;差异量数 越大,平均数的代表性越差。常用的差异量数是标准差、方差、差异系数标准差 s: s J (Xi X)2Excel, n标准差 Sn-1 : sn1 J (Xi X) Excel n 12七* 22(Xi X)2方差 s : s Exceln方差 s21 : s212(Xi X)n 1Excel统计函数STDEVP(给定样本总体的标准偏差)统计函数STDEV (给定样本的标准偏差)统计函数VARP (给定样本总体的方差)统计函数VAR (给定样本的方差)差异系数(又称变异系数

6、、离散系数、相对标准差)(1)用于比较不同观测工具测量结果(数据单位不同)的离散程度,例如,身高离散程度大,还 是体重离散程度大(2)用于比较用同一观测工具测得的、均数差异较大的不同样本数据的离散程度。例如:7岁组儿童和13组岁儿童的体重离散程度,哪个较大标准差的重要特性:如果变量X的标准差为Sx,将变量X按照公式y a bx转换为丫变量后,那么,变量Y的标准差Sy bSX相对位置量数:反映个体(数据)在团体中相对位置的统计量数。主要有标准分数及其线性转换分数(Z分数、T分数)、百分等级(PR)、正态化标准分数等。X XX1 .标准分数的计算与应用:Z 或:Z 公一,ST 10Z 50, CE

7、EB 100Z 500Z分数的特点:Z分数的平均数为 0,即Z 0,标准差为1,即Z 1T分数的平均数 T 50,标准差为 T 10CEE班数的平均数 =,标准差=(1)可用于比较个体各方面水平高低(横向比较,个体内差异评价)。(2)对被试多方面的测量结果进行综合,如对高考各科成绩的综合,各分测验分数的综合。(3)可用于对个体或样组某方面水平进行前后比较(纵向比较),判断其水平是提高了,退步了,还是没有变化。2 .原始分数X的百分等级的含义与计算根据简单次数分布表计算:PRx0.5f FbN100Fb根据分组次数分布表计算:PRx100第五章相关关系相关关系的描述方法3 1)相关散点图:适用于

8、直观描述两个连续性数值变量(等距数据、比率数据)之间的关系。可用Excel图表向导中的“ XY散点图”绘制。4 2)双向次数分布表(交叉表、列联表):适用于描述两个等级变量(或称名变量、类别变量 )之间的关系。可用 Excel数据透视表编制列联表)。5 3)相关系数(相关关系的特征值)。相关系数:描述两个变量相关关系的统计量数,在之间取值,绝对值越大,越接近 1,说明两个变量之间的关系程度越密切;绝对值越小,越接近 0,说明两个变量的关系程度越低。常用的相关系数:1.积差相关:r 一(x一x)(一y) Excel统计函数 CORRELnSxSy适用条件:(1) X、丫两个变量都是连续性变量(等

9、距数据或比率数据);(2) X、Y两个变量总体上为正态分布或接近正态分布。2.斯皮尔曼等级相关:是一对(两列)名次变量的积差相关。对数据变量的分布形态没有要求。(1)等级积差相关法(名次积差相关法)。5 (RRX)(RY-RExcel 统计函数 CORRELNSrx Sry公式中的R和R是分别代表两变量中每个数据在变量中的名次。(2)等级差数法(名次差数法)如果每个等级(即名次)变量中没有相同的等级名次,可用下面公式计算:等级差数法简化公式:rR 16 DN(N2 1)如果等级(即名次)变量中有相同的等级名次,需用下面校正公式计算:22_ 2等级差数法校正公式:rcx y Dx2、 y2计算方

10、法参见教材125页2?.( x2)( y2)3 .肯德尔 W系数(肯德尔和谐系数):描述多个名次变量一致性程度的统计量数。适用于描述和分析不同评价者(如主考、阅卷者)对同一组个体(考生或答卷)评价结果(名次)的一致性程度,在心理测量与教育评价中称为评分信度。例如,5位阅卷老师对10篇论文评分排名的一致性。如果评价者给出的不是个体的水平名次,而是分数(或等第、符号),可先将其转换成名次,然后再计算 W系数。R2( Ri)2R2( R)2,Ri r;Ri2W N校正公式: W N T K2(N3 N)-K2(N3 N) t121212公式中:n为每个名次变量中相同名次的数目。4 .点二歹U相关 (

11、point-biserial correlation):用于描述一列续性变量和一列真正二分变量(或非正态二分变量)之间的相关。真正二变量:指按某种性质或标准将个体划分为两种结果的变量,如对、错,男、女等。rpb XP Xq?,pqExcel 统计函数CORRELSt5 .二歹U相关(biserial correlation)外一个正态连续变量之间的相关。:用于描述由一个正态连续变量人为划分成的二分变量与另或者说,用于描述一正态二分变量与一正态连续变量之间的相关。人为二分变量是指由连续变量转换而来的二分变量,例如,将测验或考试分数区分为及格和不及格,80分以上和80分以下;按中考(或高考)成绩,

12、将考生区分为录取、未录取。正态二分变量如果二分变量是根据正态连续变量转换而来,那么,可称之为正态二分变量。XP Xqpqb ?Styy为将正态分布面积画分为p、q两部分的纵线的高度。y的计算方法:利用 Excel统计函数计算标准正态分布区间点函数NORMSINVp值)一区间点Z值正态分布函数 NORMDIST区间点Z值,0,1,0)一Z值的概率密度 y6 .相关(系数):r d 1ad bc|,(a b)(c d)(a c)(b d)用于描述两个真正二分变量的相关程度,也用于描述一个人为二分变量和真正二分变量的相关。注意:相关计算公式是由皮尔逊积差相关计算公式转换来的。因此,如果两列二分变量转

13、换为0、1 (或1、2)的数值变量时,可以用 Excel统计函数 CORREL十算系数。第六章概率分布1 .正态分布的特征(见教材)2 . Excel软件中正态分布函数和正态分布区间点函数的应用标准正态分布函数 NORMSDIST勺应用:(1) P(Zv= =NORMSDIST=(2) P(Z= =1-NORMSDIST=(3) Pv Xv = =NORMSDIST-NORMSDIST=正态分布函数 NORMDIST勺应用例如:已知某次测验的分数呈正态分布,平均分为 75分,标准差为(1)低于80分的考生占多大比例,P(X80分)=(3) 80分以上,低于 90分的考生占多大比例,P(80WX

14、v 90)二P(X80 分):“=1-NORMDIST,75,10,1) ” =P(80X 90): “二NORMDIST,75,10,1)-NORMDIST,75,10,1)” =标准正态分布区间点函数NORMSINV勺应用10分,试计算:根据给定的向上累积概率P(Za),标准正态分布的临界值a=a二NORMSINV(p值)例如:P(Z 二正态分布区间点函数NORMINV勺应用根据正态变量 X的平均数、标准差和向上累积概率P(X)二,即 P(XV)二二,二NORMINV,55,12)二,最低分数线应为 70分。3.测验分数、测评等级的正态化:根据被试样本原始分或等级的简单次数分布表,计算各个

15、不同分数或等级的正态标准分数(1)计算每个不同分数 X (或等级)以下累计次数R;(2)计算每个不同分数 X (或等级)中点以下累积比率CP: CPX05f FbN(3)利用Excel统计函数 NORMSINV计算CP对应的正态 Z分数。(4)根据需要,将正态 Z分数转为其他标准分数形式:T分数、CEE的数、托福考试分数、离差智商 IQ等,T 10Z 50, CEEB 100Z500, TOEFL 70Z 500, IQ 15Z 1004 .偏态系数(SKO和峰态系数(Kurt )的计算与应用偏态系数:Excel统计函数 SKEW 峰态系数:Excel统计函数 KURT偏态系数SK= 0,对称

16、分布;SK 0,正偏态分布;SK0,次数分布的峰度比正态分布峰度低阔;Kurt 6)=1 -RXW5) =1-BINOMDIST (5, 20, 1)=7 .二项分布的形态:随n、p的变化具有不同的分布形态(1)当p=q时,二项分布是对称分布。(2)当p=q, np5时,接近正态分布。(3)当pw q, npv5或nqv5时,二项分布为偏态分布。(4)当pw q, np5且nq5时,二项分布接近正态分布。8 .二项分布的平均数和标准差进彳T n次二项试验,每次试验时某事件出现的概率都是p,则该事件出现次数的理论平均数()、方差(2)和标准差分别为:np,2 npq, f npq。如果np5且n

17、q5,成功事件出现结果的概率分布接近np、Jnpq的正态分布。进行投掷100枚硬币试验,如果进行无数次试验, 正面向上的硬币数目会在0100个之间变化。那么,正面向上次数的理论平均数:=np=100x=50,标准差为vnpq J000.50.5 5。20道四选一的单项选择题,如果完全凭猜测答题,那么,猜对题数的平均数为=np=20 x 1/4=5猜对题数的理论标准差为Jnpq 20 1/4 3/4 1.94。第七章总体参数估计1.常用的点估计:总体均数(1的点估计:用样本平均数X , Excel统计函数为 AVERAGE总体方差b 2的点估计:用样本标准差S: 1,或S2 ?。n 1总体标准差

18、 b的点估计:用样本标准差Sn 1 ,或S?J。n 12 .总体平均数的区间估计1.若样本均数的抽样分布为正态分布,总体均数的置信区间为:XZ005 2sEvX1.96SX,n 1总体均数的置信区间为:XZ0.012SEXX2.58,n 12 .若样本均数的抽样分布为总体均数的置信区间为:总体均数的置信区间为:df=n-1的t分布,那么,Xt0.05/2SEXtO.05/2Xt0.01/2SEXt0.01 /2自由度 df=n-1 , to .05,-2 =, to.O5.;2 = ,可用 EXCel 统计函数TINV计算。也可查教材453页t值表3 .总体方差与标准差的区间估计总体方差2的置

19、信区间为:nS22 nS2- (n 1)S: 122)或20.0250.9750.025总体方差2的置信区间为:nS22 nS2- (n 1)S: 122)或20.0050.9950.00522 (n 1)S:120. 9752 (n 1)S:120. 995自由度df = n-1的2分布右侧概率区间点的计算,也可用Excel统计函数CHIINV。也可查教材475页 2分布数值表总体标准差(T的置信区间: 取总体方差 2置信区间上、下限的正平方根。4 .总体积差相关系数的区间估计:(1)将样本相关系数 r转换为费舍Zr值,转换方法:Excel统计函数FISHER1(2)计算Zr的标准误SEZr

20、: SEZrJ- n 3(3)计算总体乙值白1 1- “置信区间:置信区间为:Zr Z0.05 2SEZr Zr置信区间为:Zr Z0.012SEzr Zr(4)计算总体相关系数p值的置信区间乙 Z 2SEzr1.96.n 32.58 .n 3:将总体ZP值区间上、下限进行费舍逆转换转换方法:Excel统计函数FISHERINV5.总体比率(比例)的区间估计n? 5, n(? 5时,样本比率 ?的抽样分布渐近正态分布。I总体比率的置信区间为: ? 1.96SEp p 1.96 J-p?n总体比率的置信区间为:? 2.58SEp p第八章假设检验在Z检验中:双侧检验临界值:单侧检验临界值: 单侧

21、显着性概率 双侧显着性概率 在t检验中:单侧显着性概率双侧显着性概率1.单个样本Z检验Z 0.05/2 =Z 0.01/2 =Z0.05 =Z0.01 =P: =1-NORMSDIST( ABS (Z 值)P: =(1-NORMSDIST(ABS(Z 值)*2P: =TDIST (ABS (t 值),df , 1)P: =TDIST (ABS (t 值),df , 2)主要用途:分析单个样本均数X与已知的总体均值 科0的有无显着差异,2已知;2虽然未知,但样本容量2也未知,样本容量n 30 ;n 30。适用条件:(1)总体呈正态分布,总体方差(2)总体是正态分布,总体方差(3)即使总体非正态分

22、布,总体方差Z X_0_或 Z _0_/vnSvni2 .单个样本t检验主要用途:用于分析单个样本均数X与已知的总体均数 科0的差异,适用条件:(1)总体呈正态分布,总体方差(2)总体非正态分布,总体方差2未知,样本容量 n 30的情况下2未知,样本容量 n 30的情况下df n 13 .单个样本比率 Z检验p与已知比率po有无显着差异。主要用途:根据一个样本的比率 ?,分析样本所代表的总体比率 适用条件:np0 5, nq0 5Z ? PoPo (1 Po)n n4 .两独立样本比率差异 Z检验主要用途:根据两个独立样本的比率?1 ?2,推断两总体比率 Pi、P2有无显着差异适用条件:两个样

23、本相互独立,n1?1, n2?2, n1?1, n2?2都 5?1?2(n1?n2?2)(n1?2)n1n2(n1n2)5 .两独立样本方差齐性检验主要用途:根据相互独立的两个样本的方差,推断两个总体的方差是否相等或是否有显着差异。分子方差的自由度df=巾-1 ,分母方差的自由度df= n2-1F大的S21 1-621) 小的 S221n2S2 (n2 1)双侧显着性概率 P值:=FDIST (F值,分子自由度,分母自由度)*26.相关样本t检验主要用途:(1)根据一组被试前、后两次测评结果,推断两次测验结果的总体均数有无显着差异。(2)根据实验组和配对对照组测评结果,推断实验组和对照组的总体均数有无显着

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论