心理统计与测量.doc_第1页
心理统计与测量.doc_第2页
心理统计与测量.doc_第3页
心理统计与测量.doc_第4页
心理统计与测量.doc_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

心理统计与测量心理统计与测量.txt2机会靠自己争取,命运需自己把握,生活是自己的五线谱,威慑呢们不亲自演奏好它?心理统计与测量第一章 描述统计第一节 统计图表一、统计图(一)统计图的结构及其绘制规则 统计图由标题、图号、标目、图形、图注等项构成。下面按其构成部分说明绘图的基本规则。 标题图的名称应简明扼要,切合图的内容,必要时可注明时间、地点。 图号文章中若有几幅画,则需按其出现的先后次序编上序号,写在图题的作前方。 标目对于有纵横轴的统计图,应在纵横轴上分别标明统计项目及其尺度。 图形图形线在图中为最粗,而且要清晰。 图注图注不是图中必要组成部分。 (二)表示间断变量的统计图 1、直条图 直条图是用直条的长短表示统计事项数量的图形。它主要是用来比较性质相似的间断性资料。 2、圆形图 圆形图是用来表示间断性资料构成比的图形。 (三)表示连续变量的统计图 1、线形图 线形图用来表示连续性资料。它能表示两个变量之间的函数关系;一种事物随另一种事物变化的情况;某种事物随时间推移的发展趋势等。 2、频数分布图 常用的频数分布图有直方图、多边图和累积多边图。 (1)直方图 直方图用面积表示频数分布。用各组上下限上的矩形面积表示各组频数。 (2)多边图 多边图以纵轴上的高度表示频数的多少。 (3)累积频数和累积百分比多边图 二、统计表(一)统计表的结构及其编制的原则和要求。 统计表一般由标题、表号、标目、线条、数字、表注等项构成。 标题标题是表的名称,应确切地、简明扼要地说明表的内容。 表号表号是表的序号。 标目标目是表格中对统计数据分类的项目。 线条线条不宜过多。 数字表内数字必须准确,一律用阿拉伯数字表示,位次对齐,小数的位数一致。 表注它不是表的必要组成部分。 (二)统计表的总类 1、简单表 只列出观察对象的名称、地点、时序或统计指标名称的统计表为简单表。 2、分组表 只按一个标志分组的统计表为分组表。 3、复合表 按两个或两个以上标志分组的统计表为复合表。 (三)频数分布表列法 1、简单频数分布表 (1)间断变量的频数分布表 (2)连续变量的频数分布表 步骤:求全距决定组数和组距决定组限决定组限登记频数 2、累积频数和累积百分比分布表 (1)累积频数分布表 用累积频数表示的频数分布表称为累积频数分布表。 (2)累积百分比分布表 累积百分比分布表是累积频数分布表的变型。它是用累积百分比表示的频数分布表。第二节 集中量数一、算术平均数(一)算术平均数的概念 算术平均数是所有观察值得总和除以总频数所得之商,简称为平均数或均数。 算术平均数的特征: (1)观察值的总和等于算术平均数的N倍; (2)各观察值与其算术平均数之差的总和等于零; (3)若一组观察值是由两部分(或几部分)组成,这组观察值的算术平均数可以由组成部分算术平均数而求得;(二)算术平均数的应用及其优缺点 算术平均数具备一个良好的集中量所应具备的一些条件: (1)反应灵敏。 (2)严密确定。简明易懂,计算方便。 (3)适合代数运算。 (4)受抽样变动的影响较小。 除此之外,算数平均数还有几个特殊的优点: (1)只知一组观察值的总和及总频数就可以求出算术平均数。 (2)用加权法可以求出几个平均数的总平均数。 (3)用样本数据推断总体集中量时,算术平均数最接近于总体集中量的真值,它是总体平均数的最好估计值。 (4)在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。 算术平均数的缺点: (1)易受两极端数值(极大或极小)的影响。 (2)一组数据中某个数值的大小不够确切时就无法计算其算术平均数。 二、中 数(一)中位数的概念 中位数是位于依一定顺序排列的一组数据中央位置的数值,在这一数值上、下各有一半频数分布着。 (二)中位数的计算方法 1、原始数值计算方法 将一组原始数据依大小顺序排列后,若总频数为奇数,就以位于中央的数据作为中位数;若总频数为偶数,则以最中间的两个数据的算术平均数作为中位数。 2、频数分布表计算法 若一组原始数据已经编成了频数分布表,可用内插法,通过频数分布表计算中位数。 (三)百分位数的概念及其计算方法 百分位数是位于依一定顺序排列的一组数据中某一百分位置的数值。在心理测量中,常通过计算百分位数来说明、解释和评价分数在团体中所处的位置。计算公式为。 (四)中位数的应用及其优缺点 中位数虽然也具备一个良好的集中量所应具备的某些条件,例如比较严格确定、简明易懂,计算简便,受抽样变动影响较小,但是它不适合进一步的代数运算。它适用于以下几种情况:(1)一组数据中有特大或特小两极端数值时;(2)一组数据中有个别数据不确切时;(3)资料属于等级性质时。三、众数(一)众数的概念 众数是集中量的一种指标。对众数有理论众数及粗略众数两种定义方法。理论众数是指与频数分布曲线最高点相对应的横坐标上的一点。粗略众数是指一组数据中频数出现最多的那个数。 (二)众数的计算方法 1、用观察法直接寻找粗略众数 粗略众数不需要计算,可通过观察直接寻得。 2、用公式求理论众数的近似值 (1)皮尔逊(K.Person)的经验法 利用皮尔逊发现的算术平均数、中位数、众数三者关系来求理论众数近似值的经验公式为(3.6)。 (2)金氏(W.I.King)插补法 当频数分布呈偏态,即众数所在组以上各组频数总和与以下各组频数总和相差较多时,可以用金氏公式计算众数,以进行比率调整。其公式为(3.7)。 (三)众数的应用及其优缺点 众数虽然简明易懂,但是它并不具备一个良好的集中量的基本条件。它主要在以下情况下使用:(1)当需要快速而粗略地找出一组数据的代表值时;(2)当需要利用算术平均数、中位数和众数三者关系来粗略判断频数分布的形态时;(3)利用众数帮助分析解释一组频数分布是否确实具有两个频数最多的集中点时。第三节 差异量数一、离差与平均差(一)离差:每一个数据与该组数据的算术平均数的差。(二)平均差1、平均差的概念 所谓平均差,就是每一个数据与该组数据的中位数(或算术平均数)离差的绝对值的算术平均数。 2、平均差的计算方法 用原始数据计算平均差的公式为(4.3) 3、平均差的优缺点 平均差意义明确,计算容易,每个数据都参加了运算,考虑到全部的离差,反应灵敏。但计算要用绝对值,不适合代数运算。 二、方差与标准差(一)方差和标准差的概念 方差是指离差平方的算术平均数。其定义公式为(4.5),计算公式是(4.7)。 标准差是指离差平方和平均后的方根。即方差的平方根。其定义公式为(4.6),计算公式是(4.8)。 (二)方差和标准差的应用及其优缺点 方差和标准差的优点:反应灵敏,随任何一个数据的变化而表示;一组数据的方差和标准差有确定的值;计算简单;适合代数计算,不仅求方差和标准差的过程中可以进行代数运算,而且可以将几个方差和标准差综合成一个总的方差和标准差;用样本数据推断总体差异量时,方差和标准差是最好的估计量。 三、变异系数 (一) 所谓差异系数是指标准差与其算术平均数的百分比。它是没有单位的相对数。其计算公式是(4.11) (二)差异系数的用途 1、比较不同单位资料的差异程度 2、比较单位相同而平均数相差数较大的两组资料的差异量程度 3、可判断特殊差异情况 (三)差异系数的应用条件 从测验的理论来说,只有等比量表才使平均数等于零成为不可能。也就是说,用来测量的量尺,既具有等距的单位,又具有绝对零点,这时所测量出的数据其平均数才不可能等于零,这时才能计算差异系数。 第四节 相对量数一、百分位数公式:二、百分等级公式:三、标准分数(一)公式(二)性质1、Z分数无实际单位,以平均数为参照点,以标准差为单位的一个相对量2、一组原始分数转换得到的Z分数可以是正,也可是负。3、在一组数据中,各个Z分数的标准差是1。4、若原始分数呈正态分布,则转换得到的所有Z分数数值的均值为0,标准差为1的正态分布。(三)优点1、可比性2、可加性3、明确性4、稳定性(四)应用1、用于比较几个分属性质不同的观测值在各自数据分布中相对位置的高低。2、计算不同质的观测植的总和或平均值,以表示在团体中的相对位置。3、表示标准测验分数五、相关量数1、积差相关适用资料:两列变量为正态等距,呈线性关系公式:2、等级相关适用于等级变量的资料(1)斯皮尔曼相关适用于两列变量均为等级变量的呈线性相关的资料公式:D为各对偶等级差(2)肯德尔和谐系数适用于K个评价者,评价多个事物的等级变量资料,多用于评分者信度分析。公式:有相同等级3、点二列相关 适用于一列为等距正态变量的测量数据,另一列为名义变量数据。常应用于试卷的信度分析。公式:其中 是两个二分变量对偶的连续变量的平均数, p 、 q 是二分变量各自所占的比率, p+q=1 , S t 是连续变量的标准差 4、二列相关适用于两列变量均为正态等距变量,但一列被人为的分为两类。其中 S T 与 是连续变量的标准差与平均数, y 为 P 的正态曲线的高度 5、相关当两个相关关联着的变量分布都是真正的二分变量,列联表系数。公式: 第二章 推断统计第一节 推断统计的数学基础一、概率(一)概率的定义 概率因寻求的方法不同有两种定义,即后验概率和先验概率。 1、后验概率的定义 以随机事件A在大量重复试验中出现的稳定频率制作为随机事件A概率的估计值,这样寻得的概率称为后验概率。计算公式是 P(A)=lim m/n 2先验概率的定义 先验概率是通过古典概率模型加以定义的,故又称为古典概率。古典概率模型要求满足两个条件:(1)试验的所有可能结果是有限的;(2)每一种可能结果出现的可能性(概率)相等。若所有可能结果的总数为n,随机事件A包括m个可能结果。(二)概率的性质 1、任何随机事件A的概率都是介于0与1之间的正数; 2、不可能事件的概率等于0; 3、必然事件的概率等于1。 (三)概率的加法和乘法 1、概率的加法 在一次试验中不可能同时出现的事件称为互不相容的事件。 两个互不相容事件和的概率,等于这两个事件概率之和。 P(a+b)=P(a)+P(b) 2.概率的乘法 A事件出现的概率不影响B事件出现的概率,这两个事件为独立事件。 两个独立事件的概率,等于这两个事件概率的乘积。 P(A1,A2An)=P(A1),P(A2)P(An) 二、正态分布正态分布是一种连续型随机变量的概率分布。 (一)正态曲线 1正态曲线函数 正态曲线的函数式是公式 标准正态分布的函数式是公式 2.正态曲线的特点 (1)曲线在Z=0处为最高点。 (2)曲线以Z=0处为中心,双侧对称。 (3)曲线从最高点向左右缓慢下降,并无限延伸,但永远不与基线相交。 (4)标准正态分布上的平均数为0,标准差为1。 (5)曲线从最高点向左右延伸时,在正负1个标准差是拐点。 (二)正态曲线的面积与纵线 1、累积正态分布函数 2、标准正态分布下面积的求法 3、正态曲线的纵线 (三)正态分布在测验计分方面的应用 1、将原始分数转换成标准分数 标准分数的意义:第一,各科标准分数的单位是绝对等价的;第二、标准分数的正负和大小可以反映出考生在全体考分中所处的地位。 2、确定录用分数线 3、确定等级评定的人数 三、二项分布(一)二项试验 满足以下条件的试验称为二项试验:(1)一次试验只有两种可能结果,即成功和失败;(2)各次试验相互独立,互不影响;(3)各次试验中成功的概率相等。 (二)二项分布函数 二项分布是一种离散型随机变量的概率分布。 用n次方的二项展开式来表达在n次二项试验中成功事件出现不同次数(X=0,1,n)的概念分布叫做二项分布。 二项展开式的通式(5.8)就是二项分布函数,运用这一函数式可以直接求出成功事件恰好出现X次的概率。 (三)二项分布图 从二项分布图可以看出,当p=q,不管n多大,二项分布呈对称形。当n很大时,二项分布接近于正态分布。当n趋近于无限大时,正态分布是二项分布的极限。 (四)二项分布的平均数和标准差 当二项分布接近于正态分布时,在n次二项实验中成功事件出现次数的平均数和标准差分别可以由公式(前提np5且nq5 )平均数M=np 标准差r=npq1/2(五)二项分布的应用 二项分布函eg:1.某市参加一考试2800人,录取150人,平均分数75分,标准差为8。问录取分数定为多少分?解: XN(75.82) Z=(x-#)/x=(x-15)/8 N(0,12) P=150/2800=0.053 0.5-0.053=0.447 Z=1.615 X=1.615*8+7588(分)2某高考,平均500分,标准差100分,一考生650分,设当年录取10,问该生是否到录取分?解: Zo=(650-500)/100=1.5 (XN(500,1002)(ZN(0,12) Po=0.5-0.43319=0.06681=6.681%30)为渐近正态分布公式同上2、方差及标准差分布公式:(二)t分布公式:1、特点:平均值为0以平均值0左右对称的分布变量取值从负无穷到正无穷 当样本容量趋于无穷时,t分布为正态分布,方差为1。2、t分布表的应用3、样本平均数分布(1)总体正态,方差未知,公式:(2)总体非正态,方差未知,满足n30,近似t分布(三)2 分布1、抽样原理2、公式:3、特点:2 分布是正偏态分布 2 值都是正的 2 分布的和也是2 分布如果df2,这时2 = df,22 =2df 2 分布是连续型分布4、 2 分布表(四)F分布1、F分布的原理2、公式:3、特点:正偏态分布 正值 当分子的自由度为1,分母的自由度为任意值时,F分布与分母自由度相同概率的t值的平方相等。4、F分布表第二节 参数估计一、点估计、区间估计与标准误1、点估计 用某一样本统计量的值来估计相应总体参数的值叫总体参数的点估计。 2、区间估计 以样本统计量的抽样分布(概率分布)为理论依据,按一定概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。 区间估计涉及置信水平和置信区间。 二、总体平均数的估计(一)、已知条件下总体平均数的区间估计 当总体已知,总体呈正态分布,样本容量无论大小时,或者当总体已知,总体虽不呈正态分布,但样本容量较大(n 30)时,样本平均数与总体平均数离差统计量均呈正态分布。区间估计的计算公式为(6.8)和(6.9)。 (二)、未知条件下总体平均数的区间估计 1、未知条件下总体平均数的区间估计的基本原理 当总体未知,总体呈正态分布,样本容量无论大小时,或者当总体未知,总体虽不呈正态分布,但样本容量较大(n 30)时,样本平均数与总体平均数离差统计量均呈t分布。区间估计的计算公式为(6.10)和(6.11)。 2、小样本的情况 3、大样本的情况 可以用正态分布近似处理。 三、标准差和方差的区间估计第三节 假设检验一、假设检验的原理利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断,称为假设检验。 (一)假设 假设检验一般有两个相互对立的假设。即零假设(或称原假设、虚无假设、解消假设)和备择假设(或称研究假设、对立假设)。假设检验是从零假设出发,视其被拒绝的机会,从而得出决断。 (二)小概率事件 把出现小概率的随机事件称为小概率事件。小概率事件是否出现,这是对假设作出决断的依据。 (三)显著性水平 拒绝零假设的概率称为显著性水平。显著性水平和可靠性程度之间的关系是:两者之和为1。 (四)统计决断的两类错误及其控制 如果拒绝了属于真实的零假设,即如果样本统计量的总体参数正是假设的总体参数,但是由于样本统计量的值落入了拒绝区域。而零假设遭到拒绝,这时就会犯第一类型的错误。这种错误的可能性大小正是显著性水平的大小,故又称这类错误为错误。如果保留了属于不真实的零假设,就会犯第二类型的错误。犯这种“假设属伪而被保留”的第二类错误的概率,等于值,故又称这类错误为错误。 要使第一类错误的概率保持在需要的水平上,而控制第二类错误的概率,有以下方法:(1)利用已知的实际总体参数与假设参数值之间的大小关系,合理安排拒绝领域的位置,选择双侧检验还是单侧检验,左侧检验还是右侧检验;(2)加大样本容量。 二、样本与总体样本平均数差异的检验总体平均数的显著性检验的适用公式与相应的参数估计一脉相承。 (一)已知条件下总体平均数的显著性检验 (二)未知条件下总体平均数的假设检验 1、小样本的情况 2、大样本的情况 三、两样本平均数差异的检验(一)相关样本平均数差异的显著性检验 两个样本内个体之间存在着一一对应的关系,这两个样本称为相关样本。相关样本有以下两种情况: (1)用同一测验对同一组被试在试验前后进行两次测验,所获得的两组测验结果是相关样本。 (2)根据某些条件基本相同的原则,把被试一一匹配成对,然后将每对被试随机地分入实验组和对照组,对两组被试施行不同的实验处理之后,用同一测验所获得的测验结果,也是相关样本。 相关样本平均数差异的显著性检验方法和步骤: (1)提出假设 (2)选择检验统计量并计算其值。在小样本情况下,其检验统计量为公式(7.9);在大样本情况下用公式(7.12)。 (3)确定检验形式 (4)统计决断 (二)独立样本平均数差异的显著性检验 两个样本内的个体是随机抽取的,它们之间不存在一一的对应关系,这样的两个样本称为独立样本。 1、独立大样本平均数差异的显著性检验 两个样本容量n1和n1都大于30的独立样本称为独立大样本。 独立大样本平均数差异的显著性检验所用的公式是(7.17)。 2、独立小样本平均数差异的显著性检验 两个样本容量n1和n1均小于30,或其中一个小于30的独立样本称为独立小样本。 独立小样本平均数差异的显著性检验方法: (1)方差齐性时 如果两个独立样本的总体方差未知,经方差齐性检验表明两个总体方差相等,则统计量公式为(7.23)(7.25),这三个公式是等价的。 (2)方差不齐性时 对于方差不齐性的两个独立样本平均数差异显著性检验,需要用校正的t作为检验统计量,用公式(7.26),t的临界值则用公式(7.29)和(7.32)来计算。 四、方差齐性检验1、F分布 若从方差相同的两个正态总体中,随机抽取两个独立样本,以此为基础,分别求出两个相应总体总体方差的估计值,这两个总体方差估计值的比值称为F比值,F比值的抽样分布称为F分布。F分布的形态随F比值分子和分母中自由度的变化而形成一簇正偏态分布。 一般情况下,经常应用的是右侧F检验,计算F值时,将大的总体方差估计值作为分子,小的作为分母。 2、两个独立样本的方差齐性检验 用公式(7.35)。 3、两个相关样本的方差齐性检验 用公式(7.38)。 五、相关系数的显著性检验(一)积差相关系数的显著性检验1、=02、0(二)其他类型的相关系数的显著性检验略(三)相关系数差异的显著性检验1、r1, r2分别由两组彼此独立的被试得到2、两个样本相关系数由同一组被试算得。第四节 方差分析一、方差分析的原理与基本过程(一)基本原理:综合的F检验1、综合虚无假设与部分虚无假设2、方差的可分解性(二)基本过程1、求平方和总平方和组间平方和组内平方和2、计算自由度3、计算均方4、计算F值5、查F值表进行F检验并做出决断6、陈列方差分析表二、完全随机设计的方差分析 为了检验某一个因素多种不同水平间的差异的显著性,将从同一个总体中随机抽取的被试,再随机地分入各实验组,施以各种不同的实验处理以后,用方差分析法对这多个独立样本平均数差异的显著性进行检验,称为完全随机设计的方差分析。 1、n 相等的情况 2、n 不相等的情况 3、运用样本统计量进行组间与组内方差的F检验 三 、随机区组设计的方差分析 用方差分析法对多个相关样本平均数差异所进行的显著性检验,称之为随机区组设计的方差分析 每一区组内被试的人数分配有以下三种方式: (1)一个被试作为一个区组; (2)每一区组内被试的人数是实验处理数的整数倍; (3)区组内以一个团体为一个基本单元。 区组平方和等数据的计算用公式 四、两因素方差分析以两因素完全随机设计为例1、基本特点: 研究中有两个自变量,每个自变量有两个或多个水平 如果一个自变量有p个水平,另一个自变量有q个水平,实验中就含有p q个处理。2、交互作用:单因素与多因素的区别 一个因素的各水平在另一个因素的不同水平上变化趋势不一致,以致如果只区分每个因素的单独作用,并不能揭示因素水平之间的复杂关系。五、事后检验如果组间差异显著,就必须多各实验处理组的多对平均数进一步分析,做深入比较,判断究竟是哪一对或哪几对的差异显著,哪几对不显著,确定两变量关系的本质。这就是事后检验,或事后多重比较。(一)为什么不能用t检验对多个平均数的差异进行比较 同时比较的平均数越多,其中差异较大的一对所的t值超过原来临界值的概率就越大(二)N-K检验法 步骤:(1)把要比较的各个平均数从小到大等级排列(2)根据比较的等级r,自由度df,查附表的q值(3)求样本平均数的标准误。公式为:(4)用标准误乘以q的临界值就是对应于某一个r值的两个平均数相比较时的临界值,如果这两个平均数的差异大于(q0.05 *SE),则认为这两个平均数在0.05水平差异显著,若小于则认为两个平均数之间差异不显著。第五节 回归分析一 、 一元线性回归分析 一元线性回归是指只有一个自变量的线性回归。 (一)回归线 一条最能代表散点图上分布趋势的直线,这条最优拟合线即称为回归线。常用的拟合这条回归线的原则,就是使各点与该线纵向距离的平方和为最小。(二)回归方程 确定回归线的方程称回归方程。 1用最小二乘方法求回归系数 公式(12.2a)或(12.2b)。 2. 求截距 公式(12.3a)或(12.3b)。 (三)用原始数据计算回归系数 公式(12.4a)或(12.4b)。 二、一元线性回归方程的检验 (一)估计误差的标准差 公式(12.9)。 (二)一元线性回归方程检验的方法 一元线性回归方程检验有三种等效的方法: (1)对回归方程进行方差分析; (2)对两个变量的相关系数进行与总体零相关的显著性检验; (3)对回归系数进行显著性检验 (三)一元线性回归系数显著性检验方法 在回归线上,当与所有自变量X相对应的各组因变量Y的残值都呈正态分布,并且残值方差为齐性时,由X估计Y回归系数的标准误为公式(12.11)或(12.12)。可以用公式(12.13)或公式(12.14)进行显著性检验。 (四)测定系数 测定系数指回归平方和在总平方和中所占比例,这个比例越大,意味着误差平方和所占比例越小,预测效果就越好。测定系数同时等于相关系数的平方。三、 一元线性回归方程的应用 (一)用样本回归方程推算因变量的回归值 (二)对因变量真值的预测 第六节 卡方检验卡方检验的假设:1、分类相互排斥,互不包容2、观测值相互独立3、期望次数的大小每一个单元格中的期望次数不小于5 卡方检验的基本公式:一、拟合度检验 主要用来检验一个因素的多项分类的实际观察数与某理论次数是否接近,这种卡方检验的方法有时也称为无差假说检验。当对连续数据的正态性进行检验时,这种检验又可称为正态吻合性检验。 (一)拟合度检验的一般问题 1 、统计假设 拟合度检验的研究假设是实际观察次数与某理论次数之间差异显著,虚无假设为实际观察次数与理论次数之间无差异或相等。 2 、自由度的确定 与下列两个因素有关: (1 )实验或调查中分类的项数 (2 )计算理论次数时,用观察数目的统计量的个数。 自由度的计算一般为资料的分类或分组的数目,减去计算理论次数时所用的统计量的个数。3 、理论次数的计算 一般是根据某种理论,按一定的概率通过样本即实际观察次数计算。某种理论有经验概率也有理论概率 ,应依据实际情况而定。(二)拟合度检验的应用 1 、检验无差假说 2 、检验假设分布的概率(三)连续变量分布的吻合性检验(四)比率或百分数的拟合度检验(五)二项分类的拟合度与比率显著性检验的一致性二、独立性检验 用来检验两个或两个以上因素各种分类之间是否有关联或是否具有独立性问题。 两个因素是指所要研究的两个不同事物。比如:性别与态度(一)独立性检验的一般问题与步骤1、统计假设2、理论次数的计算公式:3、自由度的确定4、统计方法的选择5、结果解释(二)四格表独立性检验1、独立样本当理论次数fe5,用基本公式计算或用下面的公式:2、相关样本公式:第七节 非参数检验假设检验的方法有两种:参数检验和非参数检验。 在实际研究工作中,样本所属的总体分布形态一般是未知的,所获得的资料也不一定是等距变量或比率变量,因此需要采用新的统计方法进行检验。这种检验方法不要求样本所属的总体呈正态分布,一般也不是对总体进行检验,故称之为自由分布的非参数检验方法。非参数检验不仅适用于非正态总体名义变量和次序变量的资料,而且也适用于正态总体等距变量和比率变量的资料。故应用广泛,但灵敏度和精确度不如参数检验。 一、独立样本均值差异的非参数检验 (一)秩和检验 当比较两个独立样本的差异时,可以采用曼-惠特尼(Mann-Whitney)两人提出的秩和检验方法。又称曼-惠特尼U检验法。 1、小样本的情况 当两个独立样本的容量n1和n2都小于10,并且n1n2时,可以用查表法。 2、大样本的情况 当两个独立样本的n1和n2都大于10,T分布接近与正态,对于两个样本的差异可以用正态分布的Z比率进行检验。公式(13.8)。 (二)中位数检验 中位数的检验方法是将各组样本数据合在一起找出共同的中位数,然后分别计算每个样本在共同中位数上、下的频数,再进行rc表卡方检验。 二、相关样本的非参数检验(一)符号检验 符号检验是通过多两个相关样本的每对数据之差的符号(正号或负号)进行检验,以比较这两个样本差异的显著性。 1、小样本的情况 当样本容量较小,n 25时,二项分布接近正态分布,因此可以用正态分布近似处理,公式用(13.2)。 (二)符号秩序检验 威尔科克逊(F.Wilcoxon)提出了既考虑差数符号,又考虑差数大小的符号秩次检验法。 1、小样本的情况 当样本容量n 25时,二项分布接近与正态。于是可用正态分布近似处理。 检验统计量为公式(13.5)。 心理与教育统计学复习思考题(第一部分)简述条图、直方图、圆形图(饼图)、线图以及散点图的用途简述T检验和方差分析法在进行组间比较上的区别和联系简述Z分数的应用简述方差分析法的步骤简述方差和差异系数在反映数据离散程度上的区别和联系简述完全随机化设计和随机区组设计进行方差分析的区别简述假设检验中两类错误的区别和联系简述多重比较和简单效应检验的区别简述卡方检验的主要用途简述平均数显著性检验和平均数差异显著性检验的区别和联系简述假设检验中零假设和研究假设的作用简述什么是抽样分布简述统计量和参数的区别和联系(第二部分)简要回答下面的问题应当用何种统计方法进行分析(不需计算)1、某研究者欲研究学习动机和学习成绩之间的关系,用动机量表测得学生的学习动机,再用标准化学绩考试测得成绩,两组数据均可视为连续等距数据。如果学生的成绩是教师的等级评定分,又应如何分析?2、为研究职业类型(工人、农民、教师、公务员、商人)对幸福感(幸福、不幸福)是否有影响,应选用什么样的统计方法?3两考生的高考成绩五科如下表,已知所有考生各科成绩的平均数和标准差,如何判断两考生高考成绩哪一个更好?4假设某次人事选拔考试分数服从正态分布,平均数和标准差分别为75,10,现欲选出40%高分者录用,问分数线应当定成多少?5某校长根据自己的经验预测今年高考全区的平均分为530分,全区3400名毕业生高考平均成绩为520分,标准差112。问该校长的预测是否准确?6假设某考生在高考中,语文得110分,数学得125分。如果所有考生的语文平均分为90,标准差为10;数学平均分为100,标准差为15分。那么,相对而言这个考生哪方面能力更强?语文数学英语物理化学甲生100120115125130乙生1101151201301257在缪勒莱尔错觉实验中,为了研究夹角对错觉量的影响,随机抽取了18名被试,考虑到学生之间的个体差异,每名被试都在15度、45度和60度三种夹角下进行错觉实验现在需要求三种夹角下错觉量差异是否显著用什么方法? 8、16名小学生随机分成4组,每组被试分别解决一种算术问题:加、减、乘、除,各10道,记录下平均解题时间,问小学生解决四类问题的解题时间有否显著差异。9在一个研究汽车尾灯用什么颜色能最快地引起后面车辆驾驶员反应的实验中,选取了8名被试在红光、绿光和黄光三种情况下均测试他们的反应时,试判断其反应快慢的差异是因为个体差异还是因为不同颜色所致?10.对24名儿童的智商进行了配对,得到3个分组,智力水平分别为高、中、低,每个组的儿童又随机分成两组分别采用两种方法学习解九连环,一种是完全讲授式,教师重复地讲解游戏玩法;另一种是互动式,将试讲完一遍后让儿童自己摸索,学习时间相等。问两种学习方法的效果有无差异。第三章 心理测量的基本理论第一节 心理测量的理论基础一、 心理测量的基本概念(一)测量的定义 简单地说,测量就是根据一定的法则用数字对事物加以确定。 所谓“一定的法则”,指的是在测量时所采用的规则或方法。例如,用秤测物体的重量,依据的是杠杆原理, 使用好的法则,可以得到准确的测量效果,使用坏的法则,则会得到不准确的测量效果。许多事物易于测量,因其使用的法则易于确立和遵守,心理现象难以测量,是因为我们很难设计清晰而良好的法则。随着人类认识的发展,测量法则不断完善,测量也就越来越真确。所谓“事物”,指的是我们所感兴趣的东西,说得更明确些,是引起我们兴趣的事物的属性或特征。测量就是确定这些属性或特征的差异。人与人的差别不只表现在有高有矮,有强有弱,有人跑得快、有人跳得高等身体外貌和体力特点上,也表现在较为抽象的心理能力和人格特点方面。例如有人活泼好动,有人沉静安详,有人勇敢豪放,有人谦逊细心,有人过目不忘,有人思维敏捷,有人精于数理工程,有人擅长文学艺术等等。所有这些特性都是心理测量的对象。 所谓“数字”,是个比数值意义更广泛的概念,可以表示数量,也可以不表示数量。一般说来,用数字对事物加以确定,就是确定出一个事物或事物的某一属性的量。但有时也可把数字当作一种事物的符号,而不反映事物的量,如“1班、2班、3班”等。通常人们说的测量,指的是前一种情况, 即根据特定的法则,采用一定的操作程序,给事物确定出一种数量化的价值。(二)测量的要素1参照点要确定事物的量,必须有一个计算的起点,这个起点叫参照点。参照点不同,测量的结果便无法相互比较。参照点有两种:一种是绝对的零点,如测量轻重、长短,都以零点为参照点,即以“恰恰没有一点重量”、“恰恰没有一点长度”为计算的起点。另一种人定的参照点,如以海平面为测量陆地高度的起点,以冰点为测量温度的起点,这些都是人定的参照点。理想的参照点是绝对零点。心理测量中所用的参照点都是人定的,此种参照点有一个极大的限制,就是从该点起计算的数值不能以“倍数”的方式解释。如甲的智商为100,乙的智商为50,不能说甲的智力是乙的二倍,因为没有零智力。 好的单位须符合两个条件,一为有确定意义,即同一单位在大家看来意义相同,不允许有不同的解释。二为有相等的价值,即第一单位与第二单位间的距离等于第二单位与第三单位间的距离。 (三)测量的量表 要测量某个事物,必须先有一个定有单位和参照点的连续体,将要测的每个事物放在这个连续体的适当位置上,看他们距参照点的远近,便会得到一个测量值这种连续体就叫量表。1命名量表这是测量水平最低的一种,只是用数字来代表事物或把事物归类。因为这里的数字没有数量化的关系,所以也有人认为它不能算是测量。这种量表又可分为两种,(1)代号用数字来代表个别事物,如学生和运动员的编号等。(2)类别用数字来代表具有某一属性的事物的全体,即把某些事物确定到不同性质的类别里,如用1代表男,用2代表女,或用不同数字代表不同职业等。在命名量表中,数字只用来作标记和分类,而不能作数量化分析,既不能说ABC,也不能做加,减,乘,除的运算。它所适用的统计有次数、众数、百分比、偶发事物相关(如四分相关,相关)以及x2考验等。2二次序量表它比命名量表水平高,不但指明类别的大小或含有某种属性的多少,如学生的考试名次、工资级别、能力等级、对某事物时喜爱程度等等。这里的数字包含有数量关系,代表符号是“”, 如ABC等,主要用于分等(当然也包含了分类)。在次序量表中,既无相等单位,又无绝对零点,数字仅表示等级。并不表示某种属性的真正量或绝对值。它所适用的统计有中位数,百分位数、斯皮尔蔓等级相关系数和肯德尔和谐系数等,但不能做加、减、乘、除运算。3等距量表它比次序量表又进一步,不但有大小关系,而且一定数量的差异在整个量表的所有部分都是相等的,也就是具有相等的单位,其数值可相互做加、减运算,但没有绝对的零点,因此不能做乘除运算。典型例子是温度计,10与15的差别,同15与20的差别是一样的,我们可以说某物温度比另一物高多少,但不能说某物温度是另一物的多少倍,因为它的零点是人定的,0并不意味着没有温度。等距量表的数值加或减一个常数或用一个常数乘或除,不会破坏原来数据之间的关系,因此一个量表上的数值可以转换为另一个具有不同单位的量表上的数值,而且几个不同单位的测值可以转换到一个通用量表上以便于比较。如摄氏10度可以转换华氏50度。用此种量表获得的数值可计算平均数、标准差、积差相关、阶层相关,并作T和F检验。4比率量表是最高水平的量表,既有相等单位又有绝对零点。此种量表在物理测量中容易见到,长度、重量、时间等都是。所得的数值可做加,减,乘、除运算。如体重:甲80公斤,乙40公斤,我们既可以说甲的体重比乙多40公斤,也可以说甲的体重是乙的2倍。比率量表所适用的统计除上述几种外,还可以计算几何均数及变异系数等。(四)什么是心理测量 所谓心理测量,就是根据一定的法则用数字对人的行为加以确定。即依据一定的心理学理论,使用一定的操作程序,给人的行为确定出一种数量化的价值。1、 测验的定义 “测验”一词虽为大家所熟悉,但要给测验下一个严格的定义却并不容易。目前,关于测验有许多定义,笔者较为赞成美国心理与教育测量学家布朗(F?G?Brown)的说法:测验是 “测量一个行为样本的系统程序”。通俗地说,心理测验就是通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析一种科学手段。首先,测验测量的是人的行为,严格地讲,只是测量了做测验的行为,也就是一个人对测验题目所进行的反应。在这个意义上可以说,测验即引起某种行为的工具。其次,一个测验不可能包含所要测量的行为领域的所有可能的题目,它所包含的只是全部可能题目的一个样本。当然,也有例外的情况;例如对幼儿施测一个10以内数字的加法测验,就可以包括两个一位数字加法的全部各种组合。但这种情况是极少的,由于测验只是测量一个行为样本,因此测验题目的取样必须有代表性,而且在用同一领域的另一个等值的样本时,应该得到同样的分数。 第三,在编制、施测、评分和解释方面依据一套系统的程序。这种按照严格的科学程序去编制和使用的测验称之为标准化测验。标准化有三点好处,一是可以减少无关因素测验目的的影响,使测量准确、客观。二是有统一标准,便于对不同人的测验成绩进行比较和交流。三是同一份测验可用于许多人并可反复使用,较为经济。2、心理测量的性质 (1)心理测量的间接性 所谓特质是描述一组内部相关或内在联系的行为时所使用的术语,是在遗传与环境影响下,个人对刺激作反应的一种内在倾向。例如,一个人喜欢阅读机械杂志,喜欢观看各种机器运转,热心为别人修理钟表、自行车,由此我们便可推论此人具有机械兴趣的特质。 可见,特质乃是个体特有的(与他人不同)、稳定的(表现于多种情况)、可辨别的(可与其他特征分开)特征。但它又是一个抽象的产物,一个构想,而不是一个被直接测量到的有实体的个人特点。由于特质是从行为模式中推论出来的,所以心理测量永远是间接的。 (2)心理测量的相对性 在对人的行为做比较时,没有绝对的标准,亦即没有绝对零点,我们有的只是一个连续的行为序列;所谓测量就是看每个人处在这个序列的什么位置上,由此测得一个人智力的高低兴趣的大小等,都是与所在团体的大多数人的行为或某种人为确定的标准相比较而言的。(3)心理测量的客观性客观性是对一切测量的基本要求。在心理测量中要控制的变量比物理测量多得多,要做到客观颇不容易。测验的客观性实际上就是测验的标准化问题;量具必须标准化,这是对一切测量的共同要求。经过长期的努力探索,测验的标准化即客观性已经有了很大改进。 首先,测验用的题目或作业、施测说明、施测者的言语态度及施测时的物理环境等,均经过标准化,测验的刺激是客观的。特别是对测验项目的选择不是随意的,而是在预测基础上,通过统计分析(难度、区分度等)确定的。 其次,评分计分的原则和手续经过了标准化,对反应的量化是客观的。评分方面的客观性测验种类和题目类型而异。一般说来,投射测验的客观性差些,而选择题的客观性较好,因此后者有时又叫客观测验。 最后,分数的转换和解释经过了标准化,对结果的推论是客观的。测验常模是通过对总体的代表性样本的预测确定的,测验的信度和效度也在一定程度上经过实践的检验,依据这些资料所做出的推论,自然较为可靠和客观。二、心理测量的特征分类 (一)按测验的功能分类 1能力测验 从心理测验的观点看,可将其分为实际能力与潜在能力。实际能力是指个人当前“所能为者”,即代表个人已有的知识、经验与技能,是正式与非正式学习或训练的结果。潜在能力指个人将来,严可能为者”,是在给予一定的学习机会时,某种行为可能达到的水平。有人只把测量实际能力的测验称作能力测验,而把测量潜在能力的测验称作能力倾向测验。实际上二者很难分清。能力测验又可进一步分为普通能力测验与特殊能力测验。前者即通常说的智力测验,后者多用于测量个人在音乐、美术、体育、机械、飞行等方面的特殊才能。 2学绩测验 主要用于测量个人(或团体)经过某种正式教育或训

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论