心理统计与测量网络课程课件_第1页
心理统计与测量网络课程课件_第2页
心理统计与测量网络课程课件_第3页
心理统计与测量网络课程课件_第4页
心理统计与测量网络课程课件_第5页
已阅读5页,还剩208页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

心理统计与测量,网络课程,统计是一门语言艺术。如同其它语言那样,统计是一种形式的交流手段,它用抽象的符号去代表概念、事件,并把他们按照有效的方式结合起来。任何行为科学家都可以用统计学这门国际通用的语言来和他人交流他们研究的结果。我们把统计定义为一个收集数据且对其进行组织、总结、描述并基于这些数据做出决定和推论的过程。,(1)基本概念总体:具有某些共同的、可观测特征的一类事物的全体,构成总体的每个基本单元称为个体样本:由于不能或没必要对整个总体进行研究,我们只能从总体中选择出一些个体代表总体,这些个体的集合叫样本统计量:描述样本的数值参数:描述总体情况的统计指标变量:本身是变化的或者对于不同个体有不同值的特征或条件,常量:本身不变且对不同的个体的值也相同离散型变量:由分离的、不可分割的范畴组成,临近范畴之间没有值存在连续型变量:在任何两个观测值之间都存在无限多个可能值,可被分割成无限多个组成部分频数(f):某一事件在某一类别中出现的次数次数分布:一批数据在某一量度的每一个类目所出现的次数情况比例:全组中取值为X的比例,p=f/N,插值法:一种求两个已知数值之间中间值的方法,其假设所求解点附近数据呈线性变化随机取样:从总体抽取样本的一种策略,要求总体中的每一个个体被抽到的机会均等抽样误差:样本统计量与相应的总体参数之间的差距偏态分布:分数堆积在分布的一端,而另一端成为比较尖细的尾端,其与对称分布对应,(2)学习建议将注意放在概念上,心理统计应该是一门概念性的科学,而非纯数学。一定要将统计方法与心理学研究的情景结合起来学习。弄懂一个概念再开始学习下一个,心理统计中的概念是之后做题的基础。做题按照推荐格式能避免出错几率。,(3)统计检验总表,一、描述统计描述统计是指用来整理、概括、简化数据的统计方法,侧重于描述一组数据的全貌,表达一件事物的性质。(一)统计图表统计表和统计图简单明确、生动直观地表达数量关系,具有一目了然、整洁美观、容易理解等特点。它们是对数据进行初步整理,以简化的形式加以表现的两种最简单的方式。在制定统计图表之前,一般首先要对数据进行以下两种初步整理:数据排序:按照某种标准,对收集到的杂乱无章的数据按照一定顺序标准进行排列统计分组:根据被研究对象的特征,将所得到数据划分到各个组别中去,1统计表统计表:将要统计分析的事物或指标以表格的形式列出来,以代替烦琐文字描述的一种表现形式组成:隔开线、表号、名称、标目、数字、表注分类:简单表、分组表、复合表,表1工读学校学生心理健康各指标得分的年级比较,结构:表号、标题、标目、线条、数字、表注。编制要求:表号在标题左面,标题位于表的上方。标目:表格中对统计数据进行分类的项目。分为横标目(主语)和纵标目(谓语)。线条:顶线、底线、隔开纵标目与数字的横线、隔开横标目与数字的横线为四种基本线条。小条不宜过多。可在总和上方添一条横线。左上角不宜有斜线、中间不要有横线、左右两侧不要用纵线封闭。数字用阿拉伯数字,对齐、小数位数一致。不留空格。暂缺或未记录用“”或“”,无数字用“”。,简单表只列出观察对象的名称、地点、时序或统计指标名称的统计表。表2.1某年级各班学生人数,分组表只按照一个标志分组的统计表。表2.2上海市男幼儿20米跑步用时,复合表按两个或两个以上标志分组的统计表。按两个标志分组为二项表,按三个标志分组为三项表。表2.3某年级操行评定结果,某一随机事件在n次试验中出现的次数称为这个随机事件的频数。各种随机事件在n次试验中出现的次数分布称为频数分布。将频数分布用表格的形式表示出来称为频数分布表。,简单频数分布表,(1)间断变量的频数分布表表2.480名员工对部门主管尽职程度调查结果,(2)连续变量的频数分布表a;求全距Rb;决定组数k和组距I:k最多不超过20,最小不少于10,以10到15为宜;i常为1、2、3、5、10等。c:决定组限:每组的起止范围。最低值为下限、最高值为上限。上限一般无需写出,数值较大一组的下限就是数值较小一组的上限。数据正好等于某组的下限,归入数值较大的一组。组中值:每组上下限的中点。可用组中值表示各组的组限。d:登记频数f。,例:767166638883777268647076817973716661556574867882748467727674,表1某年级30名学生英语成绩的频数、累积频数、累积百分比分布表,累积频数和累积百分比分布表,见上表,2、统计图用来表达统计指标与被说明的事物之间数量关系的图形。,结构:图号、标题、标目、图形、图注。绘制规则:图号在图题的左面,图题的字体在图中为最大,位于图的下方。有纵横轴的统计图,需表明统计项目及其尺度。横轴是基线,一般表示被观察的现象,尺度要等距,自左向右,递增,位于横轴的下方。纵轴是尺度线,尺度从0开始,自下而上递增,位于纵轴的左侧。两轴都要注明单位。图形线在图中最粗。为了美观起见。图形的高与宽之比以3比5为宜。如果一副图中有几个图形线,可用不同的图形线加以区别,并用图例在适当的位置加以标明。,表示间断变量的统计图,直条图用直条的长短来表示统计事项数量的图形。主要用于比较性质相似的间断行数字资料。分类根据比较资料的组数可以分为:(1)单式直条图:图形中被比事物只有一组资料的直条图。(2)复式直条图:图形中被比事物含两组或两组以上资料的直条图。根据直条图排列的方向可以分为:纵条图和横条图。,图2.1某年级学习成绩评定结果,图2.2实验组和控制组被试学习成绩评定结果,图2.2实验组和控制组被试学习成绩评定结果,注意点:(1)纵条图以横轴为基线、横条图以横轴为基线。(2)条宽应一致。为美观起见,宽窄适当。两直条之间的间隔约为条宽的0.51倍。(3)各直条应按一定的顺序排列。如,时间先后、数字大小、等级次序等。(4)直条的顶端和下端无需注数字。(5)复式直条图中,如果两组被比事物总频数不同,尺度线应该用百分比。同一指标上,被比的几个直条间不必留空隙。,圆形图用来表示间断性资料构成比例的统计图形。圆形的面积表示一组数据的整体,圆中扇形面积表示各组成部分所占的比重。比重一般用百分比表示。绘制方法:(1)求各组成部分所占百分比。(2)求各组成部分中心角的度数。(3)以圆的下半径或上半径为基线,按被比事物的特定顺序,以顺时针方向,根据各组成部分的中心角度数将圆形分成几个扇形。(4)用不同线条或颜色将各扇形加以区别,并在各扇形内用简要文字和百分比加以注明。也可在图例中用文字注明各部分内容。(5)如果要比较两组性质相似的资料的构成比例,可以绘制直径相同,各组成部分排列顺序一致的两个圆形图进行比较。,图2.3某年级操行评定结果,表示连续变量的统计图,线形图用来表示连续性资料。(1)用途表示两个变量之间的函数关系。表示一种事物随另一种事物的变化情况。表示某种事物随时间推移的发展趋势。,图2.5小学三、四年级各学月识字量增长率,(2)绘制方法一般横轴表示时间或自变量,纵轴表示频数或因变量。横轴可标出各组的上下限或组中值,纵轴从0开始,标出频数或因变量的数值。横轴在各组中点,纵轴在频数或因变量高度上描点,然后用直线连接每相邻的两点。图形线应按实际数字绘成折线,不要任意改为光滑曲线。图中几条相互比较的图形一般不超过5条,用不同形式加以区别,并用图例说明。图中不必用文字或数字表示。,频数分布图(1)直方图用面积表示频数分布。即用各组上下限上的矩形面积表示各组频数。绘制方法:作横轴:各组的上下限或组中值置于横轴上。横轴的两端至少各空出一个组距的位置。作纵轴:标明尺度及其单位,以指示频数。在纵轴上确定各组频数高度,并在各组频数高度处画一横线与各组上下限上的两条纵线相交,形成一个矩形。由于组距是连续的,各组矩形间不留空隙。每个矩形的内侧垂线也可以省略。,(2)多边图以数轴上的高度表示频数的多少。以各组的组中值为横坐标,以各组的频数为纵坐标描点,然后把每相邻的两点用直线连接。图形两端引至外侧一组的中点与基线相交。比较的两组数据总频数不同,则纵轴应该用频数百分比表示。,(3)累积频数多边图和累积百分比多边图绘制方法:作横轴:各组上下限置于横轴上。描点,以各组上限为横坐标,各组累积频数为纵坐标描点,用直线连接每相邻的两点。图形左端引至第一组的下限与基线相接。图形可以变成光滑的曲线。,2统计图统计图:用点、线、面的位置、升降或大小来表达统计资料数量关系的一种陈列形式组成:坐标轴、图号、图题、图目、图尺、图形、图例、图注分类:条形图、圆图、线性图、直方图、散点图、茎叶图,图1EC处理实验组和控制组的内隐自尊,(二)集中量数集中量数又叫集中趋势,是体现一组数据一般水平的统计量。它能反映频数分布中大量数据向某一点集中的情况。1算数平均数(1)定义算数平均数:即所有观察值的总和与总频数之商,简称为平均数或均数平均数一般与标准差、方差相结合使用,(2)特点在一组数据中每个变量与平均数之差的总和等于零观察值的总和等于算术平均数的N倍在一组数据中,每一个数都加上一个常数C,所得的平均数为原来的平均数加常数C在一组数据中,每一个数都乘以一个常数C,所得的平均数为原来的平均数乘以常数C若一组观察值由两部分或几部分组成,这组观察值的算术平均数可以由其组成部分的算术平均数而求得,(3)意义算数平均数是应用最普遍的一种集中量数,它在大多情况下是真值最好的估计值。(4)优缺点优点:反应灵敏、计算严密、计算简单、简明易解、适合于进一步用代数方法验算、较少受抽样变动的影响缺点:易受极端数据的影响、不能在出现模糊数据时计算,2中数(1)定义中数:按顺序排列在一起的一组数据中居于中间位置的数,在这组数据中,有一半数据比它大,一般数据比它小等价于百分位数是50的那个数。(2)算法数列总个数为奇数时,第(n+1)/2个数就是中数数列总个数为偶数时,可取位于中间的两个数的平均数作为中数分布中有相等的数时,将重复的数字看成一个连续体,利用中间分数的精确上下限使用插值法,(3)优缺点优点:计算简单、容易理解、不受极端值影响、能在有模糊数据情况下使用、可在顺序型数据时使用缺点:代表性低、不够灵敏、稳定性低、需要排序、不能进一步做代数运算,3众数(1)定义众数:在次数分布中出现次数最多的那个数的数值众数可能不只一个。在正偏态分布时,平均数最靠近尾端,中数位于其与众数之间。(2)优缺点优点:能在数据不同质的情况使用,能避免极端值干扰缺点:不稳定、代表性差、不够灵敏、不能做进一步的代数运算,(三)差异量数差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称为离散量数。1离差与平均差离差:分布中的某点到均值的距离,其符号表示了某分属于均值之间的位置关系而数值表示了它们之间的绝对距离离差之和始终为零。,平均差:次数分布中所有原始数据与平均数绝对离差的平均值,2方差与标准差和方:每一个离差值平房求和由于离差正负值互相抵消无法代表离中趋势我们引入离差平方和的概念,(1)总体的方差和标准差方差:每个数据与该组数据平均数之差乘方后的均值,即离均差平方后的均数作为样本统计量用符号s2表示,作为总体参数用符号2表示,也叫均方。,标准差:方差的平方根作为样本统计量用符号s表示,作为总体参数用符号表示。,(2)样本的方差和标准差样本的变异性往往比它来自的总体的变异性要小。为了校正样本数据带来的偏差,在计算样本方差时,我们用自由度来矫正样本误差,从而有利于对总体参数更好的无偏差估计:,(3)性质每一个观测值都加一个相同的常数C之后,计算得到的标准差等于原来的标准差每一个观测值都乘以一个相同的常数C,所得到的标准差等于原标准差乘以这个常数(4)意义方差与标准差是表示一组数据离散程度的最好指标,它们是统计描述与统计推断分析中最常用的差异量数,它们的优点有:反应灵敏、计算严谨、计算容易、适合代数运算、受抽样变动影响小、意义简单明了,3变异系数当遇到下列情况时,不能用绝对差异量来比较不同样本的离散程度,而应当使用相对差异量数,最常用的就是差异系数。两个或两个以上样本所使用的观测工具不同,所测的特质相同两个或两个以上样本使用的是同种观测工具,所测的特质相同,但样本间水平差异较大,差异系数:一种最常用的相对差异量,为标准差对平均数的百分比,差异系数的用途,(1)比较不同单位资料的差异程度例:上海市区6岁男童体重与身高,何者差异大?体重CV11.14,身高CV4.19。,(2)比较单位相同而平均数差异较大的两组资料的差异程度例:上海市区两组女童的体重,何者差异大?2月组CV11.38,6岁组CV11.15。,(3)判断特殊差异情况CV一般在535之间。若CV35%,可以怀疑平均数可能失去了意义,若CVj格中的择优分数,4点二列相关与二列相关(1)点二列相关适用于一列数据为等距正态变量,另一列为离散型二分变量。,是与二分称名变量的一个值对应的连续变量的平均数,是与二分称名变量的另一个值对应的连续变量的平均数p与q是二分称名变量两个值各自所占的比率st是连续变量的标准差,(2)二列相关适用于两列变量都是正态等距变量,但其中一列变量被人为地分成两类。,y为标准正态曲线中p值对应的高度,查正态分布表能得到,例如:15名初三毕业生,其中重点中学5人,非重点中学10人,其高中入学考试英语分数如下表所示,问中学生的类别与英语考试成绩的相关情况如何?,5相关适用于两个变量都是只有两个点值或只表示某些质的属性。,其中a、b、c、d分别为四格表中左上、右上、左下、右下的数据,相关系数的计算例如:从研究生入学考试的学生中随机抽取60人,其大学应届与历届毕业生录取情况如下表所示,问应届和历届大学毕业生同研究生录取与否的相关情况如何?,二、推断统计推论统计就是指运用一系列的数学方法,将从样本数据中获得的结果推广到样本所在的总体。进行推论统计的关键在于所抽取的样本要能够尽量接近所要研究的总体。(一)推断统计的数学基础1概率概率(P):表明随机事件出现可能性大小的客观指标概率的定义包含以下两种,当观测次数够多时他们是相等的。后验概率:对随机事件进行n次观察,某一事件A出现的次数m与观测次数n的比值在n趋近无穷时所稳定在的常数P先验概率:在满足试验可能结果数有限且每一种结果出现的可能性相等的条件下,随机事件包含的结果数除以结果总数,2正态分布当样本量足够大时,我们会发现生活中许多变量的分布都近似于正态曲线,因此有“上帝偏爱正态分布”一说。(1)特点正态曲线的形状就像一口挂钟,呈对称分布,其均值、中数、众数实际上对应于同一个数值大部分的原始分数都集中分布在均值附近,极端值相对而言比较少曲线两端向靠近横轴处不断延伸,但始终不会与横轴向交正态分布曲线转化为z分数后人以z分数与零点对应曲线下面积固定,图2正态分布曲线,图3标准正态分布曲线,(2)用法依据Z分数求概率,即已知标准分数求面积从概率求Z分数,即从面积求标准分数值已知概率或Z值,求概率密度,即正态曲线的高,3二项分布二项分布:对于一个事件有两种可能A和B,但我们对这一事件观察n次,事件A发生的总次数的概率分布就是二项分布二项分布的均值为,方差公式为,标准差的公式为,4抽样原理与抽样方法(1)抽样原理抽样的基本原则是随机性原则,所谓随机性原则,是指在进行抽样时,总体中每一个个体是否被抽选的概率完全均等。由于随机抽样使每个个体有同等机会被抽取,因而有相当大的可能使样本保持和总体有相同的结构,或者说,具有最大的可能使总体的某些特征在样本中得以发现,从而保证由样本推论总体。,(2)抽样方法简单随机取样法系统随机取样法分层随机取样法多段随机取样法,5抽样分布抽样分布:样本统计量的分布,是统计推论的重要依据(1)正态分布及渐近正态分布样本统计量为正态分布或者接近正态分布的情况都可根据正态分布的概率进行统计推论。总体分为正态或接近正态,方差已知,样本平均数和方差的分布为正态分布样本平均数分布的平均数和方差与母体的平均数和方差有如下关系:,样本的方差及标准差的分布也渐趋于正态分布,其分布的平均数与标准差和总体有如下关系:,(2)t分布t分布是一种与方差无关而与自由度有关的分布,很类似正态分布,我们可以将正态分布看作t分布当自由度为正无穷时的特例。,总体分布为正态,方差未知时,样本平均数的分布为t分布:,其中,(3)2分布2分布的构造是从一个服从正态分布的总体中每次抽去n个随机变量,计算其平方和之后标准化的一个分布。分布曲线下的面积都是1,但伴随着n取值的不同,自由度改变,曲线分布形状不同,而当自由度趋近于正无穷时2分布即为正态分布,因此其于t分布一样都是一族分布,而正态分布都是其中的特例。,(4)F分布如果有两个正态分布的总体,我们从其中各自取出两个样本,各自计算出2,则:,更多情况下,我们所计算的F两样本取自相同总体,此时可将上式化简为:,(二)参数估计当在研究中从样本获得一组数据后,如何通过这组信息,对总体特征进行估计,也就是如何从局部结果推论总体的情况,称为总体参数估计。总体参数估计问题可以分为点估计与区间估计。,1点估计、区间估计与标准误良好估计量的标准无偏性用多个样本的统计量估计总体参数的估计值,其偏差的平均数为零有效性当总体参数的无偏估计不止一个统计量时,无偏估计变异小者有效性高,变异大者有效性低,即方差越小越好一致性当样本容量无限增大时,估计值应能够越来越接近它所估计的总体参数充分性样本的统计量是否充分地反映了全部n个数据所反映总体的信息,点估计:用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计结果也以一个点的数值表示区间估计:根据估计量以一定可靠程度推断总体参数所在的区间范围,这个区间就叫做置信区间,相应的概率成为置信度,这两个量是共同变化的,置信区间越大,置信度越高;区间估计是用数轴上的一段距离表示未知参数可能落入的范围及落入该范围的概率。标准误:样本平均数分布的标准差总体方差未知时用估算的总体方差计算标准误。,2总体平均数的估计,当总体方差未知时,则使用t分布对应置信度3标准差与方差的区间估计(1)标准差的区间估计,(2)方差的区间估计,(三)假设检验可以说,每一个实验的存在,仅仅是为了给事实一个反驳虚无假设的机会。R.A.Fisher1假设检验的原理假设检验:统计学中的一种推论过程,通过样本统计量得出的差异作为一般性结论,判断总体参数之间是否存在差异假设检验的实质是对可置信性的评价,是对一个不确定问题的决策过程,其结果在一定概率上正确的,而不是全部。,(1)两类假设对于任何一种研究而言,其结果无外乎有两种可能,即是否符合我们预期。一般来说证伪一件事情比证实一件事容易,在行为科学的研究中,由于我们无法了解总体中除样本以外的个体情况,因此尝试拒绝虚无假设的方法优于证明备择假设。备择假设:因变量的变化、差异确实是由于自变量的作用往往是我们对研究结果的预期,用H1表示。虚无假设:实际上什么也没有发生,我们所预计的改变、差异、处理效果都不存在观察到的差异只是随机误差在起作用,用H0表示。,(2)小概率原理小概率原理:小概率事件在一次试验中几乎是不可能发生的至于什么就算小概率事件,那就是我们在计算前明确的决策标准,也就是显著性水平。在检验过程中,我们假设虚无假设是真实的,同时计算出观测到的差异完全是由于随机误差所致的概率。之后将其与我们实现界定好的显著性水平比较,从而考虑是否依据小概率原理来拒绝虚无假设。,(3)两类错误(本部分内容请参照实心信号检测论对照来看)型错误:当虚无假设正确时,我们拒绝了它所犯的错误,也叫错误研究者得出了处理有效果的结论,而实际上并没有效果,即所谓“无中生有”型错误:当虚无假设是错误的时候,我们没有拒绝所犯的错误,也叫错误假设检验未能侦查到实际存在的处理效应,即所谓“失之交臂”两类错误的关系:+不一定等于1在其他条件不变的情况下,与不可能同时减小或增大控制两类错误的方法:合理安排拒绝区域增加样本容量,(4)检验的方向性单侧检验:强调某一方向的检验,显著性的百分等级为双侧检验:只强调差异不强调方向性的检验,显著性百分等级为/2对于同样的显著性标准,在某一方向上,单侧检验的临界区域要大于双侧检验,因此如果差异发生在该方向,单侧检验犯错误的概率较小,我们也说它的检验效力更高。(5)假设检验的步骤根据问题要求,提出虚无假设和备择假设选择适当的检验统计量确定检验的方向性并规定显著性水平计算检验统计量的值将统计量的值与临界值对比做出决策,2样本与总体平均数差异的检验(1)总体正态分布且方差已知,其中,和,分别为总体的平均数和方差,其中,为用样本离差平方和(和方)估算出的总体方差,(2)总体正态分布而方差未知,而,平均数差异显著性检验的原理,1对两个相应的总体平均数之间提出没有差异的零假设(H0:120)和备择假设(H1:120)2以两个平均数差的抽样分布(即以两个总体平均数之差为零为中心的一切可能样本平均数之差的概率分布)为理论依据,根据概率的大小,来考察两个样本平均数之差是否来自两个总体平均数之差为零的总体。3。根据样本平均数之差在其抽样分布上出现的概率来判定是保留还是拒绝零假设。,当样本平均数之差较大,大到在其抽样分布上出现的概率足够小时,就可以作为从实际可能性上否定零假设的理由,从而接受备择假设。即两个总体平均数之间确实存在本质差异。当样本平均数之差较小,在其抽样分布上出现的概率较大,则应该保留零假设而拒绝备择假设。表明样本平均数之差是来自总体平均数之差为零的总体。即两个样本平均数是来自同一个总体或来自平均数相同的两个总体。,3两样本平均数差异的检验,这是两样本平均数检验的通用公式,所不同的仅在于标准误的计算,(1)总体方差已知独立样本,相关样本,其中r为两组变量之间的相关系数,(2)总体方差未知独立样本(方差差异不显著时),相关样本,a.相关系数未知,其中d为每一对对应数据之差,b.相关系数已知:,样本内的个体之间存在着一一对应关系的两个样本称为相关样本。用同一测验对同一组被试在实验前后进行两次测验,所获得的两组测验结果是相关样本。根据某些条件基本相同的原则,把被试一一匹配成对,然后将每对被试随机得分入实验组和对照组,对两组被试施行不同的实验处理之后,用同一测验获得的测验结果,也是相关样本。,配对组的情况,为了揭示幼儿园的两种识字教学法是否有显著性差异,根据儿童的智力水平、努力程度、识字量、家庭辅导情况等条件基本相同的原则,将儿童配成10对,然后把每对儿童随机分入实验组和对照组。实验组采用分散识字教学法,对照组采用集中识字教学法。后期统一测验结果见下表。试问两种识字教学法是否有显著性差异?,同一组对象的情况,32人的射击小组三天集中训练前后的测验分数见教材表7.2所示,试问三天集中训练有无显著效果?(过去资料表明三天集中射击训练有显著效果),独立样本平均数差异的显著性检验,样本内的个体是随机抽取的,它们之间不存在一一对应关系的两个样本称为独立样本。,独立大样本平均数差异的显著性检验,两个样本容量都大于30的独立样本称为独立大样本。例:某幼儿园儿童社会适应能力测验成绩如下表所示,试问男女儿童社会适应能力是否有显著性差异?,独立小样本平均数差异的显著性检验,两个样本容量都小于30,或其中一个样本容量小于30的独立样本称为独立小样本。在进行独立样本平均数差异显著性检验之前,首先要对两个总体方差是否相等进行齐性检验,看平均数之差的标准误是否可以用汇合方差的形式来表示。,从幼儿园中班随机抽取两个小组进行数学能力训练,实验组采用游戏教学法,对照组采用传统讲授法,后期统一测验结果如下表所示,问两种教学法是否有显著性差异?(根据已有的经验确知游戏教学法优于传统讲授法),4方差齐性检验(1)样本方差与总体方差当从正态分布的总体中随机抽取容量为n的样本时,其样本方差与总体方差比值服从2分布:,由自由度,查2表,依据显著性水平判断,(2)两个样本方差之间独立样本,其中当两样本自由度相差不大时可用,代替,查表时,相关样本,其中,5相关系数的显著性检验,积差相关,a.当=0时:,其中,b.当0时:先通过查表将r和转化为费舍Zr和Z然后进行Z检验,等级相关和肯德尔W系数在总体相关系数为零时:查各自的相关系数表,判定样本相关显著性,(四)方差分析1方差分析的原理与基本过程(1)方差分析的概念方差分析的目的是推断多组资料的总体均数是否相同,也即检验多组数据之间的均数差异是否有统计意义。当我们用多个t检验来完成这一过程时,相当于从t分布中随机抽取多个t值,这样落在临界范围之外的可能大大增加,从而增加了型错误的概率。我们可以把方差分析看作t检验的增强版。,(2)方差的可分解性方差分析依据的基本原理就是方差的可加性原则。作为一种统计方法,方差分析把实验数据的总变异分解为若干个不同来源的分量。数据的变异由两部分组成:组内变异:由于实验中一些希望加以控制的非实验因素和一些未被有效控制的未知因素造成的变异,如个体差异、随机误差组内变异是具体某一个处理水平之内的,因此在对总体变异进行估计的时候不涉及研究的处理效应。,组间差异:不仅包括组内变异的误差因素,还包括了是不同组所接受的实验处理不同造成的影响如果研究数据的总变异是由处理效应造成的,那么组间变异在总变异中应该占较大比例。,表示组间方差,,,,表示实验条件的个数,,,表示组内方差,,,,,,表示每种实验条件中的被试个数,(3)方差分析的基本假定样本必须来自正态分布的总体每次观察得到的几组数据必须彼此独立各实验处理内的方差应彼此无显著差异为了满足这一假定,我们可采用最大F比率法,,求出各样本中方差最大值与最小值的比,通过查表判断,(4)方差分析的基本步骤求平方和总平方和是所有观测值与总平均数的离差的平方总和,其中,表示所有数据的总合,,表示总共的数据个数,组间平方和是每组的平均数与总平均数的离差的平方再与该组数据个数的乘积的总和,为数据总均值,,为每组数据和,,为该组数据个数,组内平方和是各被试的数值与组平均数之间的离差的平方总和,(注:推荐用于检验之前的计算,而不是被当作快捷计算的方式),计算自由度,计算均方,计算F值,查F值表进行F检验并做出判断,陈列方差分析表,2完全随机设计的方差分析,3随机区组设计的方差分析随机区组设计中同质被试参加所有水平下测试,因此,组间变异不包括个体差异的影响。而每一个水平之内仍然是由不同被试共同完成的,于是我们仍然将总体变异分为组间变异和组内变异,但需要进一步将组内变异分为被试间变异和误差引起的变异。这样,我们就可以在F检验时,将被试间变异从组内变异中去除,使得检验结果更灵敏。,个体误差用,表示,而随机误差用,表示,它们的和等于组内差异,其中,而,;,其中,为同一区组的数据之和,或者同一,被试在不同处理下的乘积的和,让我们回忆一下两个相关样本平均数假设检验,可以发现那里出现的情况和这里的多样本方差分析相仿。也就是说,对于同样的实验数据,当我们把它看作是由独立样本得出或相关样本得出时,就要采用不同的检验方法,从而有可能得出不同的结论。在假定为相关样本的数据得出的显著性差异如果换作背景是独立样本就可能只能接受虚无假设。这实际上是因为相关情况下样本之间差异的减小使得对应检验要使用的统计量变大,检验也就更加灵敏了。,4两因素方差分析在两因素实验设计中,研究者同时用两种影响因素作为自变量研究它们对某一因变量的影响,其实验结果比单因素设计更实际。(1)交互作用与主效应主效应:某个自变量的不同水平对因变量所造成的影响的差异交互作用:一个因素对因变量的影响因另一个因素的不同水平而不同如果两个因素彼此独立,即不管其中一个因素处于哪个水平,另一个因素的不同水平均值间的差异都保持一致,则不会产生交互作用。,(2)统计原理为了看清各因素独立作用和交互作用的影响,我们进一步将组间差异分解:,其中,与,分别表示a因素与b因素的组间平方和,,表示交互作用的平方和,;,;,;,3)F的计算(这里讨论独立样本),其中,这里的,是假定全体数据只根据a因素,分为两组所计算的组间差异,其中,组所计算的组间差异,这里的,也同样为假设只根据b因素分,其中,这里的,为总体组间差异减去,和,得到,5事后检验由方差分析只能得到显著差异的结果,事后检验使我们能够比较各组,发现差异具体产生在什么地方。事后检验采用成对比较的方式,每次比较两个组的差异。,HSD检验法,把要比较的各个平均数从小到大作等级排列,处理条件的数目,,自由度,查表得到相应显著性的,值,计算作为临界值的,(当为随机区组时用,代替,把要比较的两个平均数的差与临界值比较,若超过则认为差异显著,(五)回归分析1一元线性回归分析(1)基本概念回归分析:通过大量的观测发现变量之间存在的统计规律性,并用一定的数学模型表示变量相关关系的方法只有一个自变量并且统计量成大体一次函数的线性关系的回归分析叫一元线性回归分析。,在一元线性回归中,我们用,作为回归方程,代表X与Y的线性关系,其中:,表示该直线在Y轴的截距,表示该直线的斜率也就是,的变化率,为自变量,通常是研究者事先选定的数值,为对应于X对变量Y的估计值,(2)最小二乘法所谓最小二乘法,就是如果散点图中每一点沿Y轴方向到直线的距离的平方和最小,则认为这条直线的代表性最好,即使用其作为回归方程。这样我们使得,最小。,其中,;,2一元线性回归方程的检验(1)方差分析法,其中,而其,其,其,(2)回归系数检验,其中,而,,它的意义是一个统计量,表示以,为中心Y值,上下波动的标准差,(在知道相关系数时,),3一元线性回归方程的应用回归分析的目的,就是在测定自变量X与因变量Y的关系为显著相关后,借助于拟合的较优回归模型来预测在自变量X为一定值时因变量Y的发展变化。当我们根据给出的X值而预测得到点估计Y时,Y只代表了预测值的中点,而计算在特定置信区间内的区间估计则依靠以下公式:,根号部分当n很大时近似为1,其中t的自由度取n-2,,为对应该,的方程解出的点估计Y值,(六)卡方检验,其中,为观察次数;,为理论期望次数,公式的适用范围要求观察彼此之间独立,并且单位格的理论期望次数不能小于5(小于5时可与相邻的组合并),1拟合度检验2匹配度检验是用样本数据来检验总体分布的形状或比率,以确定与假设的总体性质的匹配度。,其中C为分类数,2独立性检验2独立性检验帮助我们考察多种因素的不同分类之间是否独立。它是检验行和列两个变量彼此有无关联的一种统计方法,适用于命名型变量和顺序型变量,其中C和R分别为行列分类数,(七)非参数检验1独立样本均值差异的非参数检验(1)秩和检验法两样本容量均小于10将容量较小的样本的各数据等级求和,T值检验表中的临界值比较。两样本容量均大于10,其中,而,(2)中数检验法#将两个样本数据混合从小到大排列求混合排列的中数分别找出每个样本中大于和小于中数的数据的个数,列成四格表(中数本身不在内)对四格表卡方检验公式进行计算,2相关样本均值差异的非参数检验(1)符号检验法对子数小于25对于样本每对数据之差来记录符号,求出正负号分别的个数,用其中较小的个数作为观测值r对照临界值表检验对子数大于25,其中,而,(2)维尔克松检验法对子数小于25时a.把相关样本对应数据之差值按照绝对值从小到大排列b.在各等级前加上原来差值的正负号,c.分别求出正号等级和负号等级的秩和,取其中较小的值作为Td.由n值查表检验T对子数大于25时,其中,而,参考书目张厚粲、徐建平编著:现代心理与教育统计学,北京师范大学出版社2003年版。王孝玲主编:教育统计学,华东师范大学出版社2001年版。甘怡群主编:心理与行为科学统计,北京大学出版社。邵志芳著:心理与教育统计学,上海科学普及出版社2004年版。,心理测量的根本目的是帮助人们做出重要的决定。(一)心理测量的理论基础1心理测量的基本概念(1)心理测量的定义心理测量:根据一定的法则用数字对人的行为加以确定即依据一定的心理学理论,使用一定的操作程序,给人的行为和心理属性确定出一种数量化的价值。心理测验:对行为样组进行客观和标准化的测量,其本质上是心理测量的工具心理测验有三个要素,即行为样组、标准化、客观性。心理测验客观性指标:信度、效度、难度与鉴别力,三、心理测量的基本理论,(2)心理测量的特点间接性心理属性是内在的不可直接测量到的特质,但可表现为一系列具有内在联系的外显行为,测量者可以通过一定的方法测量这些外显行为,并由这些行为判别特质的性质。相对性对人的行为进行比较,没有绝对的标准,亦即没有绝对零点,我们有的只是一个连续的行为序列。所有的心理测量都是看每个人处在这个序列的什么位置上,也就是只有顺序量表的特征。客观性实际上就是测验的标准化问题。测验用的项目,说明、言语、态度、评分、分数转换、解释都需要标准化。,2心理测量的特征分类,(1)按所测量的心理特征分类能力测验个人已有的知识、经验、技能成就测验经过正式教育或训练后对新知识和技能的掌握程度人格测验性格、气质、兴趣、态度、品德、情绪、动机、信念、价值观等(2)按接受测量的人数分类个别测验一名主试在一段时间内测量一名被试团体测验一段时间内一名主试同时测量许多人,(3)按测验目的分类描述性测验通过测量来描述某一特定群体在某一心理特质上的一般状况诊断性测验对为了解决存在的问题而预先做出的诊断预示性测验了解人的潜能和未来的表现(4)按测验要求分类最高作为测验被试尽可能做出最好的表现典型作为测验被试按通常的习惯和没有压力的方式做出反应,(5)按评价所参照的标准分类常模参照测验将被试的水平与常模比较,以评价被试在团体中的相对地位为目的目标参照测验将被试水平与一个绝对标准比较,以评价被试有无达到该标准为目的潜力参照测验将被试水平与自身潜力相比较,以评价被试有无充分发挥自身潜力为目的,3经典测量理论及其模型,(1)基本定义真分数:反映被试某种心理特质真正水平的数值其是一个在理论上构想出来的抽象概念,在实际测量中很难得到观察分数:实测到的分数我们希望通过改进和完善测量工具及方法的方式来使得观察分数尽量接近真分数。CTT数学模型:观察分数与真分数之间是一种线形关系,并只相差一个随机误差其中X表示观察分数;T表示真分数;E表示随机误差(不包含系统误差),(2)CTT模型的三个假设公理反复测量得到的观察分数的平均值会接近真分数,E服从均值为零的正态分布真分数和误差分数之间的相关为零平行测验上的误差分数之间相关为零平行测验:题目不同的测验测的是同一特质,且题目形式、数量、难度、区分度以及测查等值团体后所得分数的分布一致,(3)CTT模型的方差关系在一次测量中,被试观察分数的方差等于其真分数方差与误差分数方差之和真分数变异还可以分成与测量目的有关的变异和与测量目的无关的变异,(二)测量的信度与效度,1测量的信度(1)信度的定义信度:测量结果的稳定程度若能用同一测量工具反复测量某人的同一心理特质,则其多次测量的结果间的一致性程度就叫信度。rXX=ST2/SX2信度的三个等价操作定义:信度是一个被测团体的真分数的变异数与实得分数的变异数之比信度是一个被试团体的真分数与实得分数的相关系数的平方信度是一个测验与其任意一个平行测验的相关系数(这个定义具有实际意义),(2)信度系数的估计重测信度:用同一个量表对同一组被试施测两次所得结果的一致性程度计算:其大小等于同一组被试两次测验所得分数的皮尔逊积差相关系数(参见心理统计学讲义)实用的前提条件:所测量的心理特性必须是稳定的遗忘和练习的效果基本上互相抵消两次测验的间隔内被试的特质没有变化复本信度:两个平行的测验测量同一批被试所得结果的一致性程度计算:其大小亦等于两次测验分数的皮尔逊积差相关系数。前提:有条件构造出两份或以上真正平行的测验被试有条件接受两个测验,分半信度:将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度也可以把对等的两半测验看成是在最短时距内施测的两个平行测验。计算:先按照复本信度的方式计算出半个测验的信度,然后用斯皮尔曼-布朗公式校正若两个分半测验分数变异不等时则用或前提:通常在只能施测一次或没有复本的情况下使用由于将测验分半的方法很多,因此一个测验有多个分半信度值,同质性信度:测验内部所有题目间的一致程度这里的一致性指所有题目都测的是同在一种心理特质,也指所有题目得分之间都具有较高的正相关计算:,为题目数,为答对答错题的比例,表示所有被试在题上的分数变异,评分者信度:多个评分者给同一批人的答卷进行评分的一致性程度计算:评分者为2用积差相关或等级相关,大于2用肯德尔和谐系数估计(参见心理统计学讲义),(3)信度的影响因素与改进影响因素:被试方面、主试方面、施测情景、测量工具、两侧施测间隔(越短越好)提高方法:适当增加测验的项目数使测验中试题的难度接近中等水平提高测验试题的区分度尽量选取恰当的被试团体,提高测验在同质性较强的亚团体上信度尽量减少无关因素的干扰,(1)效度的定义效度:一个测验或量表实际能测出其所要测得心理特质的程度效度的操作定义:效度是总变异中由所测量的特性造成的变异所占的百分比rxy2=Sv2/Sx2效度的三个性质:效度是针对一次或某几次测验的具体结果的效度是针对某种特定的测验目的的效度只是程度上的差异,不是有无的差别,2测量的效度,(2)效度的估计效度估计就是多方寻找证据来证明测验的有效性程度的过程。(测量中效度与实验中不同,区别理解。)内容效度:一个测验实际测到的内容与所要测量的内容之间的吻合程度估计一个测验的内容效度就是去确定该测验在多大程度上代表了所要测量的行为领域。适用范围:内容效度主要应用于成就测验,也适合于某些用于选拔和分类的职业测验而不是和能力和人格测验,确定方法:明确欲测内容的范围,包括知识范围和能力要求两个方面确定每个题目所测得内容,并与测验编制者所列的双向细目表对照制定评定表,考察题目对内容的覆盖率及其比例和内容的适当性并判断题目难度与能力要求间差异统计计算:从同一内容中抽两套平行测验对一批被试测验,两次相关高说明有效度(除非两个测验偏向同一方面);也可以用再测法,通过后测成绩与前测成绩比较。,结构效度:测验能说明心理学上的理论结构或特质的程度,或用心理学上某种结构或特质来解释测验分数的恰当程度结构指用来解释人类行为的理论框架或心理特质,是心理学中抽象的假设性概念、特性或变量。特点:结构效度的大小首先取决于事先假定的心理特质理论当实际测量的资料无法证实我们的理论假设时,不一定表明该测验结构效度不高结构效度是通过对测量内容的选择的证据累计起来确定的,不是靠单一数量指标描述的,确定方法:提出理论假设,并把假设分解成一些细小的纲目依据理论框架,推演出有关测验成绩的假设用逻辑的和实证的方法来验证假设应用范围:主要用于智力测验、人格测验等估计方法:从测验内部寻找证据,先考察测验的内容效度在测验间寻找,将新编测验与已知有效的测验比较考察测验的实证效度多种特质-多种方法矩阵法,实证效度:一个测验对处于特定情景中的个体的行为进行估计的有效性,也就是说以实践效果作为检验有效性的标准根据效标资料搜集的时间差异,实证效度可分为同时效度和预测效度两种。效标是作为检验效度的标准的被估计的行为,即衡量测验是否有效且独立于测验的外在标准。确定方法:明确观念效标确定效标测量考察测验分数与效标测量的关系,估计方法:相关法计算测验分数与效标测量的相关系数区分法被试接受测验后,让他们工作一段时间,再根据工作成绩的好坏分成两组。这时再回过头来分析这两组被试原先分数的差异,将成绩与分数比较命中率决策的命中率是测验有效性的较好指标,(3)效度的影响因素与改进影响因素:测验的构成、测验的实施过程、被试情况、所选效标的性质、测量的信度提高方法:精心编制测验量表,避免出现较大的系统误差妥善组织测验,控制随机误差创设标准的应试情景,让每个被试都能发挥正常的水平选择正确的效标、定好恰当的效标测量,正确地使用有关公式,3信度和效度的关系根据公式可以得到信度与效度的关系如下:信度高是效度高的必要而非充分条件测验的效度受它的信度制约,(三)心理测量的误差,“误差是世界本原通往人类认知途中的收费站和化妆师。”1测量误差的定义测量误差:在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应心理测量的误差包括随机误差和系统误差两种。随机误差:由与测量目的无关的、偶然因素引起的、而又不易控制的误差它使多次测量产生不一致的结果,其方向和大小的变化完全是随机的,只符合某种统计规律。系统误差:由与测量目的无关的变量引起的一种恒定而又规律的效应这种误差稳定的存在与每次测量之中,尽管多次测量结果一致,但仍与真实值有所差异。,2测量的随机误差来源及控制(1)来源测试环境温度、光线、噪音等测试时间时间安排不统一,或测试时间过短主试因素年龄、性别、穿着、言谈举止、表情,主试的数量过多也会造成压力意外干扰停电、巨响、有人生病、作弊、测验用品出问题、粮食涨价、火星人入侵评分计分主观题评分不客观,有个人偏好(2)控制测验准备尽可能充分细致,施测各方面尽量标准化,3测量的系统误差来源及控制(1)来源测验难度过高或过低测验内容选题不当、题数太少、模棱两可、表述不清被试因素应试动机变化、测验焦虑、测试经验、学习与发展、反应倾向、生理因素(2)控制题目编制认真用心,测验标准化4测量误差的估计?其中rtt为信度系数,(四)心理测验的项目分析,项目分析:测验编制过程中,为了改善和提高测验的信度和效度,在组成测验之前,应对组成测验的每个题目进行分析1题目的难度(1)定义难度:测验项目的难易程度,一个测验项目,如果大部分被试都能答对,则该项目的难度就小,反之亦然测验的记分方法不同,项目难度的计算方法也不同。,(2)计算二分法记分项目的难度以通过率来表示(注:这里通过率的概念和我们通常理解的难度相反)其中P代表项目难度;N为全体被试数;R为答对通过该项目人数当被试人数较多时,将被试依照测验总分从高到低排列,用总分最高的27%作为高分组,总分最低的27%作为低分组其中和分别代表高分组合低分组的通过率非二分法记分项目的难度其中为被试在某一项目上的平均分;为该项目的满分,(3)难度水平的确定进行难度分析的主要目的是为了筛选项目,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论