版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
目录\h第1章常用的统计表与图\h1.1复习笔记\h1.2课后习题详解\h1.3考研真题与强化习题详解\h第2章常用统计参数\h2.1复习笔记\h2.2课后习题详解\h2.3考研真题与强化习题详解\h第3章概率与分布\h3.1复习笔记\h3.2课后习题详解\h3.3考研真题与强化习题详解\h第4章抽样理论与参数估计\h4.1复习笔记\h4.2课后习题详解\h4.3考研真题与强化习题详解\h第5章假设检验\h5.1复习笔记\h5.2课后习题详解\h5.3考研真题与强化习题详解\h第6章方差分析\h6.1复习笔记\h6.2课后习题详解\h6.3考研真题与强化习题详解\h第7章回归分析\h7.1复习笔记\h7.2课后习题详解\h7.3考研真题与强化习题详解\h第8章x2检验\h8.1复习笔记\h8.2课后习题详解\h8.3考研真题与强化习题详解\h第9章非参数检验\h9.1复习笔记\h9.2课后习题详解\h9.3考研真题与强化习题详解\h第10章常用教育与心理实验设计\h10.1复习笔记\h10.2课后习题详解\h第11章主成分分析\h11.1复习笔记\h11.2课后习题详解\h第12章因素分析\h12.1复习笔记\h12.2课后习题详解\h第13章聚类分析\h13.1复习笔记\h13.2课后习题详解\h第14章判别分析\h14.1复习笔记\h14.2课后习题详解\h第15章SPSS与统计分析\h15.1复习笔记\h15.2课后习题详解第1章常用的统计表与图【本章重点】☆简单次数分布表的编制☆常用的统计图的应用条件与绘制:散点图、折线图、条形图和圆形图1.1复习笔记一、次数分布表与图(一)次数分布及其表达方式概述1.次数分布次数分布是指一批数据中各个不同数值所出现的次数情况,或者是指一批数据在量尺上各等距区组内所出现的次数情况。2.次数分布表与次数分布图对数据进行分组归类,考察这批数据在量尺上各等距区组内的次数分布情况,并把这种情况用规范的表格形式加以体现,这就是次数分布表。若用图形来表达,就称为次数分布图。(二)次数分布表的编制1.简单次数分布表简单次数分布表,通常简称为次数分布表,其实质是反映一批数据在各等距区组内的次数分布结构。编制次数分布表的主要步骤如下:(1)求全距全距是一批数据中最大值与最小值之间的差距,也称为极差。以符号R表示全距,其计算公式为:(2)定组数①定组数就是要确定把整批数据划分为多少个等距的区组。组数用符号K表示。组数的大小要依数据的多少而定。组数太多,往往会削弱对数据分组整理的功用;太少,又可能会湮没数据内含的重要信息。②当一批数据的个数在200个以内时,组数可取8~18组。如果数据来自一个正态的总体,则可利用下述经验公式来确定组数,即:公式中的N为数据个数。③注意:事先计划的组数可能与实际分组时因考虑组距取整以及最低一组的起点位置不同而略有差异,这种差异是正常的,最终结果应以实际划归的组数为准。(3)定组距组距用符号i表示,其一般原则是取奇数或5的倍数,如1,3,5,7,9,10……等。具体的取值过程可通过全距R与组数K的比值来取整确定。(4)写出组限组限是每个组的起始点界限。表1-2中列出了关于组限的几种不同表述方式。表1-2
组限的五种表述方法(i=5)对于连续变量,尽管表1-2中的五种表述方法形式不同,但它们所包含的意义与传统“教育与心理统计学”中的规定却是一致的。为了避免这种人为造成的误解并与规范关于组限的表述方法相统一,本书建议并一贯采用表1-2中的第三种、第四种或第五种这三种表述方法。对此,作几点说明如下:①表述组限与实际组限是两个不同的概念,但它们之间有规律性的联系。②当各相邻组的组限已经相互承接而没有间断时,便认为已把表述的组限与实际的组限统一起来,且不管这里表述组限中的实下限与实上限是整数还是小数。③按照本书上述规定的组限表述方法即可形成规范的组限表述方式,并与其他学科中的区间表达法统一起来。(5)求组中值①组中值是各组的组中点在量尺上的数值,其计算公式为:组中值=(组实上限+组实下限)÷2②不同的组距以及不同的组限,必然会产生不同的组中值。如果为了便于有关运算,希望每组的组中值恰好为整数,那么,在组距为奇数的情形下,各组的实下限与实上限的值必然带有小数。(6)归类划记完成上述各个步骤后,我们就可以设计一个表的格式来记录上述有关结果并对数据进行归类划记。具体方法可以类似唱票的方式依次把每个数据准确地划归所属的组别,并以“正”号或“”号的记录方式体现在表中,便于计数检查。(7)登记次数根据划记结果,统计各组的次数f,并记入表格中。2.相对次数分布表(1)相对次数相对次数就是各组的次数f与总次数N之间的比值,若以Rf表示相对次数,则Rf=f/N。(2)相对次数分布表当把组别、组中值、次数、相对次数拼在一起时,便构成一个相对次数分布表。阅读相对次数分布表时,相对次数(当然是小数)较大的组,则说明落入该组内的数据个数占全部数据个数的比例也越多。反之,则越少。(3)相对次数分布表与简单次数分布表的用途相对次数分布表与简单次数分布表各有不同的用途,它们既可单独使用,又可联合使用。①当主要对各组的绝对次数感兴趣时,则可编制简单次数分布表。②当侧重关心各组次数的相对比例结构时,通常要编制相对次数分布表。③可以同时考察一批数据的简单次数分布和相对次数分布。3.累积次数分布表通过累积次数分布表能较轻易地了解到位于某个数值以下的数据个数有多少。实际上,只要把简单次数分布表中的组别、组中值以及累积次数拼在一起,便构成一个累积次数分布表。累积次数分布表分为“以下”累积次数分布表与“以上”累积次数分布表。4.累积相对次数分布表和累积百分数分布表(1)累积相对次数分布表累积相对次数是对相对次数进行累积的结果。因此,把简单次数分布表中的组别、组中值、累积相对次数拼在一起,就构成一个累积相对次数分布表。(2)累积百分数分布表由于累积相对次数仍然是小数,所以把这些小数乘上100,便得到“百分数”,从而可把累积相对次数分布表等价地转换为“累积百分数分布表”。因此,把简单次数分布表中的组别、组中值、累积百分数拼在一起,就构成一个累积百分数分布表。(三)次数分布图的绘制次数分布图有两种表达方式,即次数直方图和次数多边图两种。1.次数直方图(1)含义次数直方图是由若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形。(2)制作步骤:①以细线条标出横轴和纵轴(取正半轴即可),使其垂直相交。a.以纵轴为次数的量尺,按比例等间隔地标出刻度。b.横轴代表测验的分数量尺,也按适当的比例等间隔地标出次数分布中各组的组中值。c.一般,纵轴和横轴的尺度比例不一样。纵轴刻度往往从“0”开始,而横轴刻度则须根据最低一组的下限来确定。②每一直方条的宽度由组距i确定并已体现在横轴的等距刻度上。直方条的高度由相应组别的次数f多少决定。所有的直方条以各组的组中值为对称点,沿着横轴,依顺序紧密直立排列。③在直方图横轴下边标上图的编号和图的题目,并检查一下图形结构的完整性。(3)不足次数直方图的不足之处人们不易准确与快速地了解到各组的次数大小。为此,在绘制次数直方图时,有人也把各组的次数分别标在各个直方条的顶端,以便阅读。2.次数多边图(1)含义次数多边图是利用闭合的折线构成多边形以反映次数变化情况的一种图示方法。(2)制作步骤:①画纵轴和横轴的方法及要求与制作上述次数直方图相同,但要求在横轴上最低组与最高组外各增加一个次数f为0的组。②在两轴所在的直角坐标平面上,分别以每个组的组中值为横坐标、相应的次数为纵坐标,画出各个点。如果原先把数据分成K个组,那么加上两端额外增加的两个次数为0的组后共为(K+2)个组。因此,要在坐标平面上画出(K+2)个点。③用线段把相邻的点依次连接起来,连同横轴,构成一个闭合的多边形,即次数多边图。(3)次数分布曲线当一批数据的个数不是很多时,所绘制成的次数多边图常表现为不规则的多边形。从理论上讲,当一批数据的个数足够大时,随着分组时组距的不断变小,绘制成的次数多边图就越来越连续光滑,若分为无数组时,就形成一条极其光滑的曲线,这种曲线在统计学上称为次数分布曲线。3.相对次数直方图与多边图(1)相对次数直方图相对次数直方图和多边图与简单次数直方图和多边图相类似,其绘制的方法大致相同,所不同的是,简单次数分布图的纵轴是关于次数的量尺,而相对次数分布图的纵轴是相对次数的量尺。(2)相对次数多边图相对次数多边图的特点是,允许在同一个图形中描绘两个或三个不同的相对次数多边图,但要注意两点:一是数据的分组要相同,二是要用图注或不同的颜色来区别与辨认几个不同的次数多边图。4.累积次数分布图(1)累积次数分布图有直方图式和曲线图式两种,但最为常用的是累积次数曲线图,它是根据累积次数分布或累积相对次数分布制作而成。(2)累积次数曲线图的制作方法:①纵轴为累积次数的量尺,横轴的意义不变。②对于“以下”分布来讲,各个坐标点的位置,其横坐标是各组的实上限,纵坐标是累积的次数。③用连续光滑的曲线把点的轨迹连起来,再与横轴上最低组的实下限所在点连起来,形成“S”型曲线。5.累积相对次数曲线图与累积百分数曲线图根据累积相对次数分布以及累积百分数分布,可相应地绘制累积相对次数曲线图和累积百分数曲线图。它们的制作方法大体上与上述的累积次数曲线图相同,只是这里的纵轴是关于累积相对次数或累积百分数的量尺。二、几种常用的统计分析图(一)散点图1.含义散点图是用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系模式。散点图适合于描述二元变量的观测数据。2.绘制要求与注意事项(1)在平面直角坐标系中,横轴一般代表自变量,纵轴一般代表因变量;横轴既可作为连续性变量的量尺,也可作为离散性变量的量尺,但纵轴一般均代表连续变量的量尺。(2)点的描绘依二元观测数据而定,但在具体描绘时应注意用细线画坐标轴,用稍粗黑点描绘各个坐标点,点位置的确定按平面解析几何学中的方法。(3)注意图形的调和比例和必要的图注说明。3.特点(1)在形状方面:如果散点的形状为弯月状或不规则形状,则说明两个变量间的关系为非线性关系;如果从整体上看,散点的分布呈椭圆形,则说明两个变量间的相关趋势为线性趋势,散点越密集且椭圆越窄长,说明两个变量相关程度越高。(2)在方向方面:如果从整体上看,这些散点分布从坐标系左下角指向右上角,说明两个变量存在正相关关系;相反,如果散点分布从坐标系左上角指向右下角,则说明两个变量存在负相关关系。(二)线形图1.含义线形图是以起伏的折线来表示某种事物的发展变化及演变趋势的统计图。线形图适用于连续性的数据资料。通常用横坐标表示时间或自变量,用纵坐标表示频数或因变量,用直线或起伏的折线表示某种现象在时间上的发展趋势、两个变量之间的函数关系或一种现象随着另一种现象变化的情形。2.绘制要求与注意事项(1)纵横两个坐标轴的画法及量尺设计同散点图。(2)根据有关统计事项的具体数据,在由纵横两轴所决定的平面上画记圆点,然后用稍粗一些的线段把相邻的点依次连接。(3)在同一个图形中,允许画若干条(一般不超过5条)不同的线形图,以便比较分析。但要用不同形式的折线,如虚线、实线、点划线或不同颜色的折线等加以区分,并在图形中的适当位置上标明图例。(三)条形图1.含义条形图是用宽度相同的长条来表示各个统计事项之间的数量关系。2.条形图与直方图的区别:次数直方图中的直方长条是紧密排列的,适用于刻划连续性变量的观测数据;而条形图通常用于描述离散性变量(如属性变量)的统计事项。3.分类(1)简单条形图①含义简单条形图是用同类的直方长条来比较若干统计事项之间数量关系的一种图示方法,它适用于统计事项仅按一种特征进行分类的情况。②绘制要求与注意事项a.各个直方长条的宽度要相同,色调要一致;b.相邻长条之间的间隔要适当,根据统计项目的多少以及直方长条的宽度来权衡,一般这种间距大约为直方长条宽度的0.5~1倍。(2)复合条形图①含义复合条形图一般是用两类或三类不同色调的直方长条来表示多特征分类下的统计事项之间数量关系的一种图示方法。②绘制复合条形图的要求与注意事项a.各类直方长条的宽度要相同;b.不同类型的直方长条宜用不同的色调加以区别,并在图形右上方适当位置标明图例;c.把要比较的统计事项(二重分类)之直方长条靠在一起,而横轴(基线)上所标明的分类项目(一重分类)的直方长条之间要相互间开,其间距一般取长条宽度的0.1~0.15倍。(四)圆形图1.含义圆形图是以单位圆内各扇形面积所占整个圆形面积的百分比来表示各统计事项在其总体中所占相应比例的一种图示方法。整个圆代表所研究事物的总体,各扇形可用不同的色调加以区别,分别代表对总体事物进行分类后的统计事项;扇形的面积比例大小,完全依某一统计事项在其总体事物中的比例大小而定。因此,圆形图特别适用于描述具有百分比结构的分类数据。2.绘制圆形图的要求与注意事项(1)以适当的半径作一圆,代表事物总体。(2)分别以各统计事项在其总体中的比例乘以圆周角(即360°),求出各相应扇形的圆心角。(3)根据上述结果,用量角器把整个圆分划成若干个扇形部分,并在其中标上各自的百分比数值。(4)用不同的色调对不同的扇形加以区分,并在图形的右边标上图例以便阅读。(5)在图形的适当位置上,注明总体事物的数量,以弥补圆形图中只出现相对数而没出现绝对数的缺陷(也可把总体事物的数量体现在图题中)。(6)注意整个图形的对称与协调,在图形下边适当位置标上图号与图题,则圆形图即绘制完毕。1.2课后习题详解1.对组限的规范写法本书有何规定?答:组限是每个组的起始点界限。可以用几种不同的表述方式,见下表。表1
组限的五种表述方法(i=5)对于连续变量,尽管表中的五种表述方法形式不同,但它们所包含的意义与传统“教育与心理统计学”中的规定却是一致的。为了避免这种人为造成的误解并统一与规范关于组限的表述方法,本书建议并一贯采用表中的第三种、第四种或第五种这三种表述方法。对此,作几点说明如下:(1)表述组限与实际组限是两个不同的概念,但它们之间有规律性的联系。(2)当各相邻组的组限已经相互承接而没有间断时,便认为已把表述的组限与实际的组限统一起来,且不管这里表述组限中的实下限与实上限是整数还是小数。(3)按照本书上述规定的组限表述方法即可形成规范的组限表述方式,并与其他学科中的区间表达法统一起来。2.列举次数直方图或多边图的一些应用。答:次数直方图是由若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形,而次数多边图是利用闭合的折线构成多边形以反映次数变化的情况的一种图示方法。他们都适合连续性的数据。应用举例:如学生考试成绩的分布,商场一年12个月的销售额情况,学生去学校所花费的时间,某班学生的身高情况,某班学生的体重情况,体育课上学生一分钟内跳绳的次数,居民月平均用水量的情况等。3.试比较简单条形图与简单次数直方图在制作和应用方面的异同点。答:简单条形图是以若干平行而等宽的长条来表示离散型数据的对比关系的图形;次数直方图是指由若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形。(1)相同点①简单条形图与简单次数直方图都是统计学中常用的分布图。②简单条形图与简单次数直方图都含有长条。(2)不同点①简单条形图的长条是紧密相连的,而简单次数直方图的长条是分开的。②简单条形图适合用来描述离散型变量(如属性变量)的统计数据,而简单次数直方图则是用来刻划连续性变量的观测数据。4.简述散点图、折线图、条形图和圆形图这四种统计分析图的应用特点。答:(1)散点图散点图是用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系模式。散点图适合于描述二元变量的观测数据,对于探究两种事物、两种现象之间的关系起着重要作用。(2)折线图折线图是以起伏的折线来表示某种事物的发展变化及演变趋势的统计图。适用于描述某种事物在时间序列上的变化趋势,也适用于描述一种事物随另一事物发展变化的趋势模式,还可适用于比较不同的人物团体在同一心理或教育现象上的变化特征及相互联系。(3)条形图条形图通常用于描述离散性变量(如属性变量)的统计事项,其中简单条形图是用同类的直方长条来比较若干统计事项之间数量关系的一种图示方法,它适用于统计事项仅按一种特征进行分类的情况。复合条形图一般是用两类或三类不同色调的直方长条来表示多特征分类下的统计事项之间数量关系的一种图示方法。(4)圆形图圆形图是以单位圆内各扇形面积所占整个圆形面积的百分比来表示各统计事项在其总体中所占相应比例的一种图示方法。圆形图特别适用于描述具有百分比结构的分类数据。5.以表1-3中的有关数据,绘制相对次数直方图与多边图(可画在同一个图上)。答:略。6.以表1-3中的有关数据,绘制“以上”累积相对次数(百分数)曲线图。答:略。1.3考研真题与强化习题详解一、单项选择题1.运用相对累加次数分布曲线,可以快速计算出与学生原始分数相对应的统计量是()。[统考2010研]A.百分等级B.Z分数C.T分数D.频次【答案】A【解析】运用相对累加次数分布曲线,可以根据横坐标的原始分数,从纵坐标上读出对应的百分等级。2.适用于描述某种心理属性在时间上变化趋势的统计分析图是(
)。[统考2010研]A.茎叶图B.箱形图C.散点图D.线形图【答案】D【解析】茎叶图是将数据中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少;箱形图的绘制须使用常用的统计量,最适宜提供有关数据的位置和分散的参考,尤其在不同的母体数据时更可表现其差异;散点图是以平面直角坐标系上点的散布图形来表示两种事物之间的相关关系。而线形图是以起伏的折线来表示某种事物的发展变化及演变趋势的统计图。通常用横坐标表示时间或自变量,用纵坐标表示频数或因变量,用直线或起伏的折线表示某种现象在时间上的发展趋势、两个变量之间的函数关系或一种现象随着另一种现象变化的情形。3.用于描述两个变量之间相关关系的统计图是()。[统考2007研]A.直方图
B.线形图
C.条形图
D.散点图【答案】D【解析】散点图是用来表示两种事物之间的相关性及联系模式的点散布的图形,适用于描述二元变量的观测数据;直方图是由若干宽度相等、高度不等的直方条紧密排列在同一基线上构成的图形;线形图是以起伏的折线来表示某种事物的发展变化趋势及演变趋势的统计图,适用于描述某种事物在时间序列上的变化趋势,也适用于描述一种事物随另一事物发展变化的趋势模式,还可以适用于比较不同的人物团体在同一心理或教育现象上的变化特征及相互联系;条形图是用宽度相同的长条来表示各个统计事项之间的数量关系,通常应用描述离散性变量的统计事项。4.以下各种图形中,表示连续性资料频数分布的是(
)。A.条形图
B.圆形图
C.直方图
D.散点图【答案】C【解析】直方图,又名等距直方图,是以矩形的面积表示连续性随机变量次数分布的图形;条形图主要用于表示离散型数据资料;圆形图主要用于描述间断性资料;散点图主要是用来表示统计资料数量大小以及变化趋势。5.通常用于描述离散性变量的统计图是(
)。A.条形图
B.散点图
C.线形图
D.直方图【答案】A【解析】条形图主要用于表示离散型数据资料;散点图主要是用来表示统计资料数量大小以及变化趋势,适合于描述二元变量的观测数据,其中代表自变量的横轴既可作为连续性变量的量尺,也可作为离散性变量的量尺,但代表因变量的纵轴一般均代表连续变量的量尺。线形图是以起伏的折线来表示某种事物的发展变化及演变趋势的统计图,适用于连续性的数据资料。直方图,又名等距直方图,是以矩形的面积表示连续性随机变量次数分布的图形。6.统计表的标题应该位于表格的(
)。A.下方
B.上方C.右侧
D.根据实际,随意安置【答案】B【解析】统计表的标题是一个表格的名称,应写在表的上方。7.统计图的图题位置应该在图形的(
)。A.下方
B.上方
C.右侧
D.根据实际,随意安置【答案】A【解析】图题或标题是统计图的名称。图题的文字要言简意赅,具有说明性和专指性,使人一看就能知道该图所要显示的是何事、何物,发生于何时、何地。与统计表格不同的是,统计图形的标题常置于图的正下方。8.次数分布反映的是()。A.一批数据中多数观测数值所出现的次数多少的情况B.一批数据中少数观测数值所出现的次数多少的情况C.一批数据中各个不同观测数值所出现的次数多少的情况D.一批数据中理论上数值出现的次数多少的情况【答案】C【解析】次数分布是指一批数据中各个不同观测数值出现次数多少的情况,或指这批数据在数轴上各个区间内出现次数多少的情况。9.两变量的相关分析中,若散点图的散点完全在一条直线上,则有(
)。A.r=1
B.r=-1C.|r|=1
D.α=1【答案】C【解析】假设在直角坐标系中,以X轴为基线,每一对数据值准确地落在一条直线上,且直线左高右低,就为完全负相关(r=-1);如果直线的方向呈左低右高,则为完全正相关(r=1)。10.若积差相关系数,,则二者所表示的密切程度的关系为(
)。A.
B.
C.不确定
D.以上答案都不对【答案】B【解析】相关系数取值的大小表示相关的强弱程度。如果相关系数的绝对值在0与1.00之间,则表示不同程度的相关。绝对值接近0值端一般为关系不够密切;绝对值接近1.00端,一般为相关程度密切。二、多项选择题1.次数分布可分为()。A.简单次数分布B.分组次数分布C.相对次数分布D.累积次数分布【答案】ABCD【解析】次数分布显示初步整理后一组数据的分布情况。依据它所显示的次数如何产生,次数分布可区分为简单次数分布、分组次数分布、相对次数分布和累积次数分布。次数分布表和次数分布图就是各种次数分布的列表形式和图示形式。2.编制良好的次数分布表所具有的功能和特点有()。A.可以看出一组数据的大致分布形态B.显示出这组数据的集中情况和离中情况C.以牺牲原始数据精确度为代价D.以保留原始数据精确度为目标【答案】ABC【解析】次数分布表不仅可以显示一组数据的大致分布形态,还可以显示这组数据的集中情况和离中情况等。当然,这样做是以牺牲原始数据的精确度为代价的,但一般情况下,精简数据的意义更大。3.以下各种图形中,表示连续性资料频数分布的有(
)。A.圆形图B.直方图C.直条图D.线形图【答案】BD【解析】直方图是以矩形的面积表示连续性随机变量次数分布的图形;条形图用于表示离散型数据资料;圆形图主要用于描述间断性资料;线形图主要用于连续性资料。4.下列相关系数中表示两个变量变化方向一致的是(
)。A.r=0.15B.r=0.35C.r=-0.8D.r=0.8【答案】ABD【解析】相关系数的“+、-”(正、负)号表示双变量数列之间相关的方向,正值表示正相关,即;两个变量变化方向一致;负值表示负相关,即两个变量的变化方向相反。5.绘制散点的要求有()A.各类直方长条的宽度要相同B.在平面直角坐标系中,横轴一般代表自变量,纵轴一般代表因变量。C.横轴既可作为连续性变量的量尺,也可作为离散性变量的量尺,但纵轴一般均代表连续变量的量尺。D.点的描绘依二元观测数据而定,但在具体描绘时应注意用细线画坐标轴,用稍粗黑点描绘各个坐标点。【答案】BCD【解析】A项属于画直方图的注意事项。三、名词解释题1.散点图答:散点图是用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系模式。散点图适合于描述二元变量的观测数据。散点图的横坐标为X变量,纵坐标为Y变量,图上每一点代表一对观测值。因其用圆点的多少、疏密表示两个变量间关系的程度,因而得名为“散点图”。在形状方面:如果散点的形状为弯月状或不规则形状,则说明两个变量间的关系为非线性关系;如果从整体上看,散点的分布呈椭圆形,则说明两个变量间的相关趋势为线性趋势,散点越密集且椭圆越窄长,说明两个变量相关程度越高。在方向方面:如果从整体上看,这些散点分布从坐标系左下角指向右上角,说明两个变量存在正相关关系;相反,如果散点分布从坐标系左上角指向右下角,则说明两个变量存在负相关关系。2.线形图答:线形图适用于连续性的数据资料。通常用横坐标表示时间或自变量,用纵坐标表示频数或因变量,用直线或起伏的折线表示某种现象在时间上的发展趋势、两个变量之间的函数关系或一种现象随着另一种现象变化的情形。四、简答题哪些测量和统计的原因会导致两个变量之间的相关程度被低估。[北师大2004研]答:从测量和统计的角度来讲,两个变量之间相关程度被低估的原因如下:(1)测量的原因测量方法的选择、两个变量测验材料的选择和收集、测量工具的精确性、测量中出现的误差、测验中主试和被试效应、测量的信度和效度、测验分数的解释等。(2)统计的原因全距限制问题会导致低相关现象,它是指相关系数的计算要求每个变量内各个分数之间必须有足够大的差异,数值之间必须有显著的分布跨度或变异性;没有满足计算相关系数的前提假设也会低估相关系数,如用皮尔逊相关计算非线形关系的两个变量间的相关系数。第2章常用统计参数【本章重点】☆算术平均数的性质与优缺点☆中数的计算与适用情况☆集中量数与差异量数的比较☆方差与标准差☆百分等级与百分位数☆区分皮尔逊积差相关、等级相关和质量相关2.1复习笔记一、集中量数集中量数是指描述数据集中趋势的统计量,包括算术平均数、加权平均数、几何平均数、中数、众数等,它们均用于度量次数分布的集中趋势。(一)算术平均数算术平均数,简称为平均数、均数,是用以度量连续变量次数分布集中趋势的最常用的集中量数。1.总体平均数与样本平均数(1)总体平均数如果一个总体X包含N个元素,xi是这个总体中的第i个元素,则称xi为第i次观测值,那么对X,该总体的算术平均数被定义为式中:——总体算术平均数;N——总体容量;xi——第i次观测值。(2)样本平均数当无法对总体进行全面观测时,选取总体中一个样本容量为n的样本,其算术平均数被定义为:式中:——样本平均数;n——样本容量。2.加权平均数若已知各组平均数和各组人数,要求总的平均数时,则要用加权平均数的方法,其计算公式为:式中:——总平均数(加权平均数);n1,n2…,nk——各组人数;——各组平均数;nT——总人数。3.算术平均数的性质(1)每一个观测值都加上一个相同常数c后,计算得到的平均数等于原平均数加上这个常数c。(2)每一个观测值都乘以一个相同常数c后,计算得到的平均数等于原平均数乘以这个常数c。(3)每个观测值都乘以一个相同常数c,再加上一个常数d后,计算得到的平均数等于原平均数乘以该常数c再加上常数d。(4)观测值与平均数离差的总和为零。(5)观测值与任意常数c的离差平方和,不小于观测值与平均数的离差平方和。4.算术平均数的优缺点(1)优点①反应灵敏;②确定严密;③简明易解;④计算简便;⑤能作进一步的代数运算;⑥较少受抽样变动的影响。(2)缺点①易受极端数据影响;②出现模糊数据时无法计算;③存在不同质数据时无法计算。(二)几何平均数1.适用条件(1)一组数据中任何两个相邻数据之比接近于常数,即数据按一定的比例关系变化;(2)当一组数据中存在极端数据,分布呈偏态时。2.基本公式式中:g——几何平均数;n——数据个数;xi——原始数据。当n很大时用基本公式要开n次方,计算上有很大困难,为此常使用对数形式计算:g式中:——xi的对数。因此,几何平均数又称为对数平均数。3.应用(1)心理物理学中等距与等比量表实验的数据处理(2)平均增长率的计算(三)中数1.含义中数又称中位数,符号记为Mdn,是指位于一组数据数列中间位置的那个数。它可以是数列中的某一个原始数据,也可以是通过计算得到的一个数。总之,如果将一组数据按大小顺序排列,则中数一定是将数据个数平均分为大小相等两部分的那个数。2.计算方法(1)首先确定中数在数据序列中的位置:nMdn=式中:nMdn——中数在数列中的位置;n——数列数据个数。(2)然后再求数列中位于nMdn位置上的那个数——Mdn。3.适用条件(1)一组数据中出现极端数据时(2)一组数据的两端出现模糊数据时4.优缺点(1)优点①计算简单;②不受极端数据影响。(2)缺点①不能充分利用数据所提供的信息;②对极端值不敏感;③受抽样的影响较大,不稳定;④难以作进一步的代数运算。(四)众数1.含义众数又称范数,常用符号M0表示,指次数分布中出现次数最多的那个数的数值。2.计算方法皮尔逊的经验法计算众数M0=3Mdn-2式中:M0——众数;Mdn——中数;——平均数。3.适用条件(1)需要快速而粗略地寻求一组数据的代表值;(2)一组数据中出现不同质的数据;(3)次数分布中存在极端数值;(4)利用平均数与众数之差表示次数分布是否偏态;(5)粗略估计数据次数分布的形态。4.优缺点(1)优点①容易通过观察图表获得众数;②对于分类变量,众数是描述平均值的一个最好办法。(2)缺点①不能充分利用数据提供的信息;②众数不稳定,受分组和抽样变动的影响;③不利于进一步的代数运算。二、差异量数次数分布中数据间彼此差异的程度称为数据的离中趋势。离中趋势反映了次数分布的离散程度,即变异性。描述离中趋势的统计量称为差异量数,差异量数包括平均差、方差与标准差等,反映次数分布的离中趋势。(一)平均差1.含义平均差是次数分布中所有原始数据与平均数距离的绝对值的平均,一般用符号AD表示。2.计算公式:(适用于总体)(适用于样本)式中:x1——原始数据;μ——总体平均数;——样本平均数;N——总体容量;n——样本容量;——离均差。3.平均差的优缺点(1)优点①从平均的角度反映了各个数据偏离中心位置的整体差异程度,比较直观,容易理解;②以全体观测数据作为计算的依据,充分利用了数据提供的信息,能够反映全部观测数据变动情况和离散程度。(2)缺点平均差的计算要取绝对值,不利于进一步的统计分析。(二)方差与标准差方差与标准差是最经常用于描述次数分布离散程度的差异量数。1.总体方差与总体标准差如果xi是就一个容量为N的总体的第i次测定,得到的观测是x1,x2,x3,…xN,那么,总体方差:总体标准差:2.样本方差与样本标准差如果从被研究总体中抽取一个容量为n的样本,xi是这一样本的第i次测定,得到的观测是x1,x2,…xN,,那么,样本方差:样本标准差:3.标准差的合成方差具有可加性,在已知几个组方差或标准差的情况下,可以计算它们的总方差或总标准差。合成标准差时,只有在应用同一种观测手段,对不同样本的同一特质测量时才能应用。合成公式:式中:——合成后的标准差;——合成后的平均数。4.标准差的性质①每一个观测值都加一个相同常数c后,计算得到的标准差等于原标准差。也就是说,若一组数据中的每一个数都加上一个相同的常数,则这组数据彼此的离散程度并不改变,而只是数据分布在数轴上整体地平移这个常数距离。②每一个观测值都乘以一个相同的常数c,则所得的标准差等于原标准差乘以这个常数c。③每个观测值都乘以同一个常数c(c≠0),再加上一个常数d,所得标准差等于原标准差乘以这个常数c。(3)方差和标准差的意义①方差和标准差是表示一组数据离散程度的最好指标。其值越大,说明次数分布的离散程度越大;其值越小,说明次数分布的数据比较集中,离散程度越小。②方差与标准差具有反应灵敏,计算严密,受抽样变动的影响较小等良好差异量数的条件,在统计实践中,人们常将其与平均数一起描述一组数据的全貌。③方差具有可加性,它是对一组数据中造成各种变异的总和的测量。统计实践中常利用方差的可加性分解并确定属于不同来源的变异,并进一步说明各种变异对总结果的影响。方差是推断统计最常用的统计量数。(4)不适用方差和标准差的情况①两个或两个以上次数分布的数据在测量单位上不同②在一些特别场合下,尽管两个或两个以上数据的测量单位相同,但其平均数相差较大时,不适用方差和标准差。(三)差异系数差异系数又称变异系数,它是一种相对差异量数,常用CV表示。1.适用条件(1)两个或两个以上样本所测的特质不同;(2)两个或两个以上样本所测的特质相同,但样本间的水平相差较大。2.计算公式式中:S——样本标准差;——样本平均数。三、地位量数地位量数是指原始变量在其所处分布中地位的量数,因为它是相对于次数分布而言的,故又称为相对地位量数,包括百分位分数、百分等级分数、标准分数和T分数等。(一)百分位分数1.含义百分位分数是一种相对地位量数,它是次数分布中的一个点。把一个次数分布排序之后,分为100个单位,百分位分数就是次数分布中相对于某个特定百分点的原始分数,它表明在次数分布中特定个案百分比低于该分数。百分位数分数用P加下标m(特定百分点)表示。2.计算公式:式中:Pm——第m百分位分数;L——Pm所在组的组下限;U——Pm所在组的组上限;f——Pm所在组的次数;Fb——小于L的累积次数;Fb——大于U的累积次数。(二)百分等级分数1.含义百分等级分数也是一种相对地位量数,它是次数分布中低于这个原始分数的次数百分比,用PR表示。百分等级分数指出原始数据在常模团体中的相对位置,百分等级越小,原始数据在分布中的相对位置越低,百分等级越大,原始数据在常模团体中的位置越高。2.百分等级与百分位数的区别:(1)百分位分数也是一种相对地位量数。百分位分数是预先确定分布中的某个百分点(m),然后根据这个百分点(m)去求相应的百分位分数(Pm)。(2)百分等级分数是事先知道分布中的一个原始分数,再求这个原始分数在分布中所处的相对位置。3.计算百分等级分数的公式:式中:Fb——小于L的累积次数;f——某特定原始变量所在组的次数;L——某特定原始变量所在组的下限;i——组距;N——次数分布的总次数。(三)百分位量表的优缺点在教育与心理测量学中,百分位分数与百分等级分数均称为百分位量表,其优缺点为:1.优点(1)计算简便(2)意义明确(3)对各种测验普遍适用。2.缺点(1)百分位量表是一个顺序量表,不具相等单位,不能作进一步的数学运算,无法作进一步的统计分析。(2)由于百分位量表的分布呈长方形,当测验分数的分布为正态或接近正态时,百分位量表将夸大分布中间的原始分数的差异而缩小分布两端的原始分数的差异。四、相关分析(一)相关系数及其解释1.相关(1)相关与相关分析①相关事物之间存在联系但又不能直接作出因果关系的解释时,称事物间的这种联系为相关。②相关分析相关指事物之间确实存在的相互联系,用一些合理的指标对相关事物的观测值进行的统计分析称为相关分析。(2)相关散点图相关散点图是指将具有相关关系的两种现象的成对观测值标在平面直角坐标系中,从而直观地反映出它们的相关情况。它直观地显示了两个事物的成对观测值之间是否存在相关,存在什么样的相关以及相关程度。2.相关系数及其解释(1)含义相关系数是两列变量间相关程度的数量化指标。总体间相关程度的统计特征值用表示。样本间相关程度的统计特征值用r表示。相关系数的取值范围介于-l.O0至+1.O0之间,常用小数形式表示。(2)分数解释①相关系数的正负号表示相关方向,正值表示正相关,负值表示负相关;②相关系数的绝对值大小表示相关的程度,其取值不同,表示相关程度不同;③相关系数为零时,称零相关,表示两列变量之间不具线性相关;④相关系数为+1.O0时,表示两列变量之间完全正相关;相关系数为-1.O0时,表示两列变量之间完全负相关,它们都称为完全相关。(二)常用相关分析方法及其计算1.积差相关系数(1)含义积差相关系数又称积矩相关系数,由英国统计学家皮尔逊(Pearson)提出,故也称皮尔逊相关,这是一种求直线相关的基本方法。(2)适用条件①两列变量都是等距的或等比的测量数据;②两列变量所来自的总体必须是正态的或近似正态的对称单峰分布;③两列变量必须具备一一对应的关系,各对数据之间相互独立,且成对数据的数目一般不少于30对。(3)计算公式:式中,xi、yi、、、n的意义均同前所述。若记为x=xi一,y=Yi-,则上式成为:式中,称为协方差,的绝对值大小直观地反映了两列变量的一致性程度。然而,由于X变量与Y变量具有不同测量单位,不能直接用它们的协方差来表示两列变量的一致性,所以将各变量的离均差分别用各自的标准差除,使之成为没有实际单位的标准分数,然后再求其协方差。即:利用原始数据直接计算rXY的公式:2.等级相关等级相关也是一种相关分析方法。当测量得到的数据不是等距或等比数据,而是具有等级顺序的测量数据;或者当得到的数据是等距或等比的测量数据,但其所属的总体分布不是正态的,这两种情况求两列变量或多列变量的相关,要用等级相关方法。(1)斯皮尔曼等级相关①适用条件a.属于等级变量性质的具有线性关系的两列数据b.虽然属于等距或等比变量性质但呈非正态分布的数据,也可将其转化为1到n之间的等级值,计算其等级相关c.当数据样本对低于30个时,可以较为快速地得出相关系数②计算公式式中:D=RX—RY——对偶等级之差;n——对偶数据个数。如不用对偶等级之差,而用原始等级序数计算,则可用下式式中:Rx——X变量的等级;RY——Y变量的等级;n——对偶数据个数。(2)肯德尔W系数(肯德尔和谐系数)肯德尔W系数又称肯德尔和谐系数,是表示多列等级变量相关程度的一种方法。①适用条件适用于两列以上等级变量。②计算公式:式中:SSRi——Ri的离差平方和;K——等级变量的列数或评价者数目;n——被评价对象数目。③分数解释a.当K个评价者对几件事物进行等级评定,如果K个评价者的意见完全一致,此时的W=1;b.若K个评价者的意见完全不一致,则SSRi=0,此时的W=0;c.如果K个评价者的意见存在一定的关系,但又不是完全一致,则,SSRi≠0。因此,肯德尔W系数的变化范围为0≤w≤1。3.质量相关将一列变量按事物的某一属性划分种类,而另一列变量则为等比或等距的测量数据,这种情况下求得的相关,称为质量相关。(1)点双列相关①适用条件点双列相关适用于双列变量中一列为来自正态总体的等距或等比的测量数据,另一列变量为二分称名变量,即按事物的某一性质只能分为二类相互独立的变量,如男与女、文盲与非文盲等。②计算公式:式中:p——二分称名变量中取某一值的变量比例;q——二分称名变量中取另一值的变量比例;——等距(比)变量中与P对应的那部分数据的平均值;——等距(比)变量中与q对应的那部分数据的平均值;SX——全部等距(比)变量的标准差。③应用点双列相关在教育与心理测量研究中常作为选择题的区分度指标。(2)双列相关①适用条件双列相关适用于两列变量均为来自正态总体的等距(比)变量,而其中一列被人为地划分为两个类别的数据。②计算公式:式中:——等距(比)变量中与p相对应的那部分数据的平均值;——等距(比)变量中与q相对应的那部分数据的平均值;Sx——全部等距(比)变量的标准差;p——二分变量中取某一值的变量比例;q——二分变量中取另一值的变量比例;Y——标准正态曲线下p与q交界点的y轴高度(可查正态分布表得出)。③应用双列相关在教育与心理测量研究中常作为问答题的区分度指标。2.2课后习题详解1.算术平均数、几何平均数、中数、众数,各适用于教育与心理研究领域的哪些数据资料?答:参见本章复习笔记。2.下表是某校五年来毕业生人数,试求其平均增长率,并估计照此速度增长,五年后该校毕业生人数是多少。年
度19851986198719881989人
数7307608409801150解:以1985年为基数,求5年后的平均增长率,因此,参与计算的年数为n-1=4,先求平均增长率,用变式来计算:=若照此增长的速度,5年后该校的毕业生人数将是:1150×(1.120)5≈2027答:平均增长率为1.120,按照这样的增长速度,五年后,该校的毕业生将达到2027人。3.一个次数分布有哪些基本特征?度量它们的统计量有哪些?答:(1)一组变量的次数分布,一般至少有以下两个方面的基本特征:①中心位置:中心位置用以度量一组数据的集中趋势,描述它们的中心位于何处,故对其数量化描述称为位置度量数或集中量数,如算术平均数、几何平均数、中数、众数等。②离散性:离散性反映一组数据的分散程度,即次数分布的离散程度。对其数量化描述称为次数分布变异特性的度量或差异量数,如标准差、方差、变异系数等。中心位置相同的次数分布,其离散程度不一定相同。(2)度量的统计量对任何一个已知的次数分布,均可以计算出反映中心位置和离散性的量数。总体统计特征的量数称为参数,用希腊字母表示;样本统计特征的量数称为统计量,用英文字母表示。4.标准差在教育与心理研究中有哪些用途?答:标准差是经常用于描述次数分布离散程度的差异量数,在教育与心理学的统计中具有非常重要的作用。(1)标准差的主要作用是估计正常值的范围在教育与心理研究中,估计观察值正常值范围应该用标准差,其能够综合表达一组观察值的集中和离散特征的变异情况,标准差的大或小说明数据取值的分散或集中。其值越大,说明次数分布的离散程度越大;其值越小,说明次数分布的数据比较集中,离散程度越小。(2)标准差还可用来计算变异系数(CV)当两个或两个以上样本所测的特质不同、两个或两个以上样本所测的特质相同但样本间的水平相差很大时,应使用相对差异量数。变异系数就是一种相对差异量数,其计算公式为:,式中:S——样本标准差;——样本平均数。因此,标准差还可用来计算变异系数。5.某教育实验共有四个协作组,下表是各协作组的测验数据,请求出总平均数,总标准差。解:(1)总平均数:(2)总标准差答:四个协作组的总平均数为88.44,总标准差为7.95。6.根据表2-1所列次数分布,求P80百分位分数;求86分的百分等级分数。解:(1)根据百分位数的公式:(2)根据百分等级的公式:答:本次考试中P80百分位分数为65.10,而86分的百分等级分数为98.18,即有98.18%的应试者分数低于86分。7.解释相关系数时应注意什么?答:参见本章复习笔记。8.假设两变量为线性关系,对下列各种情况各应使用什么方法计算相关系数?①两列变量是等距或等比变量,且均为正态分布;②两列变量是等距或等比变量,但不为正态分布;③一列变量为正态连续变量,另一列变量为正态连续变量但被人为地分为两类;④一列变量为正态连续变量,另一列变量为二分称名变量;答:(1)“两列变量是等距或等比变量,且均为正态分布”应使用皮尔逊积差相关计算相关系数。(2)“两列变量是等距或等比变量,但不为正态分布”应使用斯皮尔曼等级相关计算相关系数。(3)“一列变量为正态连续变量,另一列变量为正态连续变量但被人为地分为两类”应使用二列相关计算相关系数。(4)“一列变量为正态连续变量,另一列变量为二分称名变量”应使用点二列相关计算相关系数。9.教育测量学中试题的区分度以题目得分与试卷总分的相关系数表示。下表是一次测验的有关数据。(试卷总分为正态分布)(1)第一题为选择题,试求其区分度。答:因为试题的总分为正态分布,而题目为选择题,所以应该采用点二列相关:,将以上数据代入可得rpb=0.354。(2)第六题满分值为5分,若将题目得分Xi≥3规定为通过本题,Xi<3为不通过本题,试求其区分度。答:因为分数为正态分布,而第6题却人为的分为通过与不通过,所以应该采用二列相关的方法来计算区分度:查正态分布表,当p=0.8时,y=0.280将数据代入以上公式,可得rb=0.20。(3)第十二题得分服从正态分布,试求其区分度。答:因为两列数据都为正态分布,所以采用皮尔逊积差相关的方法来计算区分度。分别计算出,将原始数据代入上式即可得:rxy=0.72。10.6位教师各自评阅相同5篇作文,每位教师给每一篇作文所评等级见下表,试求6位教师所评等级的一致性(评分者信度)。解:根据题意可知,这是看K名评价者对n个事物的评价,这属于肯德尔和谐系数相关,因为每名评级者都没有相同的等级:首先计算出中间量,
12345A35241
B35241
C34152
D35142
E35241
F35241
18291025890324841100625641954根据题意,该评分者信度应该采用肯德尔和谐系数进行计算.将相应的数据带入公式:,得:
答:6位教师所评等级的一致性(评分者信度)为0.927。2.3考研真题与强化习题详解一、单项选择题1.要把标准差转化为方差,研究者要完成的工作是(
)。[统考2010研]A.计算标准差的平方根B.用样本n除以标准差C.用l/Z除以标准差D.计算标准差的平方【答案】D【解析】标准差是方差的算术平方根,所以要将标准差转化为方差,只需计算标准差的平方。2.一位研究者随机调查了50名城市居民为孩子购买课外读物的花费,另外还搜集了老师对这些孩子的总体评价,得到积差相关系数为0.53。下列推断中,正确的是()。[统考2010研]A.如果另外再随机调查50名乡镇居民,他们为孩子购买课外读物的花费与老师对其孩子总体评价之间的相关系数会非常接近0.53B.用城市居民为孩子购买课外读物的花费预测老师对其孩子总体评价的准确率为53%C.城市居民为孩子购买课外读物的花费决定老师对其子女的总体评价D.城市居民为孩子购买课外读物的花费与老师对其孩子的总体评价之间存在中等程度的相关【答案】D【解析】相关系数是两列变量间相关程度的数字表现形式,或者说是表示相关程度的指标。两变量存在相关并不代表两变量之间一定存在因果关系。0.53的相关属于中等程度的相关。根据下图,回答3~5题。3.甲、丙两图表示的数据分布形态分别是(
)。[统考2010研]A.正偏态和负偏态分布B.正偏态和正态分布C.负偏态和正态分布D.负偏态和正偏态分布【答案】A【解析】在一个正态分布中,平均数、中数、众数三者相等,在正偏态分布中,;在负偏态分布中,。因此,甲图为正偏态,乙图为正太分布,丙图为负偏态分布。4.描述甲、丙两图特征的集中量数中,数值最大的分别是(
)。[统考2010研]A.甲图——众数、丙图——平均数B.甲图——中数、丙图——众数C.甲图——平均数、丙图——众数D.甲图——平均数、丙图——平均数【答案】C【解析】描述甲、丙两图特征的集中量数中,数值最大的分别是甲图——平均数、丙图——众数。5.关于乙图,下列描述不正确的是(
)。[统考2010研]A.平均数、众数、中数相等B.图形围绕平均数左右对称C.图形中曲线与横轴之间的面积为1D.标准差的变化不影响该图形的形态【答案】D【解析】乙图是正态分布,它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。在一个正态分布中,平均数、中数、众数三者相等。正态分布的特点:正态分布的形式是对称的,对称轴是经过平均数点的垂线;中央点最高,逐渐向两侧下降;正态曲线下面积为1;为一族分布;平均数为0标准差为1。6.在一组正态分布的数据中,去掉两端极值后,一定不会受到影响的统计特征值是()。[统考2009研]A.全距
B.平均值
C.标准差
D.众数【答案】D【解析】因为该数据是正态分布,众数是指该数据中出现最多的数据,所以去掉两端的极端值之后,它不会受到影响。7.要比较几个不同性质的测验分数,最恰当的是比较(
)。[统考2009研]A.原始分数
B.众数
C.百分等级
D.平均数【答案】C【解析】因为测验分数的性质不同,则这几个测验的众数、百分数和平均数所代表的意义是不同的,所以不能直接进行比较。而百分等级是一个相对量数,它表示该测验分数的个体在群体中所处的位置,表示在这个群体中低于这个分数所占的百分数。因此,可以进行比较。8.一组数据中每个数的值都是5,那么这组数据的标准差和方差分别是(
)。[统考2009研]A.0,0
B.5,25
C.0,5
D.0,25【答案】A【解析】方差公式为:,表明原始数据与总体平均数之间的距离,如果都相同则可知数据之间的差异为0,而标准差是方差的开方,因此也为0。9.根据测验中不同维度或分测验的导出分数,绘制形成的折线图或柱形图称为()。[统考2009研]A.结构图
B.碎石图
C.剖面图
D.茎叶图【答案】C【解析】剖面图是根据测验中不同维度或分测验的导出分数,绘制形成的折线图或柱形图。茎叶图又称“枝叶图”,它的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。10.有一组数据:3,6,2,7,32,4,8,6,5。要描述这组数据的特征,受极端数据值影响的统计量是(
)。[统考2008研]A.平均数
B.中数
C.四分位数
D.众数【答案】A【解析】计算平均数时,所有数据都参加了计算,因此,比较敏感,易受到极端数据的影响。中数、众数和四分位数的计算仅选取了数据组的部分数据,因此,受极端数据影响相对较小。11.一组数据的平均数是100,标准差是25,这组数据的变异系数是()。[统考2008研]A.4%
B.25%
C.4
D.25【答案】B【解析】变异系数。12.在某次考试中,小明的语文、数学成绩均为80,英语成绩为75。已知全班三科平均成绩都为65,语文标准差为10,数学标准差为15,英语标准差为5。小明三科的成绩按照标准分由大到小进行排序的结果是(
)。[统考2008研]A.语文、数学、英语
B.英语、数学、语文C.英语、语文、数学
D.语文、英语、数学【答案】C【解析】,,,因此,>>。13.对于具有线性关系的两列正态分布的连续变量,计算它们相关系数最恰当的公式是是()。[统考2008研]A.
B.C.
D.【答案】D【解析】D项是计算皮尔逊积差相关系数的公式,其应用条件是具有线性关系的两列正态分布的连续变量。A项是计算斯皮尔曼等级相关系数的公式,其应用条件是具有线性关系的两列非正态分布的连续变量或等级变量。B项是点二列相关系数的计算公式,其应用条件是一列为等距正态变量与一列二分称名变量。C项是二列相关系数的计算公式,其应用条件是两个等距正态变量,其中一列被人为分成二分变量。14.一项研究调查了不同性别的成年人对在公众场合吸烟的态度,结果如表所示。那么,性别与对待吸烟的态度之间的相关系数是()。[统考2008研]A.0.12
B.0.32
C.0.48
D.0.54【答案】B【解析】计算真正二分变量的四格表相关,应该使用φ相关:15.某考生在一项测验中得分60,经换算百分等级为70,这表明在所有考生中,得分低于该考生的人数占总人数的()。[统考2007研]A.30%
B.40%
C.60%
D.70%【答案】D【解析】百分等级分数是一种相对地位量数,表示该测验分数的个体在群体中所处的位置,表示在这个群体中低于该分数所占的百分数。作为经常使用的一种测验分数,对分数解释有较大的意义。16.现有一列数据,它们是4,4,5,3,5,5,2。这列数据的平均数、众数和全距依次是()。[统考2007研]A.4,4,2
B.4,5,3
C.5,4,4
D.5,5,1【答案】B【解析】平均数是用以度量连续变量次数分布集中趋势最常用的集中量数,其计算公式就是将所有的数据相加,再用数据的个数去除数据的总和;众数是指次数分布中出现次数最多的那个数的数值;全距又称两极差,是把一组数据按从小到大的顺序排序,用最大值减去最小值,是说明离散程度的最简单的统计量。17.已知某次学业成就测验的平均分数是80,标准差为4。如果某考生得分为92,则该分数转换为标准分后是(
)。[统考2007研]A.1
B.2
C.3
D.4【答案】C【解析】根据标准分的计算公式:,得到18.某班学生数学测验的成绩排名属于()。A.称名变量
B.顺序变量
C.等距变量
D.比率变量【答案】B【解析】顺序数据是指既无相等单位,也无绝对零点的数据。顺序数据是按事物某种属性的多少或大小,按次序将各个事物加以排列后获得的数据资料。如学生的等级评定、喜爱程度、品质等级、能力等级、兴趣等。19.只说明某一事物与其他事物在名称、类别或属性上的不同,并不说明事物与事物之间差异大小、顺序先后及质的优劣的变量是()。A.称名变量
B.顺序变量
C.等距变量
D.比率变量【答案】A【解析】称名数据只说明某一事物与其他事物在属性上的不同或类别上的差异,它具有独立的分类单位,其数值一般都取整数形式,只计算个数,并不说明事物之间差异的大小;顺序数据是指既无相等单位,也无绝对零点的数据,是按事物某种属性的多少或大小,按次序将各个事物加以排列后获得的数据资料;等距数据是有相等单位,但无绝对零点的数据;比率数据既表明量的大小,也有相等的单位,同时还具有绝对零点。20.对于下列实验数据:1,108,11,8,5,6,8,8,7,11,描述其集中趋势用(
)最为合适,其值为()。A.平均数;14.4
B.中数;8.5C.众数;8
D.众数;11【答案】C【解析】由于存在极端数据108,所以不适宜用平均数描述集中趋势。若用中数,其值应为7.83;若用众数,其值为8。21.数列10,10,10,10,13,13,13,17,l7的中数为()。A.13
B.12.66
C.12.499
D.12.83【答案】B【解析】此题中数的计算属于当重复数目位于数列中间,数据的个数为奇数的情形。在数列中第5个数为13,此为一个重复数目,可以将其视作连续数,理解为3个13占据了一个分数单位的全距,即12.5~13.5,它们均匀地分布在12.5~13.5这个区间内,因为中数是一个点值,因此,需要计算出第一个13所在区间的组中值,这一点就是整个序列中位居最中间的那一点,就是这组数据的中数。第一个区间的中值为12.499+0.33/2=12.66。因此,该组数据的中数是12.66。22.变异系数的单位是()。A.原测量单位的平方
B.与原测量单位相同C.没有单位
D.不确定【答案】C【解析】变异系数是一种相对差异量数,是标准差对平均数的百分比,即,因为标准差的单位与平均数的单位相同,所以变异系数没有单位。23.以下表示计数数据之间相关的为(
)。A.φ相关
B.肯德尔W系数
C.点二列相关
D.U系数【答案】A【解析】φ相关是分类资料关联程度的测量指标,数据一般都是计数数据,而非测量数据,适用于两个相互关联的变量分布都是真正的二分变量。24.以下关于变异系数说法不正确的是(
)。A.对同一团体两种观测值离散程度的比较B.对水平相差较大,但进行的是同一种观测的不同团体的观测值离散程度的比较C.如果观测工具具备绝对零点,使用变异系数比较分散程度的效果更好D.可用变异系数进行统计推论【答案】D【解析】差异系数常用于:①同一团体不同观测值离散程度的比较;②对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。在应用差异系数时应注意:①测量的数据要保证具有等距尺度;②观测工具应具备绝对零,这时应用差异系数去比较分散程度效果才更好;③差异系数只能用于一般的相对差异量的描述,不能进行统计推论。25.差异量数反映一组数据的()情况。A.集中趋势
B.离中趋势
C.峰态趋势
D.偏态趋势【答案】B【解析】差异量数是反映一组数据离散程度的量。它往往用量尺上的一段距离表示一个观测值与其他所有观测值或中心点的距离的大小。26.研究者若要比较身高和体重两组数据变异度大小,宜采用的统计指标是()。A.变异系数
B.方差
C.积差
D.标准差【答案】A【解析】变异系数在心理与教育研究中常用于以下两种情况:①同一团体不同观测值离散程度的比较;②对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。身高和体重属于同一团体的不同观测值,可采用变异系数指标比较二者的离散程度。27.已知某小学一年级学生的平均体重为26千克,体重的标准差是3.2千克,平均身高110厘米,标准差为6.0厘米,问体重与身高的离散程度哪个大?()A.体重离散程度大
B.身高离散程度大C.离散程度一样
D.无法比较【答案】A【解析】由于体重和身高的观测工具不同,所以采用差异系数进行比较。根据差异系数的公式:,得,,所以体重的离散程度大。28.某次英语考试的标准差为5.1分,考虑到这次考试的题目太难,评分时给每位应试者都加了10分,加分后成绩的标准差是()。A.10
B.15.1
C.4.9
D.5.1【答案】D【解析】根据标准差的性质,每一个观测值都加一个相同常数C之后,计算得到的标准差等于原标准差,即,则有。在本题中,原来的标准差是5.1分,每个应试者都加10分,但是并不会改变考试的标准差,仍为5.1分。29.标准九分是()的量表。A.以5为平均数,以2为标准差B.以10为平均数,以5为标准差C.以50为平均数,以10为标准差D.以l00为平均数,以l5为标准差【答案】A【解析】标准九分的平均值为5,标准差为2,单位为半个标准差,除了1分及9分之外,各分数的范围也是半个标准差。30.在偏态分布中,平均数、中数、众数三者之间的关系为(
)。A.M=Md=M0
B.M=3Md-2M0C.M0=3Md-2MD.Md=3M0-2M【答案】C【解析】皮尔逊研究了平均数(M)、中数(Md)、众数(M0)之间的关系,发现三者之间的经验关系为:。31.A、B两变量线性相关,变量A是符合正态分布的等距变量,变量B也符合正态分布且被人为划分为两个类别,那么这两个变量是()相关。A.积差
B.点二列
C.二列
D.肯德尔和谐系数【答案】C【解析】二列相关适用于两列变量都为正态等距变量,但其中一列变量被人为地分成两类资料;点二列相关适用于一列为等距正态变量的测量数据,另一列为二分称名变量的资料;积差相关适用于两列数据都是测量的数据,而且两列变量各自总体的分布是正态的;肯德尔和谐系数适用于多列等级变量的相关。32.研究人员取若干名学生参加某次数学竞赛的成绩,计算竞赛成绩与性别之间的相关关系,通常用()。A.等级相关
B.积差相关
C.二列相关
D.点二列相关【答案】D【解析】点二列相关适用于一列为等距正态变量的测量数据(数学成绩),另一列为二分名义变量(性别)的资料;二列相关适用于两列变量都为正态等距变量,但其中一列变量被人为地分成两类;积差相关适用于双列正态连续变量;等级相关用于等级变量和非正态分布的变量。33.肯德尔(Kendall)W系数的取值范围为()。A.-1~1
B.0~1
C.-l~0
D.-0.5~0.5【答案】B【解析】肯德尔W系数,又称肯德尔和谐系数,是表示多列等级变量相关程度的一种方法,适用于两列以上的等级变量。W值介于0与1之间,计算值都为正值,若表示相关方向,可从实际资料中进行分析。如果K个评价者意见完全一致,则W=1;若K个评价者的意见存在一定的关系,但又不完全一致,则0<W<1;如果K个评价者的意见完全不一致,则W=0。34.由5名评价者对10种颜色进行等级评定,以确定喜爱次序,当这5名评价者的评价结果完全不一致时,U系数的值应为()。A.-1
B.0
C.-0.25
D.-0.20【答案】D【解析】一致性系数U的取值是:若完全一致,则U=1;完全不一致时,(K为奇数)或(K为偶数)。35.在考查评分者信度时,若有三人以上参加数份试卷的评阅工作,则需计算()。A.等级相关系数
B.克伦巴赫α系数C.肯德尔和谐系数
D.皮尔逊积差相关系数【答案】C【解析】评分者信度是指多个评分者对同一组被试的测验结果进行评分的一致性程度。在有些情况下,被试的得分会受到评分者主观状态的影响。当参与评分的人数为两个时,依据所采用的变量是连续的还是离散的,确定采用积差相关或等级相关。当测验的评分者超过三个,且采用等级数据时,可以通过肯德尔和谐系数来计算评分者信度。36.现有8名面试官对25名求职者的面试过程做等级评定,为了解这8位面试官的评价一致性程度,最适宜的统计方法是求(
)。A.spearman相关系数B.积差相关系数C.肯德尔和谐系数
D.点二列相关系数【答案】C【解析】肯德尔W系数是表示多列等级变量相关程度的一种方法,适用于两列以上的等级变量。计算肯德尔和谐系数,原始数据资料的获得一般采用等级评定法,即让K个被试对N件事物进行等级评价,每个评价者都能对N件事物排出一个等级顺序。本题是8名面试官对25名求职者的面试过程做等级评定,宜使用肯德尔和谐系数。37.有10名学生参加视反应时和听反应时的两项测试,经过数据的整理得到∑D2=45,这两项能力之间的等级相关系数是(
)。A.0.73
B.0.54
C.0.65
D.0.27【答案】A【解析】根据斯皮尔曼等级相关的公式:,得。38.r=-0.50的两变量与r=0.50的两变量之间的关系程度()。A.前者比后者更密切
B.后者比前者更密切C.相同
D.不确定【答案】C【解析】相关系数是用来表示相关关系强度的指标,其取值的大小表示相关的强弱程度,相关系数的“+、-”号表示双变量数列之间相关的方向,正值表示正相关,负值表示负相关。-0.5与0.5符号相反,但绝对值相同,所以两者之间的相关程度相同。39.若积差相关系数,,则二者所表示的密切程度的关系为(
)。A.
B.
C.不确定
D.以上答案都不对【答案】B【解析】相关系数取值的大小表示相关的强弱程度。如果相关系数的绝对值在0与1.00之间,则表示不同程度的相关。绝对值接近0值端,则表示关系不够密切;绝对值接近1.00端,一般为相关程度密切。二、多项选择题1.散点图的形状为一条直线,且两个变量方差均不为0,它们之间的相关系数可能为(
)。[统考2010研]A.1B.0.5C.O
D.-l【答案】AD【解析】散点图的形状为一条直线,它们之间的相关系数可能为1或者-1。2.描述数据离中趋势的统计量有()。[统考2007研]A.方差
B.标准差
C.平均差
D.四分位差【答案】ABCD【解析】描述数据离中趋势的统计量称为差异量数,差异量数包括平均差、方差与标准差、四分位差、全距、百分位差等。3.下面属于集中量数的有()。A.算术平均数
B.中数
C.众数
D.几何平均数【答案】ABCD【解析】集中量数是用于描述数据集中程度的统计量,包括算术平均数、中数、加权平均数、几何平均数、调和平均数等。4.算术平均数的优点有()。A.反应灵敏
B.不受极端数据的影响C.较少受到抽样波动的影响
D.计算严密【答案】ACD【解析】算术平均数的优点:反应灵敏;计算严密;计算简单;简单明了;适合作进一步代数运算;较少受抽样波动的影响。算术平均数的缺点:容易受极端数据的影响;有模糊不清的数据时,无法计算平均数;不能计算不同质的数据平均数。5.众数的缺点有(
)。A.概念简单,容易理解B.易受分组影响,易受样本变动影响C.不能作进一步代数运算D.反应不够灵敏【答案】BCD【解析】众数的优点为:概念简单明了,容易理解。缺点为:不稳定,受分组影响,亦受样本变动影响;计算时不需每一个数据都加入,因而较少受极端数目的影响,反应不够灵敏;众数不能作进一步代数运算。6.下面关于四分位差描述正确的有()。A.又称四分差,计算基于两个百分数P25与P75之差B.通常与众数联合起来使用C.不适合作进一步代数运算,反应不够灵敏D.有两极端数据不清楚时,可以计算四分位差【答案】CD【解析】四分位差又称内距或四分间距,四分位差是指在一个次数分配中,中间50%的次数的全距之半,即上四分点与下四分点之差的一半。四分差用于确定第三四分位数和第以四分位数的区别,是描述统计学中的一种方法。四分位差通常与中数联系起来共同应用。在两极端数据不清楚时,可以计算四分位差。但由于它没有把全部数据考虑在内,其稳定性比较差;它也不适合用代数方法运算;反应不够灵敏,故应用不多。7.常见的差异量数有()。A.平均差
B.方差
C.百分位差
D.几何平均数【答案】ABC【解析】差异量数是对一组数据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 古代爱情诗歌课件
- 河南驻马店市驿城区2025-2026学年高一第一学期期末质量监测历史试题(含答案)
- 古代婚嫁礼仪文言知识
- 2025年河南检察职业学院马克思主义基本原理概论期末考试模拟题及答案解析(必刷)
- 2024年重庆工商职业学院马克思主义基本原理概论期末考试题附答案解析(夺冠)
- 2024年陕西师范大学马克思主义基本原理概论期末考试题附答案解析
- 2025年江苏旅游职业学院单招职业技能考试模拟测试卷带答案解析
- 2025年山东经贸职业学院单招职业倾向性考试题库带答案解析
- 2025年黟县幼儿园教师招教考试备考题库带答案解析
- 2025年河北政法职业学院单招职业技能测试题库附答案解析
- 产后腰背疼康复治疗
- 2025年商业物业抵押贷款合同范本
- 2024用电信息采集系统技术规范第1部分:专变采集终端
- 餐厅原料调价制度方案
- 浙江省杭州市2024年中考语文试卷(含答案)
- 四川省绵阳市2020年中考数学试题(含解析)
- 期末达标测试卷(试题)-2024-2025学年人教PEP版英语四年级上册
- DLT 1563-2016 中压配电网可靠性评估导则
- HJ 377-2019 化学需氧量(CODCr)水质在线自动监测仪技术要求及检测方法
- (正式版)SHT 3075-2024 石油化工钢制压力容器材料选用规范
- 油脂科技有限公司年产3万吨油酸项目环评可研资料环境影响
评论
0/150
提交评论