教育统计与测量5.相关分析_第1页
教育统计与测量5.相关分析_第2页
教育统计与测量5.相关分析_第3页
教育统计与测量5.相关分析_第4页
教育统计与测量5.相关分析_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 任课教师:赵立任课教师:赵立教育统计与测量教育统计与测量相关、相关系数和散点图相关、相关系数和散点图各种相关系数的计算(适用条件、计算方法)各种相关系数的计算(适用条件、计算方法)n积差相关积差相关n等级相关等级相关n质量相关质量相关n品质相关品质相关相关系数的选用与解释相关系数的选用与解释一、事物之间的关系一、事物之间的关系因果关系:例如:距离因果关系:例如:距离= =速度速度时间。时间。n特点:可以用函数式表达;两个变量的值是一一对应特点:可以用函数式表达;两个变量的值是一一对应的。的。共变关系:例如:盖楼房与小孩的身体发育。共变关系:例如:盖楼房与小孩的身体发育。n特点:看起来有联系,

2、实际上没有关系。特点:看起来有联系,实际上没有关系。相关关系:例如:智力与学习成绩。相关关系:例如:智力与学习成绩。n特点:有一定联系,但两个变量的值并没有一一对应特点:有一定联系,但两个变量的值并没有一一对应关系。关系。二、相关(统计学意义)二、相关(统计学意义) 指具有相关关系的不同现象之间的关系程度指具有相关关系的不同现象之间的关系程度。1. 方向:方向:(1)正相关正相关:两列变量变动方向相同。同时增大,同时减少。:两列变量变动方向相同。同时增大,同时减少。 (2)负相关负相关:两列变量变动方向相反。一个增大,另一个却:两列变量变动方向相反。一个增大,另一个却减少;反之亦然。减少;反之

3、亦然。(3)零相关零相关:两列变量之间无关系。:两列变量之间无关系。2. 密切程度:密切程度:强相关、中度相关、弱相关强相关、中度相关、弱相关三、相关系数三、相关系数 相关系数是两列变量相关程度的数字表现形式。样本相关相关系数是两列变量相关程度的数字表现形式。样本相关系数用系数用 r 表示;总体相关系数用表示;总体相关系数用 表示。表示。 ,r-1.00,1.00 (1)完全相关:)完全相关:-1.00或或1.00,说明两个变量之间为确定关系;,说明两个变量之间为确定关系;(2)不完全相关:)不完全相关:| ,r |1;(3)不相关:)不相关:当相关系数在当相关系数在0附近时,说明两个变量之间

4、毫无附近时,说明两个变量之间毫无关系。关系。 正相关时,相关系数为正,取值在正相关时,相关系数为正,取值在01之间;负相关时,相关之间;负相关时,相关系数为负,取值在系数为负,取值在-10之间。之间。 注意:相关系数仅仅为一个比值,注意:相关系数仅仅为一个比值,非等距、非等比,非等距、非等比,不能做加减乘除。不能做加减乘除。三、相关散点图三、相关散点图直观地显示了两个事物的成对观测值之间是否直观地显示了两个事物的成对观测值之间是否存在相关,存在什么样的相关以及相关程度存在相关,存在什么样的相关以及相关程度(a)完全正相关)完全正相关(b)完全负相关)完全负相关(c)无相关关系)无相关关系(d)

5、非线性关系)非线性关系(e)正相关)正相关(f)负相关)负相关快乐分数和行为分数的关系012345678012345678行为分数快乐分数r 0.380.38均值以上均值以上 均值以下均值以下均值以上均值以上6 65 5均值以下均值以下3 36 6行为分数行为分数快乐快乐儿童儿童行为行为学习学习快乐快乐1 12 21 12 22 22 22 23 33 32 23 34 44 42 24 45 55 52 24 47 76 63 33 33 37 73 34 45 58 84 42 23 39 94 43 34 410104 44 45 511114 45 56 612125 54 44 41

6、3135 55 55 514145 56 66 615156 64 44 416166 66 65 517176 66 66 618186 67 77 719197 76 64 420207 77 77 7M ean4.254.254.34.34.754.75相关系数受样本容量相关系数受样本容量n的影响的影响n如果如果n n很小,可能完全没有相关的两事物,却计算出较大很小,可能完全没有相关的两事物,却计算出较大的相关系数。的相关系数。n一般以一般以N N大于大于3030为宜为宜相关系数相关系数不是等距数据也不是比例数据不是等距数据也不是比例数据计算相关系数要求计算相关系数要求成对成对数据数据

7、没有线性相关,不一定没有关系,可能是非线性的没有线性相关,不一定没有关系,可能是非线性的相关系数的计算不受以下因素影响相关系数的计算不受以下因素影响n互换两个变量互换两个变量n某一变量的所有值都增加同一数值某一变量的所有值都增加同一数值n某一变量的所有值都乘以同一正数某一变量的所有值都乘以同一正数积差相关,也称积差相关,也称积矩相关积矩相关、皮尔逊相关皮尔逊相关,是求直线相关的基本,是求直线相关的基本方法。方法。 适用条件适用条件(1)两列数据都是)两列数据都是测量的数据测量的数据(数值型变量);(数值型变量);(2)双变量正态双变量正态(获接近与正态)。要求总体为正态,但对样(获接近与正态)

8、。要求总体为正态,但对样本不要求一定为正态。本不要求一定为正态。(3)成对成对数据数据(4)两列变量之间的关系应是)两列变量之间的关系应是线性线性的,否则不能计算线性相关。的,否则不能计算线性相关。(5)样本容量)样本容量n大于大于30,最好大于,最好大于50. 即:即:两列变量为正态等距(比),且具有线性关系。两列变量为正态等距(比),且具有线性关系。把协方差变成一个相对量数,即将离差除以各自的标把协方差变成一个相对量数,即将离差除以各自的标准差,变成用标准分数表示,然后将两个标准分数的乘积准差,变成用标准分数表示,然后将两个标准分数的乘积除以除以n,所得的商就是积差相关系数。用公式表示为:

9、,所得的商就是积差相关系数。用公式表示为:()()XYXX YYrnS S例例 研究某能力测验的预测效度。研究某能力测验的预测效度。X表示能力测验的分数,表示能力测验的分数,Y表表示被试大学一、二年级有关科目的平均分数。两变量之间的相示被试大学一、二年级有关科目的平均分数。两变量之间的相关系数就是该测验的预测效度。关系数就是该测验的预测效度。XYxyx2y2xy7471808576777768747482758189828988848087-1.6-4.64.49.40.41.41.4-7.6-1.6-1.6-1.7-8.7-2.75.3-1.75.34.3.3-3.73.32.5622.16

10、19.3688.360.161.961.9657.762.562.562.8975.697.2628.092.8928.0918.490.0913.6910.892.7240.02-11.8849.82-0.687.426.02-2.285.92-5.2875683700198.40188.0791.8048. 007.18840.19880.91 Y-YX-XY-YX-Xr ,07.188Y-Y ,40.198X-X , 8 .91Y-YX-X ,Y-Yy,X-Xx, 7 .83Y , 6 .75X:2222解公式为:公式为:nYYnXXnYXXYr/)(/)(/ )(2222被试身高(X)

11、体重(Y)X2Y2XY12345678910170173160155173188178183180165504547445053504952452890029929256002402529929353443168433489324002722525002025220919362500280925002401270420258500778575206820865099648900896793607425N=10X=1725Y=485X2=298525Y2=23609XY=83891例例 计算身高与体重的相关系数计算身高与体重的相关系数792.05 .865 .9625 .228104852360

12、910172529852510485172583891222222nYYnXXnYXXYr3、用标准分数计算、用标准分数计算iiyxZZNr1iiyxZZNr14、相关系数的合并、相关系数的合并意义:来自同一总体的多个样本的相关系数的合成。意义:来自同一总体的多个样本的相关系数的合成。步骤:步骤:(1)将各样本的将各样本的r 转换成费舍转换成费舍Z分数分数,见附表,见附表8。(2)求每一样本的)求每一样本的Z分数之和分数之和(3)求平均)求平均Z分数分数(4)再把)再把 转换为转换为r(3)(3)irinZZnrZr等级相关是指以等级次序表示的两列或多列变量等级相关是指以等级次序表示的两列或多

13、列变量之间的相关。之间的相关。适用条件适用条件n两列变量是等距或等比变量,但不是正态分布两列变量是等距或等比变量,但不是正态分布n两列顺序变量两列顺序变量n样本容量未大于样本容量未大于30主要包括:主要包括:n斯皮尔曼等级相关斯皮尔曼等级相关n肯德尔和谐系数肯德尔和谐系数1、斯皮尔曼等级相关、斯皮尔曼等级相关(1)适用资料:适用资料:顺序量表或数值型变量按其大小排列赋顺序量表或数值型变量按其大小排列赋以等级顺序;两个变量均为等级变量的呈线性相关的资料。以等级顺序;两个变量均为等级变量的呈线性相关的资料。(2)计算公式:)计算公式:21261(1)niiRDrn nDRX-RY-各对偶等级之差,

14、 n为等级数目, RX-X变量的等级,RY-Y变量的等级请注意:请注意:尽可能不出现相同尽可能不出现相同等级,即不能并列等级,即不能并列排名,否则误差大排名,否则误差大公司 质量等级(X) 市场份额(Y) Di Di2 A B C D E F G H I J K L 4 6 9 7 1 3 11 5 8 12 10 2 3 7 5 6 2 4 12 9 8 10 11 1 1 -1 4 1 -1 -1 -1 -4 0 2 -1 1 1 1 16 1 1 1 1 16 0 4 1 1 niiD124436 4410.851212Rr 公司的质量形象公司的质量形象与其市场份额等与其市场份额等级成正

15、相关。级成正相关。例例 一家广告代理商想了解一家公司产品质量等级是否与其市场份一家广告代理商想了解一家公司产品质量等级是否与其市场份额等级有关。小规模的实验研究,获得该行业额等级有关。小规模的实验研究,获得该行业12家公司的质量等级。家公司的质量等级。例例 研究学校内儿童问题行为与母亲耐心程度的关系。用研究学校内儿童问题行为与母亲耐心程度的关系。用X表示儿童的问题程度分数,表示儿童的问题程度分数,Y表示母亲的不耐心程度分数。表示母亲的不耐心程度分数。原始分数不是等级数据,要先化为等级数据,再代入公式。原始分数不是等级数据,要先化为等级数据,再代入公式。家庭家庭儿童(儿童(X) 母亲(母亲(Y)

16、等级等级RX等级等级RYD=RX-RYD212345678910724052873995126449467962538981901082787083692101754632971018542040-500-100401602500100n=10 RX =55, RY =55 D=0 D2=46解:22266 46110.72110101RDrn n 在观测变量没有相同等级时能够保证在观测变量没有相同等级时能够保证 RX= RY, RX2 = RY2。如果。如果观测变量出现相同等级时观测变量出现相同等级时 RX= RY, 但但 RX2 RY2。 R2 随相同等级数目的增多而有规律地减随相同等级数

17、目的增多而有规律地减少。少。1212ttcC-差值数(没有相同等级的差值数(没有相同等级的 R2 与有几个相同等与有几个相同等级出现的级出现的 R2之差。之差。 t某一等级的相同数。某一等级的相同数。2222R22222222,:t t1c12xyDr,2xyn n -1t t1 x,1212n n -1t t1 y1212当一个变量中有多个相同等级的观测值出现时 它们的差数值为此时的斯皮尔曼等级相关的为:其中:校正公式其中:其中:D:对偶等级差:对偶等级差t: 各变量相同等级数各变量相同等级数补充:相同等级计算方法补充:相同等级计算方法 遇到相同等级时,要求他们的等级平均值遇到相同等级时,要

18、求他们的等级平均值 X 100 98 97 97 93 93 93 90 直接等级直接等级 1 2 3 4 5 6 7 8转换后的等级转换后的等级 1 2 3.5 3.5 6 6 6 8 例例 10名样本测验成绩如下,求其相关系数。名样本测验成绩如下,求其相关系数。学生学生测验测验1(X)测验测验2(Y)等级等级RX等级等级RYD=RX-RYD21234567891080707080657075607055707570756075806565601.55.55.51.585.5395.5105.535.539.5317.57.59.5-42.50-1.5-1.52.521.5-20.5166.

19、2502.252.256.2542.2540.25n=10 RX =55, RY =55 D2=43.572. 0797725 .437977r ,79 12122121221213312122-1211010y ,771214412122-1211010 x:R2222222222解2、肯德尔和谐系数、肯德尔和谐系数(1)适合于适合于k个评价者,评价多个事物的等级变量的资料个评价者,评价多个事物的等级变量的资料。(2)公式:nnknRRWniniii321212121Ri 为每一被评事物k个等级之和,n 为被评价事物的数目,即等级数,K 为评价者的数目或等级变量的列数。若k个评价者的评价完全

20、一致,则等级和的最大方差SSR=k2(n3-n)/12,W=1;若完全没有相关,则各事物的等级之和相等,SSR=0,W=0,W0,1。和谐系数=实际等级和方差/最大可能的方差。例例 有有10人对七件广告作品进行等级评价,结果如下表,问人对七件广告作品进行等级评价,结果如下表,问这这10人的评价是否具有一致性?人的评价是否具有一致性?827. 02800231677101212316231672801351632222WnRRSSiiR所以,所以,10人对人对7个作品的评个作品的评价具有较高的一致性。价具有较高的一致性。当出现相同等级时当出现相同等级时12121332ttccKnnKSSWiR其

21、中:91. 05 . 5566512161055 .22091215 . 512332122231232232333cKnnKSSWttciR评分者1 评分者2 评分者3 评分者4 评分者5RiRi*Ri教师453.55421.5 462.25教师B111.5216.542.25教师C2.521.52210100教师D6554525625教师E2.533.52314196教师F55666287841052209.5质与量的相关指的是当两列变量中一列是按质与量的相关指的是当两列变量中一列是按性质不同分类的变量,而另一列是连续变量性质不同分类的变量,而另一列是连续变量(等距(等距/等比),两列变量

22、的直线相关。等比),两列变量的直线相关。包括:包括:n二列相关二列相关n点二列相关点二列相关n多系列相关多系列相关有一种变量,只有两个取值,称为有一种变量,只有两个取值,称为二分变量二分变量(1、0)人为划分为两个取值,称人为划分为两个取值,称人为二分变量人为二分变量(及格、不及格)(及格、不及格)若有等级之分,称若有等级之分,称二分等级变量二分等级变量若无等级之分,称若无等级之分,称二分称名变量二分称名变量(男、女)(男、女)(1)适用资料)适用资料 两列变量,一列为来自正态分布的两列变量,一列为来自正态分布的等距或等比测等距或等比测量数据的连续变量量数据的连续变量,另一列变量是,另一列变量

23、是二分称名变量二分称名变量或或整体不服从正态的二分等级变量整体不服从正态的二分等级变量(2)公式及计算)公式及计算*该相关系数的正负号无意义,只根据绝对值的该相关系数的正负号无意义,只根据绝对值的大小加以解释。取值大小加以解释。取值-1,1pqsXXrtqppbp+q=1106/100.64/100.46.1266.6762.2566.6762.250.6 0.46.120.354tpqpqpbtnpqSXXXXrpqS考生 选择题得分 卷面总分A175B157C173D165E067F056G163H061I065J167是非题得分是非题得分(1)适用资料)适用资料 两列变量,两列变量,都为

24、连续变量均属于正态分布都为连续变量均属于正态分布,一列变,一列变量等距或等比,量等距或等比,另一列为人为的二分变量另一列为人为的二分变量。(2)公式及计算)公式及计算是非题用点二列,是非题用点二列, 主观题评分用二列。主观题评分用二列。 二列相关与点二列相关的主要区别在于二分变量二列相关与点二列相关的主要区别在于二分变量是否正态。是否正态。ypqsXXrtqpbypsXXrttpbqyq=1-ppy例例 下表为下表为10名考生一次测验的卷面总分和一道回答题的得分,名考生一次测验的卷面总分和一道回答题的得分,试求该问答题的区分度试求该问答题的区分度(该回答题满分为(该回答题满分为10分,因此得分

25、,因此得6分核分分核分以上则认为该题通过)。以上则认为该题通过)。考生 A B C D E F G H I J 卷面总分 75 57 73 65 67 56 63 61 65 67 回 答 题 得分 7 6 7 4 7 4 4 4 7 6 n=10,Sy=6.12,p=6/10=0.6,q=4/10=0.4,Xp=67.33,Xq=61.25 解:回答题得分被认为划分为通过和不通过两类,应求二列相关。查正态分布表:当p=0.60时y=0.3866,62. 03866. 040. 060. 012. 625.6133.67ypqSXXrtqPb1、品质相关用于表示、品质相关用于表示RC(行(行列

26、)表的两个变列)表的两个变量之间的关联程度。可用于教育测验的编制,进行量之间的关联程度。可用于教育测验的编制,进行项目分析项目分析2、这种相关因两个变量(因素)只划分为不同的、这种相关因两个变量(因素)只划分为不同的品质类别,故而得名。品质类别,故而得名。一般对计数数据一般对计数数据,而非测量,而非测量数据,数据,即使是测量数据,也人为地分为几个类别即使是测量数据,也人为地分为几个类别。3、主要有四分(格)相关、主要有四分(格)相关、相关、列联表相关相关、列联表相关等。等。两变量都是正态连续变量两变量都是正态连续变量,被人为地进行了划被人为地进行了划分分。即。即A变量被分为变量被分为A与非与非A,B也被分为也被分为B与与非非B。 计算方法计算方法A A 因素因素A非AB因因素素Bab非Bcdbcadrt1180cos0当两个变量都是二分变量当两个变量都是二分变量,两变量间的关系两变量间的关系 计算方法计算方法)()()(dcdbcababcadrA A 因素因素A非AB因因素素Bab非Bcd【例例】从研究生入学考试的学生中从研究生入学考试的学生中,随机抽取随机抽取60人人,其大学应届毕业生录取情况如下表所示其大学应届毕业生

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论