心理与教育统计学第5章-相关关系_第1页
心理与教育统计学第5章-相关关系_第2页
心理与教育统计学第5章-相关关系_第3页
心理与教育统计学第5章-相关关系_第4页
心理与教育统计学第5章-相关关系_第5页
已阅读5页,还剩101页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

心理与教育统计学,第四章作业,根据所学内容命题:要求:题型:选择与计算提供题目与详细参考答案重点:方差、标准差及其应用评分标准:命题数量与质量,涵盖知识点的多少,命题水平。优秀的命题将会出现在期末考试中,命题组会有额外加分。交作业时间:4月4日(周五上课),第5章相关关系,5.1相关、相关系数与散点图5.2积差相关5.3等级相关5.4质与量相关5.5品质相关5.6相关系数的选用与解释,有其父必有其子?,皮尔逊测量了1078个父亲及其成年儿子的身高。,相关系数用于描述双变量相互之间的关系。所谓双变量,是对于一个变量X的每一个观测值X1,X2,Xn,同时有另一个变量Y的相应观测值Y1,Y2,Yn与之对应。例如,每个人的身高和体重是对应的。,5.1相关、相关系数与散点图,5.1.1什么是相关1.事物之间的相互关系:(1)因果关系,一种现象是原因,另一种现象是结果。(2)共变关系,表面有联系的两种事物都与第三种事物有关。(3)相关关系,两类现象在发展变化的方向与大小方面存在一定的联系,但不是前两种关系。,2.相关的类别,(1)正相关:两个变量的变化方向相同。例如,你用于学习的时间越多,考试成绩越高。(2)负相关:两个变量的变化方向相反。例如,你完成考试的时间越少,所犯的错误越多。(3)零相关:两个变量的变化方向无一定规律。例如,智商与体重的关系。,5.1.2相关系数,相关系数(coefficientofcorrelation)用来描述两个变量相关程度的统计指标。一般样本的相关系数用r表示,总体的相关系数用表示。(1)相关系数的取值:-1r+1(2)相关系数的符号:“”表示正相关,“”表示负相关。(3)相关系数r=1表示完全正相关,r=-1表示完全负相关,r=0表示完全独立,零相关或无相关。,(4)相关系数取值的大小表示相关强弱程度。绝对值0r1,绝对值接近1一般为相关程度密切,接近0值端一般为关系不够密切。注意:相关分析受样本影响,小样本的相关系数不稳定。相关系数不是由相等单位度量而来的,因此只能比较大小,不能做任何加、减、乘、除运算。,5.1.3散点图,在平面直角坐标系中,以X、Y两列变量(如X变量)为横坐标,以另一列变量为纵坐标,把每对数据Xi、Yi当作同一平面上的N个点(Xi,Yi),一一描绘在XOY坐标系中,产生的图形即为散点图。,正相关,负相关,散点的分布形状为椭圆形,可认为两变量之间具有线性关系。,完全负相关,完全正相关,当所有的点都分布在一条直线上时,两变量之间的关系为完全相关。,零相关,散点的分布没有明显集中在某一方向的趋势,形成圆形区域时,两变量之间的关系为零相关。,散点图告诉了我们什么?,5.2积差相关,5.2.1积差相关及其适用条件积差相关是英国统计学家皮尔逊于20世纪初提出的一种计算相关的方法,因而被称为皮尔逊积差相关,也称为积矩相关(productmomentcorrelation)。,积差相关适用于:,成对的数据;样本容量要大,不宜少于30对。两列变量各自总体为正态分布;一般情况下,正常人群的身高、体重、智力水平、心理与教育测验的结果,都可按总体正态分布对待;如果要求比较高,则需要对数据进行正态性检验。,两列变量均为连续变量;根据得到数据的方式判断,测量数据。两列变量之间的关系应是线性关系。可先绘制两列变量的散点图,根据散点图可判断两个变量之间是否线性关系。,5.2.2协方差,协方差(covariance)是两个变量离均差乘积的平均数。协方差越大,表示X、Y两列变量的线性关系越强。用符号COV表示。,x、y两个变量的离均差,为什么协方差表示一致性程度?,哪个图中,XY的一致性程度高?,X,Y,Xmin,Xmax,Ymax,Ymin,X,Y,表示该点与平均数构成的矩形的面积,X,Y,表示将所有点与平均数构成的矩形的面积加起来,+,-,+,-,+,+,-,-,+,+,-,-,X,Y,+,-,+,-,+,+,-,-,+,+,-,-,的值越大,一致性程度越大。,5.2.3积差相关系数基本公式,协方差的值会随着XY的单位的不同而变化,是一个很不稳定的量。为了克服协方差的缺点,除以两变量的标准差sX.sY,得到了积差相关系数:,(5.2),x、y两个变量的离均差,两个变量的标准差,表5-131人的视听反应时(单位:毫秒),先计算变量X和Y的标准差:,再将数据代入公式计算积差相关系数:,5.2.4标准分数计算积差相关系数,(5.3),ZX为X变量的标准分;ZY为Y变量的标准分。,5.2.5原始数据计算积差相关系数,由标准差公式:,(5.4a),所以:,或者:,(5.4b),下面运用该公式计算相关系数:,谢谢!,复习,协方差:,相关系数:,相关系数的合成。,5.3等级相关,在心理与教育领域研究中,有时搜集到的数据不是等距或等比的测量数据,而是具有等级顺序的测量数据。搜集到的数据是等距或者等比的数据,但其总体分布不是正态。,5.3.1斯皮尔曼等级相关,斯皮尔曼等级相关是等级相关的一种。它适用于两列等级变量性质的线性关系的资料,用于称名数据和顺序数据的相关问题。其相关系数常用rR或rS表示不要求总体呈正态分布,不要求样本的容量必须大于30。当连续数据不能满足计算积差相关的条件时,可以转换成等级数据从而计算斯皮尔曼等级相关系数。缺点:精确度要差于积差相关。,N为等级个数;D指二列成对变量的等级差数;Rx与Ry为两列变量各自排列的等级次数。,1.等级差数法:,2.等级序数法:,计算方法,(5.5a),(5.5b),假设有两列变量不服从正态分布,其中第一列变量为:X1、X2、X3Xn,其等级序数为:RX1、RX2、RX3RXn;第二列变量为:Y1、Y2、Y3Yn,其等级序数为:RX1、RX2、RX3RXn。,等级差数法:,等级序数法:,见P114公式5-3a,10个高三学生学习潜在能力测验(X)与自学能力测验(Y)成绩,3.有相同等级时计算等级相关的方法,如果有相同等级时,可用它们所占等级位置的平均数作为它们的等级。,随着相同等级数据的增多,有规律的减少,但与相同等级的位置无关。,假设1、2、3n个等级相等,新的等级:,不同等级:,相同等级:,没有相同等级情况下:,有相同等级情况下:,由于,同理:,P118公式5-4b,下表是10名学生的数学和语文考试成绩,问数学和语文成绩是否相关?,解:,5.3.2肯德尔等级相关,(一)肯德尔W系数肯德尔W系数,又称为肯德尔和谐系数,是表示多列等级变量相关程度的一种方法,适用于两列以上的等级变量。计算肯德尔和谐系数,原始数据资料的获得一般采用等级评定法,即让K个被试(或称为评价者)对N件事物或N种作品进行等级评定,每个评价者都能对N件事物(或作品)的好坏、优劣、喜好、大小、高低等排出一个等级顺序。常用W表示。,例:有10人对红、橙、黄、绿、青、蓝、紫七种颜色按照其喜好程度进行等级评价。其中,最喜欢的等级为1,最不喜欢的等级为7。问这10人对颜色的爱好是否具有一致性?,W系数是每一评价对象实际得到的等级总和的变异与被评价对象一致性程度最大时等级总和的变异的比值。,一致性程度最高的情况:,求实际等级总和的方差:,P88公式4-9:,求一致性程度最大时等级总和的方差:,W系数:,肯德尔W系数:,将,代入上式,可得:,(5.6a),(5.6b),例:有10人对红、橙、黄、绿、青、蓝、紫七种颜色按照其喜好程度进行等级评价。其中,最喜欢的等级为1,最不喜欢的等级为7。问这10人对颜色的爱好是否具有一致性?,解:,有相同等级出现时W的计算,(5.6c),五位评分者对七篇作文进行了评价,评价等级为1-5,评价结果如下,试问评分者之间对标准的掌握是否一致?,解:,复习,斯皮尔曼等级相关两列等级数据,不限总体分布,不限样本数量,基本公式:,有等级相同:,肯德尔W系数多列等级数据相关,等级评定法,评分者信度,基本公式:,有等级相同:,取值范围:,(二)肯德尔U系数,肯德尔U系数又称一致性系数,适用于对K个评价者的一致性进行统计分析。它与肯德尔W系数所处理的问题相同,但所处理的资料的获得方法不同,计算结果也不同。如果有N件事物,由K个评价者,将N件事物两两配对,形成了N(N-1)/2对,然后对每一对中两事物进行比较,优者记1,非优者记0。,10个评价者对7种颜色对偶选择结果,K为奇数,K为偶数,(5.7),取值范围:,10个评价者对7种颜色对偶选择结果,解:已知N=7,K=10,对角线以下的择优分数分析:,5.4质与量的相关,实际研究中常会遇到这种情形:需要计算相关的两列变量一列为等比或等距的测量数据,另一列是按性质划分的类别,欲求这样两列变量的直线关系,称为质量相关,5.4.1点二列相关,适用条件一个变量为正态、连续变量,另一个变量为真正的二分变量,这两个变量之间的相关,称为点二列相关。可用于评价由是非类测验题目组成的测验的内部一致性等问题。有时一个变量并非真正的二分变量,而是双峰分布的变量,也可以用点二列相关来表示。例如,按识字量划分文盲和非文盲,点二列相关公式:,是与二分名义变量的一个值对应的连续变量的平均数;是与二分名义变量的另一个值对应的连续变量的平均数;p和q分别是二分名义变量的两个值各自所占的比例,p+q=1;st是连续变量的标准差.,(5.8),设变量X为连续变量,其样本值为X1、X2、X3XN,N为样本容量;变量Y为二分变量,其取值分别用1与0来表示,取1的比率为p,取0的比率为q,则:,相关系数:,有一是非选择测验,每题选对得2分,共50题,满分100分。下表为20名学生在该测验中的总成绩及第5题的选答情况。请问这道题与测验总分的相关程度如何?,设p为答对第五题的学生的比率;q为答错第五题学生的比率。,5.4.2二列相关,二列相关的适用资料是两列数据均属于正态分布,其中一列变量为等距或等比的测量数据,另一列变量为人为划分的二分变量。例如测验成绩,人为划分为及格与不及格。,(5.9a),(5.9b),公式中,y为标准正态分布曲线中与p值对应的纵线高度其余符号与点二列相关计算公式中含义相同,二列相关公式:,补充知识:已知概率P如何求概率密度Y,P概率,Y概率密度,Z分数,例下表是10名学生在一次测验中总分和一道问答题的得分。该题回答是否合格与卷面总分的关系如何?(该问答题满分为10分,规定达到6分为合格),10名学生某题得分与卷面总分,计算:sX6.12,p0.6,q0.4,查正态分布表P449,当p0.60时,Y0.38667,复习,点二列相关一列变量为正态连续变量,另一列变量为真正的二分变量。,二列相关两列变量均为正态连续数据,但其中一列变量被人为划分为二分变量。,5.4.3多列相关,多列相关适合处理两列正态变量资料,其中一列为等距或等比的测量数据,另一列被人为划分为多种类别,称为名义变量。例如,学习成绩被人为划分为优、良、中、差四类。,优,良,中,差,多列相关计算公式:,为每系列的次数比率;为每一名义变量下限的正态曲线高度为每一名义变量上限的正态曲线高度,(5.10),例下表是10名学生在一次测验总分和老师评价等级。该测验与老师评价之间的关系如何?,10名学生某题得分与卷面总分,评价等级:DCBA合计,比率:0.20.30.40.1,累加比率:0.20.50.91,y:0.3480.3990.1760,yL-yH:-0.348-0.0510.2230.176,:60.563.6765.575.00,:-21.06-3.2514.6113.23.505,:0.6060.0090.1240.311.048,下表的数据是140名学生学习能力测验分数与教师对该部分学生的评价等级(A、B、C、D)资料。计算能力与教师评价之间的一致性。,评价等级:DCBA合计,比率:0.2140.20.2860.3,累加比率:0.2140.4140.71,y:0.2920.390.3470,yL-yH:-0.292-0.0980.0430.347,:40.8347.3655.2563.79,:-11.922-4.6412.37622.1357.95,:0.39790.0480.00650.40140.8538,5.5品质相关,两个变量都是按性质划分成几种类别,表示这两个变量之间的相关称为品质相关。品质相关主要用于列联表(RC表)的相关。依据二因素的性质及分类项目的不同,有不同的名称和计算方法,主要有四分相关、相关、列联表相关。,5.5.1四分相关,四分相关适用于计算两个变量都是连续变量,且每个变量的变化都被人为地分为两种类型的测量数据。例如,学习成绩,划分为“及格”和“不及格”。,高,矮,胖,瘦,高度,体重,a+c,b+d,a+b,c+d,四格表的一般形式,四分相关的计算公式:,(5.11),记忆方法:,下表所列数据是调查377名学生两科测验成绩所得到的结果,假设两科成绩分布为正态,只是人为地将其按一定标准划分为及格、不及格两类。,历史成绩,及格,不及格,地理成绩,及格,不及格,5.5.2系数,系数适合于两个变量至少有一个是真正的二分变量的相关,如吸烟(吸烟者和非吸烟者),性别,婚姻状态。值小于0.3时,表示相关较弱,当值大于0.6时,表示相关较强。在应用相关时,一般不指出相关方向,只说明相关程度是否显著。,相关系数计算公式,(5.12),巧记公式:,143例5-14:,关于吸烟与患癌症之间关系数据的四格表,10,10,9,11,5.5.3列联表相关,当两个变量均被分成两个以上类别,或其中一个变量被分成两个以上类别,表示这两个变量之间的相关,称为列联相关。列联相关系数是由的列联表求得的,因此称为列联相关。最常用的是皮尔逊定义的列联相关系数。,列联相关系数的计算,公式中:为列联相关系数值的计算方法将在卡方检验一章中学习。,(5.12),相关与数据类型,女性无名指与食指的长度比例与跑步成绩相关,焦虑程度(高/低

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论