心理统计学-课程讲义5_第1页
心理统计学-课程讲义5_第2页
心理统计学-课程讲义5_第3页
心理统计学-课程讲义5_第4页
心理统计学-课程讲义5_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、【课程讲义】第五章相关系数【教学目标】明确相关是描述两个变量之间关系的量数;掌握相关的种类;掌握各种相关系数的计算、适用条件;掌握相关在教学实践中的运用;掌握对相关系数的解释.【学习方法】了解、理解与掌握.【重点难点】各种相关系数的使用条件、计算及应用【讲义内容】前面章节中研究的问题,根本上都是属于单变量的数量变化关系.而教育和心理现象中的数量关系,并不仅仅是单变量的变化关系,在很多方面表达出的是一个变量与另一个变量或多个变量之间的变化关系.如:学生学习成绩与学生智商的关系;学生学习成绩与学习动机的关系;家庭环境与学生学业成绩之间的关系等等.本章主要讨论两个变量或两列数据之间相关的数量关系.第

2、一节相关概述一、相关的含义事物总是相互联系的,它们之间的关系多种多样.分析起来,大概有以下几种情况:一种是因果关系,即一种现象是另一种现象的因,而另一种现象那么是果.例如学习的努力程度是学习成绩好坏的因至少是局部的因;在一定刺激强度范围内,刺激强度经常是反响强度的因等等.第二种是共变关系,即外表看来有联系的两种事物都与第三种现象有关,这时两种事物之间的关系,便是共变关系.例如春天出生的婴儿与春天栽种的小树,就其高度而言,外表上看来都在增长,好似有关,其实,这二者都是受时间因素影响在发生变化,在它们本身之间并没有直接的关系.第三种是相关关系,即两类现象在开展变化的方向与大小方面存在一定的关系,但

3、不能确定这两类现象之间哪个是因,哪个是果;也有理由认为这两者并不同时受第三因素的影响,即不存在共变关系.具有相关关系的两种现象之间,关系是较复杂的,甚至可能包含有暂时尚未熟悉的因果关系及其共变关系在内.例如,同一组学生的语文成绩与数学成绩的关系,即属于相关关系.二、相关的种类统计学中所讲的相关是指具有相关关系的不同现象之间的关系程度.相关的种类可以从不同角度划分,从其变化方向来看,两个变量之间的相关可以分为:1 .正相关.正相关指的是两列变量变动方向相同,即两个变量中,一种变量增大时,另一种变量也随着增大,一个变量减小时,另外一个变量也随着减小.如身高与体重的关系,一般讲身长越长体重就越重.智

4、力和学业成绩之间的关系.2 .负相关.负相关指的是两列变量变动方向相反,即两个变量中,一种变量增大时,另一种变量就随着减小,一个变量减小时,另外一个变量反而随着增大.如心理压力与工作绩效的关系等.初学打字时练习次数与出现错误量之间的关系.3 .零相关.两变量值的变化方向无规律,即一个变量值增大,另一个变量对应值或增大或减小,且增大会减小的时机根本相同,这种情况下,这两个变量之间的相关称为零相关.如学习成绩优劣与身高之间的关系,人的相貌和智力的关系等.假设从变量的个数来划分,可以将相关分为:1 .简单相关:两个变量之间的相关;2 .复相关:一个变量与两个或两个以上变量之间的相关;从变量之间相关关

5、系的程度上划分,可以划分为:1 .高相关2 .中等程度相关3.低相关三、相关散点图相关散点图是用直角坐标系上点的散布形状,来表示两个事物之间的相关性及练习的模式.在坐标系中,以X轴表不一个变量,Y轴表不一个变量,在坐标中描出相应的坐标点,由这些坐标散点组成的图形就称为相关散点图.相关散点图的用途:1 .判断相关是直线型的;2 .判断相关密切程度上下;3 .判断相关变化方向.四、相关系数相关系数是两列变量间相关程度的数字表现形式,或者说是表示相关程度的指标.作为样本间相互关系程度的统计特征数,常用r表示,作为总体参数,一般用p表示,并且是指线性相关而言.相关系数的取值介于-1.00至+1.00之

6、间,常用小数形式表示.它只是一个比率,不代表相关的百分数,更不是相关量的相等单位的度量.相关系数的正负号,表示相关方向,正值表示正相关,负值表示负相关.相关系数取值的大小表示相关的程度.相关系数为0时,称零相关即毫无相关,为1.00时,表示完全正相关,相关系数为-1.00时,为完全负相关.这二者都是完全相关.如果相关系数的绝对值在1.00与0之间不同时,那么表示关系程度不同.接近1.00端一般为相关程度密切,接近0值端一般为关系不够密切注意:假设是非线性相关关系,而用直线相关计算r值可能很小,但不能说二变量关系不密切.关于这一点如何判定,尚须考虑计算相关系数时样本数目的多少.如果样本数目较少,

7、受取样偶然因素的影响较大,很有可能本来无关的两类事物,却计算出较大的相关系数来.例如欲研究身高与学习有无关系,如果只选3、5个人,很可能遇到身材愈高学习愈好这一类偶然现象.这时虽然计算出的相关系数可能接近1.00,但实际上这两类现象之间并无关系.究竟如何综合考虑样本数目大小,相关系数取值大小而判定相关是否密切这一问题,一般要经过统计检验前方能确定.相关系数不是等距的度量值,因此在比拟相关程度时,只能说绝对值大者比绝对值小者相关更密切一些,如只能说相关系数r=0.50的两列数值比相关系数r=0.25的两列数值之间的关系程度更密切,而绝不能说前二者的密切程度是后二者密切程度的两倍.也不能说相关系数

8、从0.25到0.50与从0.50到0.75所提升的程度一样多.存在相关关系,即相关系数取值较大的两类事物之间,不一定存在因果关系,这一点要从事物的本质方面进行分析,绝不可简单化.计算相关系数一般要求成对的数据,即假设干个体中每个个体要有两种不同的观测值.例如每个学生智力相同者的算术和语文成绩;每个人的视反响时和听反响时;每个学生的智力分数与学习成绩等等.任意两个个体之间的观测值不能求相关.计算相关的成对数据的数目,一般以30以上为宜.小结:相关系数是描述两列或都列数据之间关联程度上下的指标.可以分为:正相关、负相关和零相关,简单相关和复相关;高相关、中等程度相关和低相关几种类型.相关散点图是表

9、示两个事物之间的相关性及联系的模式.可以通过相关散点图的大致了解:1.判断相关是直线型的;2.判断相关密切程度上下;3.判断相关变化方向.相关程度的大小可用相关系数来描述.第二节积差相关系数、概念及适用条件一概念积差相关,又称积矩相关,是英国统计学家皮尔逊于方法,因而也称皮尔逊相关,是求直线相关的根本方法.积差相关系数用r表示xyrNSxSy入y式中xXX,yYY,N为成对数据的数目,Sx为X变量的标准差,Sy为Y变量的标准差.二适用条件计算积差相关时,需要变量符合以下几个条件.首先两列数据都是测量的数据,而且两列变量各自总体的分布都是正态的,即正态双变量.为了判断计算相关的两列变量其总体是否

10、为正态分布,一般要根据已有的研究资料查询,假设无资料可查,研究者应取较大样本分别对两变量作正态性检验.这里只要求保证双变量总体为正态分布,而对要计算相关系数的两样本的观测数据,并不要求一定为正态分布.其次,两列变量之间的关系应是直线性的,如果是非直线性的双列变量,不能计算线性相关.如何判断两列变量之间的相关是否直线式,可作相关散布图进行初步分析,也可查阅已有的研究结果论证.相关散布图是以二列变量中的一列变量为横坐标,以另一列变量为纵坐标,画散点图.如果所有散点分布呈椭圆型,那么说明二变量之间呈线性关系,如果散点呈弯月状不管弯曲度大小或方向,说明二变量之间呈非线性关系.画散点图时,如果分别以二变

11、量的Z分数为横坐标与纵坐标,那么相关趋势的考察更清楚,假设散点接近相等地散布在四个象限中,那么相关系数接近于零.假设1、3象限的散点明显地多于2、4象限,或2、4象限的散点明显地多于1、3象限,都说明二变量呈线性相关.相关系数的大小,亦可根据20世纪初提出的一种计算相关的(5-1)散点呈椭圆形状的狭长情况进行粗略分析.最后,两变量测量到的数据必须是成对的数据,对于不成对的数据无法计算两个变量之间的相关,及时可以计算,得到的相关也没有意义.二、计算方法一根本公式计算法1计算均值和标准差,X,Sx,Y,Sy;2计算积差XiXYiY;3计算积差的和XjXYYxy4代入相关系数的公式计算:rNSxSy

12、例1某校为调查学生学习各科目之间水平的迁移问题,随机抽取10名学生的政治与语文成绩见表5-1,请计算其相关程度.表5-110名学生政治与语文成绩相关系数计算表学生序号X皿Y政治xyxy17482-1.6-1.72.72027175-4.6-8.740.02380814.4-2.7-11.88485899.45.349.82576820.4-1.7-0.680677891.45.37.420777881.44.36.02086884-7.60.3-2.28097480-1.6-3.75.920107487-1.63.3-5.280X75.683.7S4.4544.337091.80按表5-1的资

13、料,计算结果为即10名学生政治科目和语文科目的相关程度为0.475.二原始数据计算上面5-1的公式可以转化成:XYN2(X)2X2.N,利用上式可以直接用原始数据计算相关系数.其计算步骤为:1计算X变量的X、*2和X2;2计算Y变量的丫、丫2和丫2;3计算XY,XY;4将有关数据代入公式5-2,求得r.例2:请用表5-1中的原始数据,计算两科目成绩的相关系数.计算结果见表5-2.表5-210名学生政治与语文成绩相关系数计算表学生序号X语文Y政治XY2X2Y1748260685476672427175532550415625380816480640065614858975657255792157

14、682623257766724xyNSxSvxy91.80104.45424.3370.475Y2(Y)2N67789685359297921777886776592977448688457124624705697480592054766400107487643854767569756837633695735270245解:将表中计算结果代入公式5-2中,6336975683710,57352(756)210?70245(837)210即表5-2中10名学生政治与语文成绩相关系数为0.475.小结:积差相关是描述两列连续变量之间线性相关程度上下的最重要的统计指标,计算积差相关数据资料应满足:1

15、两列数据都是测量的数据,而且两列变量各自总体的分布都是正态的,即正态双变量.2两列变量之间的关系应是直线性的;3最后,两变量测量到的数据必须是成对的数据.xy积差相关系数定义为:r,用原始数据计算积差相关系数的公式为:NSxSyXYXYN(X)2Y2(Y)2一N.YN第三节其他相关系数、斯皮尔曼等级相关1.概念及适用条件0.475两变量是等级测量数据,且总体不一定呈正态分布,样本容量也不一定大于这样两变量的相关,称为等级相关.由于等级相关是英国统计学家斯皮尔曼提出来的,叫斯皮尔曼等级相关.2适用条件两变量的资料为等级测量数据,且具有线性关系;连续变量的测量数据,按其大小排成等级,也可以用等级相

16、关法计算;不要求总体呈正态分布.2.计算方法计算步骤为:例310名学生的语文成绩与阅读水平成绩见表5-3,求其等级相关系数.表5-310名学生的语文与阅读水平等级相关计算表序号X语文等级Y阅读水平DD218800267-1135411432115211130,计算所以等级相关系数的符号以rR表示,计算公式为:rR6D212N(N21)(5.3)式中D为各对等级之差,2D是各D平方之各,N为等级数目.(1)计算两变量等级之差D;(2)计算D2;(3)计算D2之和,即D2;将有关数据代入公式5.3求得等级相关系数.645-11776118910-11913-24101091112如果求相关的是连续

17、变量,但是这两列连续变量不服从正态分布,计算相关时需要先把数据转换为等级变量,即将数据从大到小或从小到大排成等级,假设出现相等的等级数时,可用他们所占等级位置的平均数作为他们的等级.例4某校为了研究学生自学水平与学业成绩之间的关系,随机抽取10名学生的自学水平与学科学习成绩,见表5-4.求学生的自学水平与学习成绩的相关系数.表5-410名学生的自学水平与学习成绩的相关计算表序号X水平等级Y成绩等级D2D1903.5884-0.50.252857806+11370108064164857798-115903.5952.51168097010-117857759-24810019810098758

18、06-1110922952.5-0.50.25解:将有关数据代入公式5.4中得R1-2N(N21)6120.92710(1001)即10名学生语文成绩与阅读水平的相关系数为0.927.即学生的自学水平与学习成绩的相关程度为0.85.等级相关不考虑变量的分布形态,计算也比拟简单.但是由于把精确的数据转换为等级数据,损失了较多的信息,使其计算的精确程度降低了.因此,当原始数据是精确的连续变量,且分布为正态或近似正态分布时,应该用积差相关系数.(二)肯德尔和谐系数1.概念及适用条件(1)概念肯德尔和谐系数又称为肯德尔W系数.当多个变量值以等级顺序表示时,这几个变量之间的一致性程度,称为肯德尔和谐系数

19、.(2)适用条件适用于两列以上的等级变量.如了解几个评定者对同一组学生学习成绩等级评定的一致性程度,就要用到肯德尔和谐系数.肯德尔和谐系数常用符号W表示,其公式为:SSRW(5-4)123K2(N3N)1222tR2(R)2式中SSRRiRi2,NNRi为每一件被评价事物的K个等级之和;N为被评价事物的数目;K为评价者的数目或等级变量的列数.计算步骤为:(1)分别计算每个被评对象等级之和R;25.5625.510(1021)0.85(2)计算R2的值和R2的值;(3)计算SSR的值;(4)将有关数据代入公式(5-4),求得W系数.例5某评价小组7人依据已确定的4项内容对某教师打分,将分数转换为

20、等级后的结果见表5-5,求这7人对该教师评价的一致性程度.表5-57人评价某教师意见资料表一一三四12.542.51.23.53.51.51.532.52.514442225341.51.56123472422R18.52213.516R 702R342.25484182.25256R270解:将上表数据代入公式(5.4)中得Sai12K2(n3n)1264.51272实际上,当出现相同等级时,应求校正的(70)240.161(434)W系数,其校正公式为:式中:C(t3t)上.皿t为相同等级数.SSRWK2(n3n)KC12(5-5)例5中第一个人评的有2个等级相同,第一个人评的有2个3.5

21、等级和2个1.5等级,同,第七个人评的有3个等级相同.所以、点二列相关(一)概念及适用条件1 .概念两列变量一列是正态连续性变量,另一列是二分变量,描述这两个变量之间的相关,称为点二列相关.2 .适用条件一列变量为正态连续变量,而另一列为二分变量.例如,男生和女生,已婚和未婚,选择答案的正确与错误.(二)计算方法点二列相关系数用符号rpb表示,计算公式为:式中:p为二分变量中某一项所占比例;q为二分变量中另一项所占比例,为二分变量中比例为p局部所对应的连续变量的平均数,Xq为二分变量中比例为q局部所对应的连续变量的平均数,Sx为连续变量的标准差.计算步骤:(1)分别计算二分变量中每项所占的比例

22、;(2)计算二分变量中比率为p项所对应连续变量的平均数和比率为q项所对应连续变量的第三个人评的有2个等级相同,第四个人评的有3个等级相同,第五个人评的有2个等级相因此,(t3t)232121223212232122321233323212123336.512校正后的W系数为:SSR39.512K2(n3n)KC1272(434)76.539.50.198199.5(5-6)1;平均数.3计算连续变量的标准差;4将数据代入公式5-6,求得点二列相关.例6随机抽取某区初二数学期末统测试卷15份,试计算第二题与总分相一致的程度第二题的得分与总分一致的程度即是试题的区分度,区分度是衡量试题鉴别水平的指

23、标值数据见表5-6.表5-6某区初二15名学生数学期末统考第二题得分及总分资料表学生序号123456789101112131415第二题得分101000110111111总分697179868787818981929193929393解:1求答对第二题的比率p和答错第二题的比率qp=10/15=0.67q=1p=0.332求Xp,Xq,即答对第二题学生成绩的平均数:Xp=87.2分答错第二题学生成绩的平均数:Xq=82.4分求Sx,所有考生总分的标准差:Sx=7.597分将有关数据代入公式5-6,可得87.282.4rab0.670.330.2977.597即该试卷第二题的区分度为0.297.

24、三、相关一概念及适用条件1 .概念当两变量均为二分变量时,描述这两个变量之间的相关,称为相关.2 .适用条件相关的适用条件为两变量都是二分变量.无论是真正的二分变量,还是人为划分的二分变量,只要资料整理为2X2列联表的形式,都可用相关计算相关程度.类.求性别与数学成绩之间的相关系数.表5-8100名学生成绩分布表85分以上小结:斯皮尔曼等级相关是描述两等级测量数据,且总体不一定呈正态分布,定大于30的两变量之间的相关.适用条件为:两变量的资料为等级测量数据,且具有线性关系;连续变量的测量数据,按其大小排成等级,也可以用等级相关法计算;二计算方法相关以符号r表示,其计算公式为:adbc,(ab)

25、(ac)(bd)(cd)(5-7)式中:a、b、c、d分别表示四格表中的实际次数,如表5-7所示.表5-72X2列联表Y1Y2X1X2aba+bcdc+da+cb+da+b+c+d某区为研究性别与学习数学的关系,随机抽取100名,以数学成绩85分为限进行分85分以下男生311849女生2922516040100解:将有关数据代入公式5-7,得31221829;(3118)(3129)(1822)(2922)0.065即性别与数学成绩之间的相关系数为0.065.样本容量也不一不要求总体呈正态分布.肯德尔和谐系数又称为肯德尔W系数.是描述多个等级变量之间的一致性程度的统计指标.适用条件为:适用于两

26、列以上的等级变量.如了解几个评定者对同一组学生学习成绩等级评定的一致性程度,就要用到肯德尔和谐系数.点二列相关是描述一列是正态连续性变量,另一列是二分变量的两个变量之间的相关的统计指标.适用条件为:一列变量为正态连续变量,而另一列为二分变量.相关是描述两二分变量之间的相关程度的统计指标.适用条件为:两变量都是二分变量.无论是真正的二分变量,还是人为划分的二分变量,只要资料整理为2X2列联表的形式,都可用相关计算相关程度.第四节解释与应用相关系数时应注意的问题相关系数是两变量间相关程度的数量表现形式,是两变量间的变化方向和程度的书量化指标.作为样本间相互关联程度的统计特征值,常用r表示,作为总体

27、参数一般用p表示,且均指线性关系.在解释和应用相关系数时,应注意一下几个方面:一、相关系数的取值介于-1和1之间,相关系数的正负号表示相关的方向,正值表示正相关,负值表示负相关,相关程度那么以相关系数绝对值的大小表示.二、相关系数是一个比值,不具有等距单位,所以相关系数不可以进行加减乘除的运算.如相关系数r1=0.4,r2=0.8,不能说r2是ri相关程度的二倍.三、两变量之间存在相关,但并不一定存在因果关系,不能以相关程度为依据来判断事物之间联系的性质,而要从事物的本质方面进行分析,以便得出科学的结论.四、研究相关,一般要求大样本的成对变量,尤其是积差相关系数受样本容量的大小及样本取样范围的影响较大,因此在求积差相关时成对的变量个数以不小于30为好.五、由于样本相关系数受抽样误差影响,因此,由样本计算的相关系数需通过显著性检验才能确定其是否真正有意义.【思考练习及参考答案】思考和练习一、是非题1相关系数到达0.4,即为高度相关.2点二列相关是积差相关

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论