第五章 相关系数_第1页
第五章 相关系数_第2页
第五章 相关系数_第3页
第五章 相关系数_第4页
第五章 相关系数_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章第五章 相关系数相关系数李金德李金德n第一节第一节 相关系数与散点图相关系数与散点图n第二节第二节 积差相关积差相关n第三节第三节 等级相关等级相关n第四节第四节 质与量相关质与量相关n第五节第五节 品质相关品质相关n第六节第六节 相关系数的选用与解释相关系数的选用与解释第一节第一节 相关系数与散点图相关系数与散点图n一、什么是相关?一、什么是相关?n(一)事物可能存在的关系(一)事物可能存在的关系n1.因果关系因果关系nA是引起是引起B的原因,的原因,B是是A导致的结果。导致的结果。n如:扁桃体发炎导致喉咙十分难受。如:扁桃体发炎导致喉咙十分难受。n又如又如:努力学习让学习成绩得到了提

2、高。努力学习让学习成绩得到了提高。ABn2.共变关系共变关系n表面看似有关系的两个事物,实际上是因为两者都与表面看似有关系的两个事物,实际上是因为两者都与第三个事物有关的缘故。第三个事物有关的缘故。n如:医疗设备越好居民患病率越高。如:医疗设备越好居民患病率越高。n又如:研究发现携带火柴的数量与肺癌患病率正相关。又如:研究发现携带火柴的数量与肺癌患病率正相关。ABCn3相关关系相关关系nA与与B在发展变化的方向与大小方面存在一定关系。在发展变化的方向与大小方面存在一定关系。n相关关系不同于因果关系,不能确定两者谁是因果;相关关系不同于因果关系,不能确定两者谁是因果;也有理由认为这两者不同时受第

3、三个因素的影响,即也有理由认为这两者不同时受第三个因素的影响,即不存在共变关系。不存在共变关系。n但是,相关关系比较复杂,研究中研究者常常把相关但是,相关关系比较复杂,研究中研究者常常把相关作为因果和共变关系的研究前奏。作为因果和共变关系的研究前奏。n(二)相关的类别(二)相关的类别n1.从方向上来判断从方向上来判断n正相关正相关变化方向一致,变化方向一致,“同增共减同增共减” n负相关负相关变化方向相反,变化方向相反,“此增彼减此增彼减”n零相关零相关变化没有趋势趋势变化没有趋势趋势n2.从形状上看从形状上看n直线相关直线相关n曲线相关曲线相关n3.从相关程度上看从相关程度上看n完全相关:完

4、全相关:A和和B变化完全对应。表现为坐标上的一变化完全对应。表现为坐标上的一条直线。条直线。n强相关:强相关:A变化时变化时,B增大(或减少)的可能性非常大。增大(或减少)的可能性非常大。表现为散点图较为集中在某条直线的周围。表现为散点图较为集中在某条直线的周围。n弱相关:弱相关:A变化时变化时,B增大(或减少)的可能性较少。增大(或减少)的可能性较少。表现为散点图较为分散的集中在某条直线的周围。表现为散点图较为分散的集中在某条直线的周围。n零相关:零相关:A变化时变化时,B或增大或减少,好无规律。或增大或减少,好无规律。二、相关系数二、相关系数n概念概念:相关系数是变量之间相关程度的指标。计

5、算相:相关系数是变量之间相关程度的指标。计算相关系数一般需大样本。关系数一般需大样本。n符号符号:样本相关系数:样本相关系数r,总体相关系数,总体相关系数 n取值取值:-11。n性质性质:顺序数据。:顺序数据。三、散点图三、散点图XY0完全正相关完全正相关XY0高正相关高正相关XY0零相关零相关XY0完全负相关完全负相关XY0高负相关高负相关XY0零相关零相关第二节第二节 积差相关积差相关n一、概念及适用范围一、概念及适用范围n积差相关,是计算两个变量线性相关的一种方法,由积差相关,是计算两个变量线性相关的一种方法,由英国统计学家皮尔逊提出,因此也称为皮尔逊英国统计学家皮尔逊提出,因此也称为皮

6、尔逊(Pearson)相关。相关。n 适用范围:适用范围:数据成对数据成对n 两变量总体正态分布或接近正态分布两变量总体正态分布或接近正态分布n 两变量是连续变量两变量是连续变量n 两变量为线性关系两变量为线性关系二、计算公式二、计算公式n1.运用标准差与离均差的计算公式运用标准差与离均差的计算公式222y2xyxyx,Ny,Nx,x,xyrSSYSXSNYYyXXyxSNSxyryx根据的标准差为的标准差为为成对数据的数目两个变量的离均差,二、计算公式二、计算公式n2.运用标准分数计算积差相关运用标准分数计算积差相关变量的标准分为变量的标准分为YZXZZZNryxyx1二、计算公式二、计算公

7、式n3.运用原始数据计算积差相关运用原始数据计算积差相关2222 YYNXXNYXXYNr或者NYYNXXNYXXYr2222例题例题5-1 试问身高与体重有无关系试问身高与体重有无关系第1 栏 第2 栏 第3 栏 第4 栏 第5 栏 第6 栏 实测记分 离差记分 积差 标准记分 标准积差 身高 体重 Xd Yd YXdd XZ YZ YXZZ 编号 XXX YY YYXX XXSd YYSd YYXXSdSd 1 170 72 0 3 0 0 1.5 0.00 2 165 69 -5 0 0 -0.41 0 0.00 3 150 66 -20 -3 60 1.63 -1.5 2.44 4 1

8、80 70 10 1 10 0.82 0.5 0.41 5 185 68 15 -1 -15 1.22 -0.5 -0.61 850 345 0 0 55 2.24 Yn解:采用标准分数计算积差相关解:采用标准分数计算积差相关n(1)先求标准分数)先求标准分数1705850X695345Y25.1257502NdSXX25202NdSYYn(2)求两变量的积差)求两变量的积差n(3)再求两变量标准分数的成绩)再求两变量标准分数的成绩 ,对其求,对其求和:和:n(4)带入公式:)带入公式:YYXXyxZZ24.2yxZZ45.0524.21yxZZNr课堂练习:用原始数据计算积差相关课堂练习:用

9、原始数据计算积差相关编号编号身高身高X体重体重YX2Y2XY11705028900250085002173452992920257785316047256002209752041554424025193668205173502992925008650求和求和8312361383831117039275三、相关系数的合并三、相关系数的合并n合并的步骤:合并的步骤:n1.rZ,即先将各样本的相关系数,即先将各样本的相关系数r转化为转化为Fisher Z分分数(查附表数(查附表8););n2.求平均的求平均的Z分数:分数: ,其中,其中n为每个样本为每个样本的容量;的容量;n3.Zr,即用附表,即用

10、附表8再将平均的再将平均的Z分数转化为平均的相分数转化为平均的相关系数。关系数。33iiinZnZ第二节第二节 等级相关等级相关n一、等级相关的意义一、等级相关的意义n等级相关是根据等级资料来研究变量之间相互关系的等级相关是根据等级资料来研究变量之间相互关系的方法。方法。n数据来源:一是等级评定的资料,二是等距或比率资数据来源:一是等级评定的资料,二是等距或比率资料转化而成的等级评定资料。料转化而成的等级评定资料。n优点:使用范围较积差相关更广优点:使用范围较积差相关更广n缺点:没有积差相关精确缺点:没有积差相关精确二、斯皮尔曼等级相关二、斯皮尔曼等级相关n(一)斯皮尔曼等级相关(一)斯皮尔曼

11、等级相关nSpearmans rank correlation。符号:符号:rR ,rS.n斯皮尔曼等级相关是根据两列变量的斯皮尔曼等级相关是根据两列变量的成对等级差数成对等级差数计计算相关系数,又叫算相关系数,又叫“等级差数法等级差数法”。n条件:成对;线性相关;无正态假设;无大样本限定条件:成对;线性相关;无正态假设;无大样本限定n结论:比皮尔逊积差相关应用范围广。结论:比皮尔逊积差相关应用范围广。(二)计算公式(二)计算公式n1.无相同等级时无相同等级时n(1)利用等级差值计算)利用等级差值计算级差数二列成对等级变量的等等级对数DNNNDrs) 1(6122n(2)直接运用等级计算)直接

12、运用等级计算等级序数为两列变量各自排列的等级对数yxyxsRRNNNNRRNr,) 1() 1(413例题例题5-2n现有现有10人的视、听两种感觉道的反应时(单位:毫人的视、听两种感觉道的反应时(单位:毫秒),数据见下表。问视、听反应时是否具有一致性?秒),数据见下表。问视、听反应时是否具有一致性?听反应时听反应时 视反应时视反应时 被试被试 X X Y Y RX RY RRYXD D2 RXRY 1 1 172172 179179 7 7 5 5 2 2 4 4 3535 2 2 140140 162162 2 2 2 2 0 0 0 0 4 4 3 3 152152 153153 5 5

13、 1 1 4 4 1616 5 5 4 4 187187 189189 8 8 8 8 0 0 0 0 6464 5 5 139139 181181 1 1 6 6 - -5 5 2525 6 6 6 6 195195 220220 9 9 1010 - -1 1 1 1 9090 7 7 212212 210210 1010 9 9 1 1 1 1 9090 8 8 164164 182182 6 6 7 7 - -1 1 1 1 4242 9 9 149149 178178 4 4 4 4 0 0 0 0 1616 1010 146146 170170 3 3 3 3 0 0 0 0 9

14、9 5555 5555 4848 361361 。相关系数为人的视听反应时的等级答:这已知解:根据表中的计算,71. 01071. 011110144493) 110() 110(1036141103) 1() 1(41371. 01104861161361,48,10102222NNNRRNNNyxRRYXrNDrRRDn2.有相同等级的计算公式有相同等级的计算公式222222yxDyxrRC12) 1(,12232nnCCNNxxx为相同等级的数目nnnCCNNyyy12) 1(,12232例例5-3:n表表5-9是是10名学生的数学和语文考试成绩,问名学生的数学和语文考试成绩,问数学和语

15、文成绩是否相关?数学和语文成绩是否相关?语文语文 数学数学 学生学生 X X Y Y RX RY RRYXD D2 1 1 5959 4747 4.54.5 6 6 - -1.51.5 2.252.25 2 2 3535 4040 1010 1010 0 0 0 0 3 3 5959 4242 4.54.5 8 8 - -3.53.5 12.2512.25 4 4 5757 5555 6 6 3.53.5 2.52.5 6.256.25 5 5 5050 4949 7 7 5 5 2 2 4 4 6 6 7171 6363 1 1 1 1 0 0 0 0 7 7 6262 5555 3 3 3

16、.53.5 - -0.50.5 0.250.25 8 8 4747 4242 8 8 8 8 0 0 0 0 9 9 4343 4242 9 9 8 8 1 1 1 1 1010 6868 5757 2 2 2 2 0 0 0 0 N=10N=10 262D 。相关,相关系数为答:数学与语文成绩有84. 084. 00 .162136808222680822805 . 2121012825 . 01210125 . 225 . 0121312125 . 01212222223323322221010322yxDyxrCNyCNxCCRCYXYXNNn解:解:三、肯德尔和谐系数三、肯德尔和谐系数

17、n1.肯德尔肯德尔W系数又称和谐系数,是表示多列等级变量系数又称和谐系数,是表示多列等级变量相关程度的一种方法。相关程度的一种方法。n2.适用范围:(适用范围:(1)采用等级评定的方法收集等级数采用等级评定的方法收集等级数据,即让据,即让K个评委(被试)评定个评委(被试)评定N件事物,或件事物,或1个评委个评委(被试)先后(被试)先后K次评定次评定N件事物。件事物。n (2)每个评价者对)每个评价者对N件事物排出一个等件事物排出一个等级顺序,最小的等级序数为级顺序,最小的等级序数为1 ,最大的为,最大的为N,若并列,若并列等级时,则平分共同应该占据的等级。等级时,则平分共同应该占据的等级。n3

18、.计算公式计算公式n无相同等级无相同等级NNKsW32121评委数量被评价的事物个事物的等级之和为第KNiRNRRsiii2211311222NNNNKRWi例例5-4n有有10人对红、橙、黄、绿、蓝、紫七种颜色按照其喜人对红、橙、黄、绿、蓝、紫七种颜色按照其喜欢程度进行等级评定。其中,最喜欢的等级为欢程度进行等级评定。其中,最喜欢的等级为1,最,最不喜欢的等级为不喜欢的等级为7。结果见表。结果见表5-10。问这。问这10人对颜色人对颜色的爱好是否具有一致性?的爱好是否具有一致性?表表5-10性。的喜爱具有较高的一致值看,这十个人对颜色答:从或者解:W827. 04827. 417173171

19、351612827. 028002316712123162316710710223222WWNiisRRn(2)有相同等级)有相同等级TKNNKsW32121123nnT例例5-7:n五位评分者对七篇作文进行评价,评价等级为五位评分者对七篇作文进行评价,评价等级为15,评价结果见表评价结果见表5-12,试问评分者之间对标准的掌握是,试问评分者之间对标准的掌握是否一致?否一致?表表5-12N=7N=7 评价者评价者 K=5 K=5 被评作文被评作文 1 1 2 2 3 3 4 4 5 5 Ri Ri2 A A 4 4 5 5 3.53.5 5 5 4 4 21.521.5 462.25462.2

20、5 B B 1 1 1 1 1.51.5 2 2 1 1 6.56.5 42.2542.25 C C 2.52.5 2 2 1.51.5 2 2 2 2 1010 100100 D D 6 6 5 5 5 5 4 4 5 5 2525 625625 E E 2.52.5 3 3 3 3.5.5 2 2 3 3 1414 196196 F F 5 5 5 5 7 7 6 6 6 6 2929 841841 G G 7 7 7 7 6 6 7 7 7 7 3434 11561156 合计合计 140140 3422.53422.5 926. 05 .6725 .6225 . 5571215 .62

21、25 . 51231221221231225 .62275 .2234753223214032333332222WTNiiRRs解:第四节第四节 质与量的相关质与量的相关n一、点二列相关一、点二列相关n(一)定义(一)定义n 研究一列等距或比率变量与一列研究一列等距或比率变量与一列“二分二分”名称变名称变量之间相关的统计方法称做点二列相关。量之间相关的统计方法称做点二列相关。 符号:符号: rpb 。n(二)适用范围(二)适用范围n 1.一列数据一列数据等距或等比,总体服从正态分布;等距或等比,总体服从正态分布;n 2.另一列变量另一列变量按事物的性质划分为两类的变量;按事物的性质划分为两类的

22、变量;n 3.多用于测验中评价题目的区分度。多用于测验中评价题目的区分度。n(三)计算公式(三)计算公式np,q是二分变量各所占的比例,是二分变量各所占的比例,nSt是连续变量的标准差,是连续变量的标准差, n 是二分变量对应连续变量相应部分的平均数,是二分变量对应连续变量相应部分的平均数,nXt是连续变量的平均数。是连续变量的平均数。pqSXXrtqppbqpXX ,例例5-6n有一是非式选择测验题,每题选对得有一是非式选择测验题,每题选对得2分,共有分,共有50题,题,满分满分100分。表分。表5-14是是20名学生在该测验中的总成绩名学生在该测验中的总成绩及第及第5题的选答情况。问这道题

23、与测验总分的相关程题的选答情况。问这道题与测验总分的相关程度如何?度如何?表表5-14学生学生 总分总分 第五题第五题 学生学生 总分总分 第五题第五题 1 1 8484 对对 1111 7878 对对 2 2 8282 错错 1212 8080 错错 3 3 7676 错错 1313 9292 对对 4 4 6060 错错 1414 9494 对对 5 5 7272 错错 1515 9696 对对 6 6 7474 错错 1616 8888 对对 7 7 7676 错错 1717 9090 对对 8 8 8484 对对 1818 7878 错错 9 9 8888 对对 1919 7676 错

24、错 1010 9090 对对 2020 7474 错错 高。表明第五题的区分度教与总分有一致性。即第五题的答对与答错,相关较高,之间的相关系数为答:第五题与测验总分解:766. 0766. 05 . 05 . 088. 88 .744 .8888. 8, 8 .74, 4 .88, 5 . 02010, 5 . 02010XXqpsXXrstqppbtqp二、二列相关二、二列相关n(一)定义(一)定义n 二列相关系数是研究一列正态的比率或等距变二列相关系数是研究一列正态的比率或等距变量和一列人为量和一列人为“二分二分”名称变量之间相互关系的统计名称变量之间相互关系的统计方法。符号:方法。符号:

25、rb。n(二)适用范围(二)适用范围n 两个变量都是等距或等比数据,服从正态分布,两个变量都是等距或等比数据,服从正态分布,其中一列被人为地划分为两类。其中一列被人为地划分为两类。n 在测量中用于测验效度和试题区分度的分析。在测量中用于测验效度和试题区分度的分析。n(三)计算公式(三)计算公式nY为标准正态曲线中为标准正态曲线中p值对应的高度。值对应的高度。ypqSXXrtqpbypSXXrttpb第五节第五节 品质相关品质相关n一、四分相关一、四分相关n(一)适用条件(一)适用条件n四格表的二因素都是连续的正态变量,只是人为地将四格表的二因素都是连续的正态变量,只是人为地将其按一定标准划分为

26、两个不同的类别。其按一定标准划分为两个不同的类别。n(二)计算公式(二)计算公式bcadbccosr bcad1180cosrtt或例例5-8n下表所列的数据是调查下表所列的数据是调查377名学生两科测验成绩所得到的结果,名学生两科测验成绩所得到的结果,假设两科成绩的分布为正态,只是人为地将其按一定标准划分假设两科成绩的分布为正态,只是人为地将其按一定标准划分为及格、不及格两类。为及格、不及格两类。及格及格不及格不及格及格及格a(124)b(68)不及格不及格c(85)d(100)地地理理成成绩绩历史成绩历史成绩n解:已知解:已知a=124,b=68,c=85,d=100,a+b+c+d=377n将上面的结果代入公式得:将上面的结果代入公式得:。答:四格相关系数为2919.02919.0031.73cos)85681001241180cos(00tr二、二、相关相关n(一)适用资料(一)适用资料n 相关的适用资料是除四分相关之外的四格表资料,相关的适用资料是除四分相关之外的四格表资料,是表示两二分变量相关程度最常用的一种相关系数。是表示两二分变量相关程度最常用的一种相关系数。n

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论