两变量间的关系的度量.ppt_第1页
两变量间的关系的度量.ppt_第2页
两变量间的关系的度量.ppt_第3页
两变量间的关系的度量.ppt_第4页
两变量间的关系的度量.ppt_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三讲两变量间关系的度量,相关系数、协方差,第一节概述,1相关关系的概念和分类,相关的概念事物之间的关系种类:因果关系、共变关系和相关关系。事物之间存在联系,但又不能直接作出因果关系的解释,也有理由认为这两者不存在共变关系,事物间的这种关系即相关关系。相关关系的种类正相关与负相关直线相关与曲线相关完全相关、高度相关、低度相关和零相关,相关关系的散点图示1,散点呈椭圆形分布,X、Y同时增减-正相关(positivecorrelation);X、Y此增彼减-负相关(negativecorrelation)。,散点在一条直线上,X、Y变化趋势相同-完全正相关;反向变化-完全负相关。,相关系数示意图,相关关系的散点图示2,零相关图示,曲线相关图示,2相关分析相关程度的度量,相关分析相关分析就是探索变量之间关系的紧密程度及其表现形式的过程。常用方法:图示法:散点图计算法:积差相关等级相关(斯皮尔曼等级相关、肯德尔和谐系数)点二列相关双列相关四分相关,相关系数的数字特征,相关系数记为:相关系数的值域:-1,+1相关系数的符号表示相关的方向,绝对值的大小表示关系紧密程度。r1:完全正相关r-1:完全负相关r0:零相关0.70|r|1:高度相关0|r|0.40:低度相关0.40|r|0.70:中等相关,3相关系数的使用条件,计算相关系数一般要求成对数据。任意两个个体之间的观测值不能求相关。要先考察两变量关系的形式。相关关系不同于因果关系。相关系数不是等距变量。相关系数需要检验。,计算相关系数、相关系数的解释应该注意哪些问题?,4线性相关的实质代数式阐述,例:有一组数2、4、5,它由小到大排列。另外有三个数:3、4、7,这三个数按任意次序排列,可以排出6种不同的式样:3、4、7;3、7、4;4、3、7;4、7、3;7、3、4;7、4、3。对每一种排法,将它与前一组数2、4、5依次相乘相加,结果会是怎样呢?,23+44+57,23+47+54,24+43+57,24+47+53,27+43+54,27+44+53,57,54,55,51,46,45,从该例中,可以看出:在第一组数据2、4、5呈自然次序的条件下,另一组数据越是呼应这个次序,二者相应项的乘积和就越大,反之就越小。,推广,?,单位不等,以致于无法比较,怎么办?,?,数据个数不等,以致于无法比较,怎么办?,?,线性相关的实质是什么?,TotalVariabilityofY.SSY,R2,X,VariabilityofYthatispredictedbyX.SSreg,Y,相关系数的方差图示,相关系数的双变量总体表示,第二节积差相关,1积差相关的使用条件,成对数据(2种情况)双变量总体正态双变量为连续变量两变量关系为直线性,5积差相关,1、定义公式:2、适用条件:两列变量都是等距或等比的测量数据;两列变量所来自的总体必须是正态的或近似正态的对称单峰分布;两列变量必须具备一一对应的关系。3、差法公式:,图解,积差相关计算实例,返回,例:10名学生的政治与语文成绩如下表所示,求二者的相关系数。,习题,()6相关系数可以直接计算其平均数。1、协方差七、某班学生12人,他们的期终考试数学成绩和总成绩如下表所示。请问:(1)两者的相关为多大?估计其95%的置信区间;(2)建立以数学成绩预测总平均成绩的回归方程,并验证其有效性。a=0.05,F(1,10)0.05=4.96,(25分)提示:若Zr=ln(1+r)/(1-r)的平方根,Zp=ln(1+p)/(1-p)的平方根,则有ZrN(Zp,1/(N-3)的平方根)学生序号数学成绩807065605590788070708065总平均成绩655075856586806055556575,习题,六、下表给出了某班12名同学两次考试的成绩。要求:1、计算两次考试成绩(X、Y)的相关2、求Y对X的线性回归方程;3、对所求方程进行方差分析,以检验其显著性提示:F.05(1,10)=4.96,F.01(1,10)=10.04,F.05(1,11)=4.84,F.01(1,11)=9.65)。被试123456789101112考试一(X)656367646862706668676971考试二(Y)686668656966686571676870,6协方差,定义:,与积差相关系数的关系:,第三节等级相关非参数的线性相关,一、斯皮尔曼等级相关rR,适用条件:属直线相关范畴,积差相关体系适用于两列具有等级顺序的测量数据,或总体为非正态的等距、等比数据。如果两列变量是连续变量,但样本容量小,且总体分布非正态,常常将连续变量转换为等级变量,然后计算等级相关。优点:总体分布不作要求缺点:精度低于积差相关,1斯皮尔曼等级相关公式,等级差数法公式:等级序数法公式(略)当相同等级增多时,需校正。,等级相关计算实例,例:有人对15个车间的生产质量与纪律的状况进行了调查,各车间的排名如下表所示,问质量与纪律的关系如何?,等级相关的校正,例:10名学生的两次测验成绩如表所示,求其等级相关系数。,有两个1.5等,有四个5.5等,二、肯德尔和谐系数W,适用条件:适用于多列等级变量的相关分析.公式:当相同等级增多时,需校正。,公式变形,肯德尔和谐系数计算实例,例:6位都是对五篇相同作文所评等级如下表,试分析所评等级的一致性如何。,肯德尔和谐系数计算的校正,例:5位评价者对6位教师教学质量评定等级如表所示,试分析这5位评价者的评价一致性程度。,教师1评了两个2.5等,教师2评了三个5等,习题,2、对10名同三学生的语文成绩和英语成绩进行排名,得出以下结果:学生编号12345678910语文名次12345678910英语名次21345768109试求语文与英语的相关系数。(10),习题,2、有3位教师对5位学生的作文进行等级评定,结果如下:A生得到的等级评定分别是:3、5、3;B生得到的等级评定分别是:1、2、2;C生得到的等级评定分别是:2、1、1;D生得到的等级评定分别是:2、3、2;E生得到的等级评定分别是:2、4、3;请计算3位老师评定的肯德尔和谐系数。(10%),习题,(二)五位教师对甲乙丙三篇作文分别排定名次如下表:教师序号名次甲乙丙13122321331241325132请对上述数据进行相应的统计分析(10),第四节质量相关,一、点二列相关,适用条件:一列为来自正态总体的等距或等比的测量数据;另一列变量为真正二分称名变量。公式:,对应关系表示,点二列相关系数计算实例,返回,例:一次某种能力测验,一考场共14名考生,男生的成绩为分别为:67、10、20、43、61、26、18、35、23;女生成绩分别为:44、60、10、23、30。问从该考场看,该能力的测验成绩与性别是否相关?,二、双列相关,1、适用条件:两列变量均为来自正态总体的等距或等比变量,而其中一列被人为地划分为两个类别的数据。2、公式:双列相关系数计算实例,双列相关系数计算实例,返回,例:12名学生的测验总分与在某题

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论