




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1,我们被信息淹没, 但却缺乏知识。 Rutherford D. Roger,2,5.1 相关的意义 5.2 积差相关 5.3 等级相关(秩相关) 5.4 质与量相关 5.5 品质相关,第五章 相关关系,3,5.1 相关的意义,4,相关关系 (类型),5,相关系数(correlation coefficient),对变量之间关系密切程度的度量 对两个变量之间线性相关程度的度量称为简单相关系数 若相关系数是根据总体全部数据计算的,称为总体相关系数,记为 若是根据样本数据计算的,则称为样本相关系数,记为 r,6,1、正相关 2、负相关 3、零相关,7,相关系数 (取值及其意义),r 的取值范围是
2、-1,1 |r|=1,为完全相关 r =1,为完全正相关 r =-1,为完全负正相关 r = 0,不存在线性相关关系 -1r0,为负相关 0r1,为正相关 |r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切,8,相关系数 (取值及其意义),r,9,散 点 图,以X、Y二列变量中的一列变量(如X)为横坐标,以另一变量为纵坐标,把每对数据(Xi,Yi)描绘在XOY坐标系中,产生的图形称为散点图。 散点图能够大致反映数据的分布情况和相关关系。,10,散点图(scatter diagram),11,散点图 (例题分析),【例5.1】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施
3、建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的增长,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。下面是该银行所属的25家分行2002年的有关业务数据,12,散点图 (例题分析),13,散点图 (例题分析),14,标准分数散点图,以标准分数为坐标的散点图,对相关趋势的考查更清楚。若散点近似分散于四个现象中,则相关系数接近于零。若一、三象限的点明显多于二、四象限的点,或二、四象限的点明显多于一、二象限的点,说明两变量呈线性相关。前者为正相关,后者为负相关
4、。,15,5.2 积差相关,计算相关系数的一种最常用的方法 要求成对数据,且不少于30对 两列变量各自总体为正态 两列变量均为连续变量 只反映两列变量之间的线性关系,16,积差相关的使用条件,1、两个变量都是由测量获得的连续性数据。 2、两个变量的总体都呈正态分布。 3、必须是成对数据,而且每对数据之间相互独立。 4、两个变量之间呈线性关系。 5、排除共变因素的影响。 6、样本容量N大于或等于30。,17,积差相关系数 (相关统计量),样本均值,样本方差,样本协方差,离均差,18,积差相关系数 (计算公式),19,5.3 等级相关(秩相关),计算相关系数的一种最常用的方法 两列变量各自总体不一
5、定为正态 两列变量均为定序变量或数值型变量 只反映两列变量之间的线性关系 以等级次序排列或以等级次序表示的变量之间的相关 包括斯皮尔曼等级相关和肯德尔W系数,20,斯皮尔曼等级相关,当两个变量以等级次序排列或以等级次序表示时,两个相应总体并不一定呈正态分布,样本容量也不一定大于30。 适用用于两列定序变量之间的线性相关程度的度量。 适用于非正态数值型数据的线性相关程度的度量。,21,等级相关系数计算公式,22,等级相关(例子),23,等级相关(例子),这10人的视听反应时的等级相关系数为0.71.,24,等级相关(例子),25,等级相关(例子),数学与语文成绩有相关,相关系数为0.84。,26
6、,肯德尔W系数,当多个(两个以上)变量值以等级次序排列或以等级次序表示,描述这几个变量之间的一致性程度(即相关)的量。 多列等级变量相关程度的一种度量方法 原始数据的获得采用等级评定法,即让K个评价者对N件事物进行等级评定,每个评价者都能对N件事物排出一个等级顺序。最小等级数为1,最大为N。 W值介于0、1之间。如果K个评价完全一致,则W1;如果K个评价存在一定的关系,但不完全一致,则0W1;如果K个评价完全不一致,则W0。,27,W的基本计算公式,其中,Ri 代表评价对象获得的K个等级之和 N 代表评价对象的数目 K 代表评价者的数目,28,有相同等级时W的计算,其中,n 代表相同等级的数目
7、,29,肯德尔和谐系数的计算例子,30,肯德尔和谐系数的计算例子,从W的值可知,这十人对颜色的喜爱具有较高的一致性。,31,肯德尔和谐系数的计算例子,32,肯德尔和谐系数的计算例子,从计算结果可知,五位评分者对七篇作文的评价标准比较一致,或者说评分者信度较高。,33,5.4 质与量相关,需要计算相关的两列变量其一为数值型数据,另一为分类数据。这样两列变量的直线相关称之为质量相关。 包括点二列相关,二列相关,多列相关。,34,二列相关,当两个变量都是正态连续变量,其中一个变量被人为地划分成二分变量,表示这两个变量之间的相关。,35,使用条件: 1、两个变量都是正态连续变量 2、两个变量之间是线性
8、关系 3、二分变量是人为划分的 4、样本容量N应当大于80 相关系数的计算:,36,点二列相关,条件:两列变量中,其一为数值型数据,总体为正态分布,另一为真正二分变量。 计算公式: 取值范围:,其中, 是与二分变量的一个值对应的连续变量的平均数 是与二分变量的另一个值对应的连续变量的平均数 p,q是二分变量两个值各自所占的比例,pq1 st 是连续变量的标准差。,37,点二列相关(例子),计算结果表明,文盲、非文盲与测验得分存在较高的一致性。,38,39,5.5 品质相关,用于表示RC(行列)表的两个变量之间的关联程度。 一般都是计数数据 四分相关, 相关,列联表相关。,40,四分相关,适用数据:两个变量都是连续变量,且呈线性关系,每一个变量都被人为地分成两种类型。 数据的表示: 四格表 计算公式:,41,相关系数,表示两因素两项分类资料相关程度最常用地一种相关系数。 计算公式:,关联系数,归结系数,42,列联表(contingence table)相关,由二因素的RC列联表资料求得 表示两因素之间的相关程度 计算公式:,43,相关系数的选用与解释,选用:首先,考虑每种测量所产生的数据的类别。其次,对第一种测量数据和第二种测量数据的类型依次做出判断。最后,确定相关系数。 解释:相关系数是一个指标值,表示两个变
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 门店店员激励政策方案
- 园艺技巧面试题及答案
- 淘宝店考试题及答案
- 单位物业劳务外包方案
- 传媒行业提成方案
- 采购合同绩效评估与改进培训协议
- 湘江小学面试题及答案
- 中医精神病护理
- 铁路维护工程招标方案
- 政企沙龙面试题及答案
- 路灯安装考试试题及答案
- 赤峰市翁牛特旗招聘社区工作者笔试真题2024
- 线上游戏账号及虚拟物品交易合同
- 2025至2030全球及中国家用湿巾行业发展趋势分析与未来投资战略咨询研究报告
- 市场监管培训
- 2025至2030中国电镀锌钢行业发展趋势分析与未来投资战略咨询研究报告
- 山西省2025年中考语文真题(含答案)
- 企业研发人员管理制度
- 黑吉辽蒙2025年高考政治真题含解析
- 沪教七年级 (下) Unit 7 Role models of our time 重点复习课件
- 2025年云南省高考化学试卷真题(含答案解析)
评论
0/150
提交评论