版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1第七章第七章 相关分析相关分析2016.05.24相关分析的基本概念相关分析的基本概念6.1二元定距变量的相关分析二元定距变量的相关分析6.2二元定序变量的相关分析二元定序变量的相关分析6.3偏相关分析偏相关分析6.4 描述变量之间线性相关程度的强弱,并用适当描述变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过程为的统计指标表示出来的过程为相关分析相关分析。可根据研。可根据研究的目的不同,或变量的类型不同,采用不同的相究的目的不同,或变量的类型不同,采用不同的相关分析方法。本章介绍常用的相关分析方法:关分析方法。本章介绍常用的相关分析方法:二元二元定距变量的相关分析定距变量的相关分
2、析、二元定序变量的相关分析二元定序变量的相关分析、偏相关分析偏相关分析和和距离相关分析距离相关分析。 任何事物的变化都与其他事物是相互联系和相任何事物的变化都与其他事物是相互联系和相互影响的,用于描述事物数量特征的变量之间自然互影响的,用于描述事物数量特征的变量之间自然也存在一定的关系。变量之间的关系归纳起来可以也存在一定的关系。变量之间的关系归纳起来可以分为两种类型,即分为两种类型,即函数关系函数关系和和统计关系统计关系。 当一个变量当一个变量x x取一定值时,另一变量取一定值时,另一变量y y可以按照可以按照确定的函数公式取一个确定的值,记为确定的函数公式取一个确定的值,记为y=f(x)y
3、=f(x),则,则称称y y是是x x的函数,也就时说的函数,也就时说y y与与x x两变量之间存在函数两变量之间存在函数关系。又如,某种商品在其价格不变的情况下,销关系。又如,某种商品在其价格不变的情况下,销售额和销售量之间的关系就是一种函数关系:销售售额和销售量之间的关系就是一种函数关系:销售额额= =价格价格销售量。销售量。 函数关系是一一对应的确定性关系函数关系是一一对应的确定性关系,比较容易分析,比较容易分析和测度,可是在现实中,变量之间的关系往往并不和测度,可是在现实中,变量之间的关系往往并不那么简单。那么简单。 衡量事物之间,或变量之间线性相关程度衡量事物之间,或变量之间线性相关
4、程度的强弱并用适当的统计指标标示出来,这个过的强弱并用适当的统计指标标示出来,这个过程就是相关分析。相关分析的方法较多,比较程就是相关分析。相关分析的方法较多,比较直接和常用的一种是直接和常用的一种是绘制散点图绘制散点图。图形虽然能。图形虽然能够直观展现变量之间的相关关系,但不很精确。够直观展现变量之间的相关关系,但不很精确。7绘制散点图绘制散点图 将数据以点的形式将数据以点的形式绘制在直角平面上绘制在直角平面上. .比较直观比较直观, ,可以用来可以用来发现变量间的关系发现变量间的关系和可能的趋势和可能的趋势. . 体现正相关趋势体现正相关趋势8绘制散点图绘制散点图散点图应用举例:散点图应用
5、举例:通过通过2727家企业普通员工家企业普通员工人数和管理人员数人数和管理人员数, ,利利用散点图分析人数之间用散点图分析人数之间的关系。的关系。散点图在进行相关分析散点图在进行相关分析时较为粗略时较为粗略 为了能够更加准确地描述变量之间的线性相关为了能够更加准确地描述变量之间的线性相关程度,可以通过计算程度,可以通过计算相关系数相关系数来进行相关分析。相来进行相关分析。相关系数是衡量变量之间相关程度的一个量值。如果关系数是衡量变量之间相关程度的一个量值。如果相关系数是根据总体全部数据计算的,称为相关系数是根据总体全部数据计算的,称为总体相总体相关系数关系数,记为,记为;如果是根据样本数据计
6、算而来的,;如果是根据样本数据计算而来的,则称为则称为样本相关系数样本相关系数,记为,记为r r。在统计学中,一般。在统计学中,一般用样本相关系数用样本相关系数r r来推断总体相关系数。来推断总体相关系数。10以精确的相关系数以精确的相关系数(r)(r)体现两个变量间的线性关体现两个变量间的线性关系程度系程度. .r:-1,+1; r:-1,+1; |r|=1:|r|=1:完全相关完全相关; ; r=0:r=0:无线性相关无线性相关; ; |r|0.3:|r|0.3:微弱相关;微弱相关;0.3|r|0.50.3|r|0.5,低度相关;,低度相关;0.5|r|0.80.5|r|0.8,显著相关;
7、,显著相关;0.8|r|1:0.8|r|1:强(高度)相关强(高度)相关; ; 12-1 r 0r =1正相关正相关负相关负相关完全相关完全相关0 r 1r = -1不相关不相关r = 0 相相 关关 示示 意意 图图 为了判断为了判断r r对对的代表性大小,需要对相关系数的代表性大小,需要对相关系数进行假设检验。进行假设检验。 (1 1)首先假设总体相关性为零,即)首先假设总体相关性为零,即H H0 0为两总体为两总体无显著的线性相关关系。无显著的线性相关关系。 (2 2)其次,计算相应的统计量,并得到对应的)其次,计算相应的统计量,并得到对应的相伴概率值。相伴概率值。如果相伴概率值如果相伴
8、概率值P-P-小于或等于指定的小于或等于指定的显著性水平显著性水平,则拒绝,则拒绝H H0 0,认为两总体存在显著的线,认为两总体存在显著的线性相关关系性相关关系;如果相伴概率值如果相伴概率值P-P-大于指定的显著性大于指定的显著性水平水平,则不能拒绝,则不能拒绝H H0 0,认为两总体不存在显著的线,认为两总体不存在显著的线性相关关系。性相关关系。 在实际中,因为研究目的不同,变量的类型不在实际中,因为研究目的不同,变量的类型不同,采用的相关分析方法也不同。比较常用的相关同,采用的相关分析方法也不同。比较常用的相关分析是二元定距变量的相关分析、二元定序变量的分析是二元定距变量的相关分析、二元
9、定序变量的相关分析、偏相关分析和距离分析。相关分析、偏相关分析和距离分析。 二元变量的相关分析是指通过计算变量间两两二元变量的相关分析是指通过计算变量间两两相关的相关系数,对两个或两个以上变量之间两两相关的相关系数,对两个或两个以上变量之间两两相关的程度进行分析。根据所研究的变量类型不同,相关的程度进行分析。根据所研究的变量类型不同,又可以分为二元定距变量的相关分析和二元定序变又可以分为二元定距变量的相关分析和二元定序变量的相关分析。量的相关分析。 在二元变量的相关分析过程中比较常用的几个在二元变量的相关分析过程中比较常用的几个相关系数是相关系数是PearsonPearson简单相关系数、简单
10、相关系数、SpearmanSpearman和和Kendalls tua-bKendalls tua-b等级相关系数。等级相关系数。18相关系数的种类及检验相关系数的种类及检验: :简单线性相关系数简单线性相关系数(Pearson)(Pearson)定距定距变量间变量间( (如如: :身高和体重身高和体重) )2的t分布2的t分布服从自由度为n服从自由度为nr r1 12 2n nr r检验统计量t检验统计量t2 2SpearmanSpearman相关系数相关系数定序定序变量变量( (如如: :不同年龄段不同年龄段与不同收入段与不同收入段, ,职称和受教育年份职称和受教育年份) )小样本下,在原
11、假设成立时小样本下,在原假设成立时SpearmanSpearman相关系数相关系数服从服从SpearmanSpearman分布;分布;大样本下,大样本下,SpearmanSpearman相关系数的检验统计量为相关系数的检验统计量为Z Z统计量(近似服从标准正态分布)。统计量(近似服从标准正态分布)。 KendallKendall相关系数相关系数: :用非参数检验法度量定序用非参数检验法度量定序变量的相关变量的相关,服服从从标标准准正正态态分分布布1 1n nr ru u1 1,1 1 值值 5 5)2 2(2 2n n1 1)9 9n n(n n大大样样本本时时统统计计量量:z zd da a
12、l ll l分分布布,小小样样本本,服服从从k ke en n1 1n n2 2u u检检验验统统计计量量: 定义:二元定距变量的相关分析是指通过计算定义:二元定距变量的相关分析是指通过计算定距变量间两两相关的相关系数,。定距变量间两两相关的相关系数,。 定距变量:取值之间可以比较大小,可以用加定距变量:取值之间可以比较大小,可以用加减法计算出差异的大小。例如,减法计算出差异的大小。例如,“年龄年龄”变量、变量、“收入收入”变量、变量、“成绩成绩”变量等都是典型的定距变变量等都是典型的定距变量。量。 6.2.1 统计学上的定义和计算公式统计学上的定义和计算公式6.2.2 SPSS中实现过程中实
13、现过程 研究问题研究问题 某班级学生数学和化学的期末考试成绩如表某班级学生数学和化学的期末考试成绩如表6-16-1所示,现要研究该班学生的数学和化学成绩之间是所示,现要研究该班学生的数学和化学成绩之间是否具有相关性。否具有相关性。 实现步骤实现步骤6.2.3 结果和讨论结果和讨论6.2.4 绘制相关散点图绘制相关散点图 如果对变量之间的相关程度不需要掌握得那么如果对变量之间的相关程度不需要掌握得那么精确,可以通过绘制变量的相关散点图来直接判断。精确,可以通过绘制变量的相关散点图来直接判断。仍以上例来说明。仍以上例来说明。 实现步骤实现步骤 结果和讨论结果和讨论6.3.1 统计学上的定义和计算公
14、式统计学上的定义和计算公式定序变量:取值的大小能够表示观测对象的某种顺定序变量:取值的大小能够表示观测对象的某种顺序关系(等级、方位或大小等)。例如,序关系(等级、方位或大小等)。例如,“最高学最高学历历”变量的取值是:变量的取值是:11小学及以下、小学及以下、22初中、初中、33高中、中专、技校、高中、中专、技校、44大学专科、大学专科、55大学本科、大学本科、66研究生以上。由小到大的取值能够代表学历由低研究生以上。由小到大的取值能够代表学历由低到高。到高。6.3.2 SPSS中实现过程中实现过程 研究问题研究问题 某语文老师先后两次对其班级学生同一篇作文某语文老师先后两次对其班级学生同一
15、篇作文加以评分,两次成绩分别记为变量加以评分,两次成绩分别记为变量“作文作文1”1”和和“作作文文2”2”,数据如表,数据如表6-26-2所示。问两次评分的等级相关所示。问两次评分的等级相关有多大,是否达到显著水平?有多大,是否达到显著水平? 实现步骤实现步骤6.3.3 结果和讨论结果和讨论 二元变量的相关分析在一些情况下无法较为真实准确地二元变量的相关分析在一些情况下无法较为真实准确地反映事物之间的相关关系。例如,在研究某农场春季反映事物之间的相关关系。例如,在研究某农场春季早稻产早稻产量与平均降雨量、平均温度之间的关系量与平均降雨量、平均温度之间的关系时,产量和平均降雨时,产量和平均降雨量
16、之间的关系中实际还包含了平均温度对产量的影响。同时量之间的关系中实际还包含了平均温度对产量的影响。同时平均降雨量对平均温度也会产生影响。在这种情况下,单纯平均降雨量对平均温度也会产生影响。在这种情况下,单纯计算简单相关系数,显然不能准确地反映事物之间地相关关计算简单相关系数,显然不能准确地反映事物之间地相关关系,而系,而需要在剔除其他相关因素影响的条件下计算相关系数。需要在剔除其他相关因素影响的条件下计算相关系数。偏相关分析偏相关分析正是用来解决这个问题的。正是用来解决这个问题的。 定义:偏相关分析是指当两个变量同时与第三定义:偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分析个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间相关程度
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025东江环保校园招聘笔试历年参考题库附带答案详解
- 阀控密封式铅酸蓄电池失水故障原因分析及预防措施
- 江苏连云港市赣榆区2025-2026学年第二学期期中学业水平质量监测高二数学(含答案)
- 安徽蚌埠市固镇县2025-2026学年第二学期期中调研七年级数学试题(含答案)
- 2025-2026学年天津市第九十中学八年级(下)统练数学试卷(一)(含答案)
- 2026年奶茶店吸管包装开发协议
- 2026五年级上新课标民族乐器认知
- 2025工程(建筑拆除)合同
- 新苏教版三年级数学下册第三单元第9课《乘数末尾有0的两位数乘法的练习课》教案
- 2026年教育卫生面试试题及答案
- 2026年广东省高三二模高考物理模拟试卷试题(含答案详解)
- 2026中国地方政府债务风险化解方案分析报告
- 2026内蒙古呼和浩特市北兴产业投资发展有限责任公司及所属子公司招聘27人笔试参考题库及答案解析
- 交通运输局审核审批制度
- (2026)医务人员手卫生规范课件
- 2026年成人高考药学(本科)真题单套试卷
- 2026广东潮州城市建设投资集团有限公司及下属公司招聘15人考试备考题库及答案解析
- 颅脑损伤恢复期的护理查房
- 孟山都新员工入职培训
- 【25新版】七年级下册《道德与法治》28天早背晚默
- 2025年贵州银行春招笔试真题及答案
评论
0/150
提交评论