版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第6章 相关分析1相关分析的基本概念相关分析的基本概念6.1二元定距变量的相关分析二元定距变量的相关分析6.2二元定序变量的相关分析二元定序变量的相关分析6.3偏相关分析偏相关分析6.4距离相关分析距离相关分析6.52 描述变量之间描述变量之间线性相关程度线性相关程度的强弱,并用的强弱,并用适当的统计指标表示出来的过程为相关分析。适当的统计指标表示出来的过程为相关分析。可根据研究的可根据研究的目的不同目的不同,或变量的,或变量的类型不同类型不同,采用不同的相关分析方法。本章介绍常用的相采用不同的相关分析方法。本章介绍常用的相关分析方法:关分析方法:二元定距二元定距变量的相关分析、变量的相关分析
2、、二元二元定序定序变量的相关分析、变量的相关分析、偏相关偏相关分析和分析和距离相关距离相关分析。分析。 3 任何事物的变化都与其他事物是相互联系任何事物的变化都与其他事物是相互联系和相互影响的,用于描述事物数量特征的变量和相互影响的,用于描述事物数量特征的变量之间自然也存在一定的关系。变量之间的关系之间自然也存在一定的关系。变量之间的关系归纳起来可以分为两种类型,即归纳起来可以分为两种类型,即函数关系和统函数关系和统计关系计关系。 4 当一个变量当一个变量x x取一定值时,另一变量取一定值时,另一变量y y可可以按照确定的函数公式取一个确定的值,记为以按照确定的函数公式取一个确定的值,记为y
3、y = = f(x)f(x),则称,则称y y是是x x的函数,也就时说的函数,也就时说y y与与x x两变量之间存在函数关系。又如,某种商品在两变量之间存在函数关系。又如,某种商品在其价格不变的情况下,销售额和销售量之间的其价格不变的情况下,销售额和销售量之间的关系就是一种函数关系:销售额关系就是一种函数关系:销售额= =价格价格销售销售量。量。 5 函数关系是一一对应的确定性关系,比较函数关系是一一对应的确定性关系,比较容易分析和测度,可是在现实中,变量之间的容易分析和测度,可是在现实中,变量之间的关系往往并不那么简单。关系往往并不那么简单。 6 衡量事物之间,或者变量之间线性相关程度的强
4、弱,并用适当的统计指标表示出来,这个过程就是相关分析。相关分析的方法较多,比较直接和常用的一种是绘制散点图。图形虽然能够直观展现变量之间的相关关系,但不很精确。7为了能够更加准确地描述变量之间的线性相关程度,可以通过计算相关系数来进行相关分析。相关系数是衡量变量之间相关程度的一个量值。如果相关系数是根据总体全部数据计算的,称为总体相关系数,记为;如果是根据样本数据计算而来的,则称为样本相关系数,记为r。在统计学中,一般用样本相关系数r来推断总体相关系数。8 相关系数的取值范围在相关系数的取值范围在1 1和和+1+1之间,即之间,即1r+11r+1。其中:。其中: 若若0 0r1r1,表明变量之
5、间存在正相关,表明变量之间存在正相关关系,即两个变量的相随关系,即两个变量的相随变动方向相同变动方向相同; 若若1r1r0 0,表明变量之间存在负相,表明变量之间存在负相关关关系,即两个变量的相随关系,即两个变量的相随变动方向相反变动方向相反; 9v 当|r|=1时,其中一个变量的取值完全取决于另一个变量,二者即为函数关系; 若r=+1,表明变量之间完全正相关; 若r=-1,表明变量之间完全负相关;v 当r=0时,说明变量之间不存在线性相关关系,但这并不排除变量之间存在其它非线性关系的可能。10在说明变量之间线性相关程度时,根据经验可将相关程度分为以下几种情况:v当|r|0.8时,视为高度相关
6、;v当0.5|r|0.8时,视为中度相关;v当0.3|r|0.5时,视为低度相关;v当|r|0.3时,说明变量之间的相关程度极弱,可视为不相关。11在一般情况下,总体相关系数是未知的,我们往往是用样本相关系数r作为总体相关系数的估计值。但由于存在样本抽样的随机性,样本相关系数并不能直接反映总体的相关程度。12 为了判断为了判断r r对对的代表性大小,需要的代表性大小,需要对相对相关系数进行假设检验关系数进行假设检验。 (1 1)首先)首先假设总体相关性为零假设总体相关性为零,即,即H H0 0为为两总体无显著的线性相关关系。两总体无显著的线性相关关系。 (2 2)其次,计算相应的统计量,并得到
7、)其次,计算相应的统计量,并得到对应的对应的相伴概率值相伴概率值。如果。如果相伴概率值小于或等相伴概率值小于或等于指定的显著性水平,则拒绝于指定的显著性水平,则拒绝H H0 0,认为两总体,认为两总体存在显著的线性相关关系;如果存在显著的线性相关关系;如果相伴概率值大相伴概率值大于指定的显著性水平,则不能拒绝于指定的显著性水平,则不能拒绝H H0 0,认为两,认为两总体不存在显著的线性相关关系。总体不存在显著的线性相关关系。13 在实际中,因为研究在实际中,因为研究目的目的不同,不同,变量的类变量的类型型不同,采用的相关分析方法也不同。比较常不同,采用的相关分析方法也不同。比较常用的相关分析是
8、用的相关分析是二元定距变量二元定距变量的相关分析、的相关分析、二二元定序变量元定序变量的相关分析、的相关分析、偏相关偏相关分析和分析和距离分距离分析析。14 二元变量的相关分析是指通过计算变量间二元变量的相关分析是指通过计算变量间两两相关两两相关的相关系数,对的相关系数,对两个或两个以上变量两个或两个以上变量之间两两相关的程度之间两两相关的程度进行分析。根据所研究的进行分析。根据所研究的变量类型不同,又可以分为变量类型不同,又可以分为二元定距二元定距变量的相变量的相关分析和关分析和二元定序变量二元定序变量的相关分析。的相关分析。 15 在二元变量的相关分析过程中比较常用的在二元变量的相关分析过
9、程中比较常用的几个相关系数是:几个相关系数是:Pearson简单相关系数、简单相关系数、SpearmanSpearman和和Kendalls tua-bKendalls tua-b等级相关系数。等级相关系数。16 定义:二元定距变量的相关分析是指通过定义:二元定距变量的相关分析是指通过计算定距变量间两两相关的相关系数,对两个计算定距变量间两两相关的相关系数,对两个或两个以上定距变量之间两两相关的程度进行或两个以上定距变量之间两两相关的程度进行分析。分析。 定距变量又称为间隔(定距变量又称为间隔(intervalinterval)变量,)变量,它的取值之间可以比较大小,可以用加减法计它的取值之间
10、可以比较大小,可以用加减法计算出差异的大小算出差异的大小。例如,。例如,“年龄年龄”变量、变量、“收收入入”变量、变量、“成绩成绩”变量等都是典型的定距变变量等都是典型的定距变量。量。 6.2.1 统计学上的定义和计算公式统计学上的定义和计算公式17 Pearson Pearson简单相关系数用来衡量定距变量简单相关系数用来衡量定距变量间的线性关系。如衡量国民收入和居民储蓄存间的线性关系。如衡量国民收入和居民储蓄存款、身高和体重、高中成绩和高考成绩等变量款、身高和体重、高中成绩和高考成绩等变量间的线性相关关系。间的线性相关关系。 18计算公式如下。计算公式如下。PearsonPearson简单
11、相关系数计算公式为简单相关系数计算公式为19 对对PearsonPearson简单相关系数的简单相关系数的统计检验是计统计检验是计算算t t统计量统计量,公式为,公式为 t t统计量服从统计量服从n n2 2个自由度的个自由度的t t分布。分布。 206.2.2 SPSS中实现过程中实现过程 研究问题研究问题 某班级学生数学和化学的期末考试成绩如某班级学生数学和化学的期末考试成绩如表表6-16-1所示,现要研究该班学生的数学和化学所示,现要研究该班学生的数学和化学成绩之间是否具有相关性。成绩之间是否具有相关性。 21人人 名名数数 学学化化 学学hxh99.0090.00yaju88.0099
12、.00yu65.0070.00shizg89.0078.00hah94.0088.00smith90.0088.00watet79.0075.00jess95.0098.00wish95.0098.00laly80.0099.00john70.0089.00chen89.0098.00david85.0088.00caber50.0060.00marry87.0087.00joke87.0087.00jake86.0088.00herry76.0079.0022 实现步骤实现步骤2324256.2.3 结果和讨论结果和讨论266.2.4 绘制相关散点图绘制相关散点图 如果对变量之间的相关程度不
13、需要掌握得如果对变量之间的相关程度不需要掌握得那么精确,可以通过绘制变量的相关散点图来那么精确,可以通过绘制变量的相关散点图来直接判断。仍以上例来说明。直接判断。仍以上例来说明。27 实现步骤实现步骤282930 结果和讨论结果和讨论316.3.1 统计学上的定义和计算公式统计学上的定义和计算公式 定义:定义:定序变量定序变量又称为又称为有序(有序(ordinalordinal)变量变量、顺序变量顺序变量,它,它取值的大小能够表示观测取值的大小能够表示观测对象的某种顺序关系对象的某种顺序关系(等级、方位或大小等),(等级、方位或大小等),也是基于也是基于“质质”因素的变量。例如,因素的变量。例
14、如,“最高学最高学历历”变量的取值是:变量的取值是:1 1小学及以下、小学及以下、2 2初中、初中、3 3高中、中专、技校、高中、中专、技校、4 4大学专科、大学专科、5 5大学大学本科、本科、6 6研究生以上。由小到大的取值能够研究生以上。由小到大的取值能够代表学历由低到高。代表学历由低到高。32 Spearman Spearman和和Kendalls tua-bKendalls tua-b等级相关系等级相关系数用以衡量定序变量间的线性相关关系,它们数用以衡量定序变量间的线性相关关系,它们利用的是非参数检验的方法。利用的是非参数检验的方法。计算公式如下。计算公式如下。 SpearmanSpe
15、arman等级相关系数为等级相关系数为3334 对对SpearmanSpearman等级相关系数的统计检验,等级相关系数的统计检验,一般如果个案数一般如果个案数n30n30,将直接利用,将直接利用SpearmanSpearman等级相关统计量表,等级相关统计量表,SPSSSPSS将自动根据该表给出将自动根据该表给出对应的相伴概率值。对应的相伴概率值。353637 对对Kendalls tua-bKendalls tua-b等级相关系数的统计等级相关系数的统计检验,一般如果个案数检验,一般如果个案数n30n30,将直接利用,将直接利用Kendalls tua-bKendalls tua-b等级相
16、关统计量表,等级相关统计量表,SPSSSPSS将将自动根据该表给出对应的相伴概率值。自动根据该表给出对应的相伴概率值。 38396.3.2 SPSS中实现过程中实现过程 研究问题研究问题 某语文老师先后两次对其班级学生同一篇某语文老师先后两次对其班级学生同一篇作文加以评分,两次成绩分别记为变量作文加以评分,两次成绩分别记为变量“作文作文1 1”和和“作文作文2 2”,数据如表,数据如表6-26-2所示。问两次评所示。问两次评分的等级相关有多大,是否达到显著水平?分的等级相关有多大,是否达到显著水平? 40人人 名名作作 文文 1作作 文文 2hxh86.0083.00yaju78.0082.0
17、0yu62.0070.00shizg75.0073.00hah89.0092.00smith67.0065.00watet96.0093.00jess80.0085.00wish77.0075.00laly59.0065.00john79.0075.00chen68.0070.00david85.0080.00caber87.0075.00marry75.0080.00joke73.0078.00jake95.0090.00herry88.0090.0041 实现步骤实现步骤426.3.3 结果和讨论结果和讨论43 二元变量的相关分析在一些情况下无法较二元变量的相关分析在一些情况下无法较为真实
18、准确地反映事物之间的相关关系。例如,为真实准确地反映事物之间的相关关系。例如,在研究某农场春季早稻产量与平均降雨量、平在研究某农场春季早稻产量与平均降雨量、平均温度之间的关系时,产量和平均降雨量之间均温度之间的关系时,产量和平均降雨量之间的关系中实际还包含了平均温度对产量的影响。的关系中实际还包含了平均温度对产量的影响。同时平均降雨量对平均温度也会产生影响。在同时平均降雨量对平均温度也会产生影响。在这种情况下,单纯计算简单相关系数,显然不这种情况下,单纯计算简单相关系数,显然不能准确地反映事物之间地相关关系,而需要能准确地反映事物之间地相关关系,而需要在在剔除其他相关因素影响的条件下计算相关系
19、数剔除其他相关因素影响的条件下计算相关系数。偏相关分析正是用来解决这个问题的。偏相关分析正是用来解决这个问题的。 44 定义:偏相关分析是指当定义:偏相关分析是指当两个变量同时与第两个变量同时与第三个变量相关三个变量相关时,时,将第三个变量的影响剔除将第三个变量的影响剔除,只,只分析另外两个变量之间相关程度的过程。分析另外两个变量之间相关程度的过程。 偏相关分析的工具是偏相关分析的工具是计算偏相关系数计算偏相关系数r r1212,3 3。 6.4.1 统计学上的定义和计算公式统计学上的定义和计算公式4546476.4.2 SPSS中实现过程中实现过程 研究问题研究问题 某农场通过试验取得某农作
20、物产量与春季某农场通过试验取得某农作物产量与春季降雨量和平均温度的数据,如表降雨量和平均温度的数据,如表6-36-3所示。现所示。现求降雨量对产量的偏相关。求降雨量对产量的偏相关。48产产 量量降降 雨雨 量量温温 度度150.0025.006.00230.0033.008.00300.0045.0010.00450.00105.0013.00480.00111.0014.00500.00115.0016.00550.00120.0017.00580.00120.0018.00600.00125.0018.00600.00130.0020.0049 实现步骤实现步骤50 51 526.4.3
21、结果和讨论结果和讨论536.5.1 统计学上的定义和计算公式统计学上的定义和计算公式 距离相关分析是距离相关分析是对观测量之间或变量之间对观测量之间或变量之间相似或不相似的程度的一种测量相似或不相似的程度的一种测量。距离相关分。距离相关分析析可用于同一变量内部各个取值间可用于同一变量内部各个取值间,以考察其,以考察其相互接近程度相互接近程度;也;也可用于变量间可用于变量间,以,以考察预测考察预测值对实际值的拟合优度值对实际值的拟合优度。54 距离相关分析的结果可以用于其他分析过距离相关分析的结果可以用于其他分析过程。例如,因子分析、聚类分析等,有助于分程。例如,因子分析、聚类分析等,有助于分析
22、复杂的数据集合。析复杂的数据集合。55 距离相关分析根据统计量不同,分为以下距离相关分析根据统计量不同,分为以下两种。两种。 不相似性测量不相似性测量:通过:通过计算样本之间或计算样本之间或变量之间的距离变量之间的距离来表示。来表示。 相似性测量相似性测量:通过:通过计算计算PearsonPearson相关系相关系数或数或CosineCosine相关相关来表示。来表示。56 距离相关分析根据分析对象不同,分为以距离相关分析根据分析对象不同,分为以下两种。下两种。 样本间分析样本间分析:样本和样本之间的距离:样本和样本之间的距离相关分析。相关分析。 变量间分析变量间分析:变量和变量之间的距离:变
23、量和变量之间的距离相关分析。相关分析。57 在不相似性测量的距离分析中,根据不同在不相似性测量的距离分析中,根据不同类型的变量,采用不同的统计量进行计算。类型的变量,采用不同的统计量进行计算。 (1 1)对)对连续变量的样本连续变量的样本 (x,y) (x,y) 进行距进行距离相关分析时,常用的统计量有以下几种。离相关分析时,常用的统计量有以下几种。 5859606162636465666.5.2 SPSS中实现过程中实现过程 距离相关分析距离相关分析分为相似性测量和不相似性分为相似性测量和不相似性测量,测量,也可分为样本间分析和变量间分析也可分为样本间分析和变量间分析。下。下面分别对这面分别
24、对这4 4种情况进行讲解。种情况进行讲解。67 研究问题研究问题1 1变量之间的相似性测量分析变量之间的相似性测量分析 对对6 6个标准电子元件的电阻(欧姆)进行个标准电子元件的电阻(欧姆)进行3 3次平行测试,测得结果如表次平行测试,测得结果如表6-46-4所示。问测试所示。问测试结果是否一致。结果是否一致。123456第一次第一次0.1400.1380.1430.1410.1440.137第二次第二次0.1350.1400.1420.1360.1380.140第三次第三次0.1410.1420.1370.1400.1420.14368 实现步骤实现步骤697071 7273 研究问题研究问
25、题3 3个案之间的相似性测量分析个案之间的相似性测量分析 某动物一次产下某动物一次产下3 3个幼仔,分别对个幼仔,分别对3 3个幼个幼仔的长、体重、四肢总长、头重进行测量,试仔的长、体重、四肢总长、头重进行测量,试就这几个测量而言,分析就这几个测量而言,分析3 3个幼仔的相似性,个幼仔的相似性,数据如表数据如表6-56-5所示。所示。 74长长体体 重重四四 肢肢 总总 长长头头 重重第一个第一个5021510011第二个第二个5122011012第三个第三个522201121275 实现步骤实现步骤7677 研究问题研究问题4 4个案之间的不相似性测个案之间的不相似性测量分析量分析 以问题以问题3 3中的数据为例,求幼仔的不相似程中的数据为例,求幼仔的不相似程度(距离)。度(距离)。 78 实现步骤实现步骤79806.5.3 结果和讨论结果和讨论 (1 1)研究问题)研究问题1 1的的SPSSSPSS运行结果如下面运行结果如下面两个表格所示。两个表格所示。81 (2 2)研究问题)研究问题2 2的的SPSSSPSS运行结果如下面运行结果如下面两个表格所示。两个表格所示。82 (3 3)研究问题)研究问题3 3的的SPSSSPSS运行结果如下面运行结果如下面两个表格所示。两个表格所示。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026秋季国家管网集团西部管道公司高校毕业生招聘笔试参考题库(浓缩500题)及答案详解【全优】
- 2026年大庆市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)及参考答案详解1套
- 2026秋季国家管网集团东北公司高校毕业生招聘考试备考试题(浓缩500题)含答案详解(夺分金卷)
- 2026秋季国家管网集团山东分公司高校毕业生招聘考试参考题库(浓缩500题)含答案详解(研优卷)
- 2025国网四川省高校毕业生提前批招聘(约450人)笔试模拟试题浓缩500题及一套参考答案详解
- 2025国网广东省高校毕业生提前批招聘(约450人)笔试模拟试题浓缩500题完整参考答案详解
- 2025国网浙江省高校毕业生提前批招聘(约450人)笔试模拟试题浓缩500题附答案详解(达标题)
- 2026秋季国家管网集团云南公司高校毕业生招聘考试备考试题(浓缩500题)附答案详解(巩固)
- 2026秋季国家管网集团东部原油储运公司高校毕业生招聘考试备考试题(浓缩500题)含答案详解(a卷)
- 2026秋季国家管网集团东部原油储运公司高校毕业生招聘考试参考试题(浓缩500题)含答案详解(研优卷)
- 化工原理干燥课件
- 药监系统官方培训 王知坚 益生菌相关药物的质量分析与控制 浙江省食品药品检验研究院
- 绝缘电阻和接地电阻的测量实验
- 《食品经营许可证》申请报告书空白模板
- Unit2Extendedreading知识点课件-高中英语牛津译林版(2020)选择性必修第一册
- 生产过程质量改善计划
- 绿萝养殖幻灯片
- 股票基础学习实战篇
- 国际金融课件(完整版)
- 暨南大学引进人才聘任合同
- 统编版高中语文必修上册第二单元4《喜看稻菽千重浪》《心有一团火温暖众人心》《探界者钟杨》同步练习【含答案】
评论
0/150
提交评论