版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章相关分析【学习目标】
理解相关分析的基本原理掌握相关分析的步骤了解偏相关分析4.1基本原理
相关分析(CorrelationAnalysis)是研究两个或两个以上处于同等地位的随机变量间的相关关系的统计分析方法。例如,人的身高和体重;空气的相对湿度与降雨量。相关分析与回归分析之间的区别:回归分析侧重于研究随机变量间的依赖关系,以便用一个变量去预测另一个变量;相关分析侧重于发现随机变量间的种种相关特性。相关分析在工农业、水文、气象、社会经济和生物学等方面都有广泛的应用。4.2相关关系
相关关系是客观现象存在的一种非确定的相互依存关系,即自变量的每一个取值,因变量由于受随机因素影响,与其所对应的数值是非确定性的。相关分析中的自变量和因变量没有严格的区别,可以互换。当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系(一)相关关系分类
1.按程度分类⑴完全相关:两个变量之间的关系,一个变量的数量变化由另一个变量的数量变化所惟一确定,即函数关系。⑵不完全相关:两个变量之间的关系介于不相关和完全相关之间。⑶不相关:如果两个变量彼此的数量变化互相独立,没有关系。(一)相关关系分类2.按方向分类⑴正相关:两个变量的变化趋势相同,从散点图可以看出各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大。⑵负相关:两个变量的变化趋势相反,从散点图可以看出各点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小。(一)相关关系分类3.按形式分类⑴线性相关(直线相关):当相关关系的一个变量变动时,另一个变量也相应地发生均等的变动。⑵非线性相关(曲线相关):当相关关系的一个变量变动时,另一个变量也相应地发生不均等的变动。(一)相关关系分类4.按变量数目分类⑴单相关:只反映一个自变量和一个因变量的相关关系。⑵复相关:反映两个及两个以上的自变量同一个因变量的相关关系。⑶偏相关:当研究因变量与两个或多个自变量相关时,如果把其余的自变量看成不变(即当作常量),只研究因变量与其中一个自变量之间的相关关系,就称为偏相关。(二)相关关系的判定
相关关系的判定包含三个方面内容:确定相关关系的存在;相关关系呈现的形态和方向;相关关系的密切程度。其主要方法是绘制相关图表和计算相关系数。1.相关表
编制相关表前首先要通过实际调查取得一系列成对的标志值资料作为相关分析的原始数据。相关表的分类:简单相关表和分组相关表。单变量分组相关表:自变量分组并计算次数,而对应的因变量不分组,只计算其平均值;该表特点:使冗长的资料简化,能够更清晰地反映出两变量之间相关关系。如表4-1所示是单变量分组表的范例。厂家12345678910投入产出2030406020403060103010402040205020303070双变量分组相关表:自变量和因变量都进行分组而制成的相关表,这种表形似棋盘,故又称棋盘式相关表。
工资收入
文化水平大专以上
中学
小学及以下高中低261861420234555140合计452751802.相关图利用直角坐标系第一象限,把自变量置于横轴上,因变量置于纵轴上,而将两变量相对应的变量值用坐标点形式描绘出来,用以表明相关点分布状况的图形。相关图被形象地称为相关散点图。因素标志分了组,结果标志表现为组平均数,所绘制的相关图就是一条折线,这种折线又叫相关曲线。四种类型相关图3.相关系数
4.3相关系数Pearson简单相关系数Pearson简单相关系数用来度量两定距型变量间的线性相关性,是英国统计学家皮尔逊(Pearson)提出的一种计算相关系数的方法,故也称皮尔逊相关。这是一种求直线相关的基本方法。可用于测度如收入和储蓄、身高和体重、工龄和收入等变量间的线性相关关系。检验学生人数与周边饭店季营业额之间的相关系数是否显著构造检验统计量t分布确定:显著性水平
和自由度。由于:t=10.4>1.86.说明学生人数与周边饭店季营业额之间存在着显著的正线性相关关系计算Pearson相关系数要求变量符合以下条件:
(1)两列变量都是等距的或等比的测量数据;(2)两列变量所来自的总体必须是正态的或近似正态的对称单峰分布;(3)两列变量必须具备一一对应关系。二等级相关等级相关也是一种相关分析方法。当测量得到的数据不是等距或等比数据,而是具有等级顺序的测量数据。但其来自的总体分布不是正态的,出现上述两种情况中的任何一种,都不能计算积差相关系数。这时要求两列变量或多列变量的相关,就要用等级相关的方法。1.斯皮尔曼(Spearman)等级相关斯皮尔曼等级相关系数用表示,它适用于两列具有等级顺序的测量数据,或总体为非正态的等距、等比数据。例子:某公司想要知道是否职工期望成为好的销售员而实际上就能有好的销售记录。为了调查这个问题,公司的副总裁仔细地查看和评价了公司10个职工的初始面试摘要、学科成绩、推荐信等材料,最后副总裁根据他们成功的潜能给出了单独的等级评分。二年后获得了实际的销售记录,得到了第二份等级评分检验统计量相关分析步骤(一)计算样本相关系数r。利用样本数据计算样本相关系数。样本相关系数反映了两变量间线性相关程度的强弱,对不同类型的变量应采用不同的相关系数指标,但它们的取值范围和含义是相同的。相关系数取值范围r=0|r|<0.3|r|=0.3~0.5|r|=0.5~0.8|r|>0.8|r|=1相关程度无相关微弱相关低度相关显著相关高度相关完全相关对样本来自的两总体是否存在显著线性关系进行推断。具体步骤:
1.提出零假设,即两总体无线性相关性。2.选择检验统计量t。对不同类型的变量应采用不同的相关系数,对应也应采用不同检验统计量。t值根据r值计算得出。3.计算检验统计量的观测值(自由度,显著性水平)和对应的概率p值。4.进行决策。如果检验统计量的概率p值小于给定的显著性水平α,应拒绝零假设,认为两总体间存在显著的线性相关性;反之,如果检验统计量的概率p值大于给定的显著性水平α,则不能拒绝零假设,可以认为两总体不存在显著的线性相关性。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高温焚烧处理工艺方案
- 2026年银行业专业人员职业资格考试模拟预测单套试卷(含解析)
- 2026年土木工程专业本科毕业设计考试模拟试卷(含重要知识点)
- 2025年土建质量员考试题库及参考答案
- 2025年注册岩土工程师之《岩土基础知识》练习题库带答案详解(模拟题)
- 滨州市2026教师资格证笔试-综合素质-教育知识与能力试卷(含答案)
- 2025年县乡教师选调考试《教育学》经典例题附答案详解(巩固)
- 三亚市2026事业单位联考-综合应用能力D类中小学教师模拟卷(含答案)
- 宜昌市2026成人高考专升本英语预测试题(含答案)
- 运城市2026事业单位联考-综合应用能力B类社会科学专技模拟卷(含答案)
- 2025年陕西省西安交大少年班自主招生数学试卷(初中组) (解析版)
- 工业厂房硬化地面施工方案
- ig经济考试题目及答案
- 穿越机组装教学课件
- 2025年动漫艺术概论试题及答案
- QC/T 326-2025汽车标准件产品编号规则
- 精索静脉曲张超声课件
- 2024年江阴职业技术学院单招职业技能测试题库完整答案
- 2024徐州小升初数学真题试卷
- 中科大知识产权管理办法
- 2025非遗融入现代生活互联网平台助力非遗传播与消费专题报告-以抖音为例
评论
0/150
提交评论