版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、直线相关的概念直线相关的概念 当所研究的两个事物或现象之当所研究的两个事物或现象之间,既存在着密切的数量关系,间,既存在着密切的数量关系,又不象函数关系那样,能以一个又不象函数关系那样,能以一个变量的数值精确地求出另一个变变量的数值精确地求出另一个变量的数值,我们称这类变量之间量的数值,我们称这类变量之间的关系为相关关系,简称相关。的关系为相关关系,简称相关。直线相关直线相关(linear correlation)(linear correlation)又称简单相关,用于双变量正态又称简单相关,用于双变量正态分布资料分布资料 相关关系并不一定是因果关系。相关关系并不一定是因果关系。相关分析的任
2、务就是对相关关相关分析的任务就是对相关关系给以定量的描述系给以定量的描述 相关系数的意义相关系数的意义 相关系数相关系数(correlation (correlation coefficient)coefficient)又称积差相关系数又称积差相关系数(coefficient of product-moment (coefficient of product-moment correlation)correlation),以符号,以符号r r表示。它是表示。它是说明具有直线关系的两个变量间,说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的相关关系的密切程度与相关方向的指标指标 yy
3、xxxylllYYXXYYXXr22)()()(nYXXYlxy)(nXXlxx22)(nYYlyy22)(相关系数没有单位,其值为相关系数没有单位,其值为-1 -1 r r 1 1 r0r0:正相关,:正相关,r0r2.228t=3.582.228,P0.05P0.576r=0.74950.576,P0.05P0.05,按,按=0.05=0.05水准,拒绝水准,拒绝H H0 0,接受,接受H H1 1,故可以认为一年级女大学生体重故可以认为一年级女大学生体重与肺活量间呈正的直线相关与肺活量间呈正的直线相关进行相关分析时的注意事项进行相关分析时的注意事项1.1.线性相关表示两个变量之间线性相关
4、表示两个变量之间的关系是双向的,当散点图出的关系是双向的,当散点图出现直线趋势时,再作分析现直线趋势时,再作分析2.2.相关系数的计算只适用于两相关系数的计算只适用于两个变量都服从正态分布的资料个变量都服从正态分布的资料3.3.样本相关系数是总体相关系数的样本相关系数是总体相关系数的一个估计值,与总体相关系数之一个估计值,与总体相关系数之间存在着抽样误差,必须作假设间存在着抽样误差,必须作假设检验检验4.4.相关分析是用相关系数来描述两相关分析是用相关系数来描述两个变量间相互关系的密切程度和个变量间相互关系的密切程度和方向,相关关系不一定是因果关方向,相关关系不一定是因果关系系直线回归的概念直
5、线回归的概念 在描述肺活量与体重的依存关系中,在描述肺活量与体重的依存关系中,习惯上将体重作为自变量习惯上将体重作为自变量(independent variable)(independent variable),用,用X X表表示,肺活量是应变量示,肺活量是应变量(dependent (dependent variable)variable)用用Y Y表示。表示。直线回归直线回归 由上图可见,肺活量由上图可见,肺活量Y Y 有随体重有随体重X X增加而增大的趋势,且散点呈直线增加而增大的趋势,且散点呈直线趋势,但并非趋势,但并非1212个点子恰好全都在个点子恰好全都在一直线上。这与两变量间严格
6、对应一直线上。这与两变量间严格对应的函数关系不同,称为直线回归的函数关系不同,称为直线回归(1(1inearinearregression)regression),又称简单,又称简单回归回归(simple regression)(simple regression)。为了。为了区别于一般函数方程,我们将它称区别于一般函数方程,我们将它称为直线回归方程。为直线回归方程。直线回归方程的求法直线回归方程的求法 直线回归方程的一般表达式为直线回归方程的一般表达式为 :bXaYa a 为 回 归 直 线 在为 回 归 直 线 在 Y Y 轴 上 的 截 距轴 上 的 截 距( (intercept)in
7、tercept)。a a0 0:直线与纵轴的交点在原点的:直线与纵轴的交点在原点的上方上方a aO O:交点在原点的下方:交点在原点的下方a a0 0:回归线通过原点:回归线通过原点 b b 为 回 归 系 数为 回 归 系 数 ( r e g r e s s i o n ( r e g r e s s i o n coefficient)coefficient),即直线的斜率,即直线的斜率( (slope)slope) b b0 0:表示直线从左下方走向右上:表示直线从左下方走向右上方,方, 即即Y Y随随X X增大而增大增大而增大 b bO O:表示直线从左上方走向右下:表示直线从左上方走
8、向右下方,即方,即y y随随X X增大而减少增大而减少b b0 0:表示直线与:表示直线与X X轴平行,即轴平行,即X X与与Y Y无直线关系无直线关系b b的统计学意义是的统计学意义是X X每增每增( (减减) )一一个单位,个单位,Y Y平均改变平均改变b b个单位个单位 根据数学上的最小二乘法根据数学上的最小二乘法(least (least square method)square method)原理(即保证各实原理(即保证各实测点至直线的纵向距离的平方和最测点至直线的纵向距离的平方和最小),可导出小),可导出a a、b b的算式如下:的算式如下:xxxyllXXYYXXb2)()(Xb
9、YanXXnYY就上例试求女大学生肺活量就上例试求女大学生肺活量Y Y对对体重体重X X的直线回归方程的直线回归方程 :058826. 06667.30604.18xxxyllb3333.4912592nXX9025. 21283.34nYY000419. 03333.49058826. 09025. 2XbYa回归方程:回归方程: XbXaY058826. 0000419. 0直线回归方程的图示直线回归方程的图示 在自变量在自变量X X的实测全距范围内任取的实测全距范围内任取相距较远且易读数的两相距较远且易读数的两X X值,代入值,代入上式。如上例取上式。如上例取X X=42=42,得,得Y
10、 Y=2.47=2.47;取;取X X5858,得,得Y Y=3.41=3.41。在图上确定在图上确定(42(42,2.47)2.47)和和(58(58,3.41)3.41)两个点,以直线连接,即得两个点,以直线连接,即得直线式直线式 Y=0.000419+0.058826XY=0.000419+0.058826X的的图形图形 注意:所绘直线必然通过点注意:所绘直线必然通过点( ( , ) ),若纵坐标、,若纵坐标、横坐标无折断号时,将此线左横坐标无折断号时,将此线左端延长与纵轴相交,交点的纵端延长与纵轴相交,交点的纵坐标必等于截距坐标必等于截距a a YX回归系数的假设检验回归系数的假设检验
11、 回归方程是否成立,即回归方程是否成立,即x x、y y是否有是否有直线关系,是回归分析要考虑的首直线关系,是回归分析要考虑的首要问题。即使要问题。即使x x、y y的总体回归系数的总体回归系数为零,由于抽样误差,其样本回为零,由于抽样误差,其样本回归系数归系数b b也不一定为零,因此需作也不一定为零,因此需作是否为零的假设检验,可用方差是否为零的假设检验,可用方差分析或分析或t t检验检验 (一)方差分析(一)方差分析1. Y1. Y的离均差平方和的离均差平方和l lYYYY的分析的分析式中式中S Sb b为样本回归系数的标准误,为样本回归系数的标准误,S Sy y.x.x为剩余标准差为剩余
12、标准差(standard (standard deviation of Y for fixed X)deviation of Y for fixed X),是当是当X X的影响被扣除后的影响被扣除后Y Y方面的变方面的变异指标异指标 (二)(二)t t检验检验xxXYblSbSbt.0 xxxyyyxylllXXYYXXYYYYnYYs222222.2直线直线回归方程的应用回归方程的应用 1. 1. 描述两变量间的依存关系描述两变量间的依存关系2. 2. 利 用 回 归 方 程 进 行 预 测利 用 回 归 方 程 进 行 预 测( (forecast)forecast)3. 3. 利用回归方
13、程进行统计控制利用回归方程进行统计控制( (statistical control) statistical control) 4. 4. 应用直线回归应注意的问题应用直线回归应注意的问题(1 1)作回归分析要有实际意义,)作回归分析要有实际意义,不能把毫无关联的两种现象不能把毫无关联的两种现象作回归分析,必须对两种现作回归分析,必须对两种现象间的内在联系有所认识象间的内在联系有所认识(2 2)在进行直线回归分析之前,)在进行直线回归分析之前,应绘制散点图,当观察点的分布应绘制散点图,当观察点的分布有直线趋势时,才适宜作直线回有直线趋势时,才适宜作直线回归分析,如散点图明显呈曲线趋归分析,如散
14、点图明显呈曲线趋势,使之直线化再行分析势,使之直线化再行分析 (3 3)直线回归方程的适用范围一般以)直线回归方程的适用范围一般以自变量的取值范围为限,在此范自变量的取值范围为限,在此范围内求出的估计值,一般称为内围内求出的估计值,一般称为内插。超过自变量取值范围所计算插。超过自变量取值范围所计算的值称为外延。若无充分理由证的值称为外延。若无充分理由证明超过自变量取值范围外还是直明超过自变量取值范围外还是直线,应该避免外延线,应该避免外延 直线回归与相关的区别和联系直线回归与相关的区别和联系 1. 1. 区别区别(1 1)在应用上,说明变量间的相)在应用上,说明变量间的相关关系用相关,可以表达
15、相关关系用相关,可以表达相关得密切程度和方向。关得密切程度和方向。 说明两变量间依存变化的数量说明两变量间依存变化的数量关系用回归关系用回归相关要求两个变量X、Y服从双变量正态分布。这种资料若进行回归分析称为型回归。可以计算两个回归方程。由X推Y的回归方程: XbaYxyxy.由Y推X的回归方程: YbaXyxyx.该两个方程中,回归系数各不相同,但是相关系数相同。且21bbr (2 2)两事物或现象间存在相关关)两事物或现象间存在相关关系,不一定是因果关系,可系,不一定是因果关系,可能只是伴随关系,而一旦两能只是伴随关系,而一旦两事物或现象间存在因果关系,事物或现象间存在因果关系,则必然相关。则必然相关。(3 3)在资料要求上若因变量)在资料要求上若因变量Y Y服服从正态分布(随机变量);从正态分布(随机变量);X X是可是可以精确测量和严格控制的变以精确测量和严格控制的变量量,(,(也称非随机变量),那么该也称非随机变量),那么该资料一般只能进行回归分析而不资料一般只能进行回归分析而不宜作相关分析。该类回归也被称宜作相关分析。该类回归也被称为为I I型回归。型回归。2. 2. 联系联系(1 1)对一组数据若同时计算)对一组数据若同时计算r r与与b b,它们的正负号是一致的。它们的正负号是一致的。r r为正为正号说明两变量间的相互关系是号说明两
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 如何有效防范校园安全事故
- 地下工程施工方法
- 任康磊小团队管理的7个方法
- 员工职业发展路径图
- 企业EHS体系推行要点
- 服装特性保养方法
- DB13-T 960-2008 河北省农业信息网络设施管理规范
- 医疗安全质量控制系统化建设
- 2025年2025年皮革工业絮凝剂合作协议
- 2025年福建省职业院校技能大赛航空服务赛项中职组考试题(附答案)
- 环境因素识别评价台账
- 短视频制作教学ppt课件(完整版)
- 《史记》上册注音版
- YY/T 0450.3-2016一次性使用无菌血管内导管辅件第3部分:球囊扩张导管用球囊充压装置
- LY/T 2710-2016木地板用紫外光固化涂料
- GB/T 25098-2010绝缘体带电清洗剂使用导则
- 《研究生学术英语读译教程》课件Unit 8 The Lessons of Economics
- 《工作场所安全使用化学品规定》
- 基因治疗课件最新版
- 消化系统生理a课件
- 短视频:策划+拍摄+制作+运营课件(完整版)
评论
0/150
提交评论