版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 目 录 q 第二节第二节 直线回归直线回归 q 第三节第三节 直线相关与回归应注意直线相关与回归应注意 的问题的问题 q 第一节第一节 直线相关直线相关 w掌握掌握直线相关与回归的概念、意义及应用条件;直线相关与回归的概念、意义及应用条件; w掌握掌握相关系数及直线回归方程;相关系数及直线回归方程; 教学要求教学要求 第一节第一节 直线相关直线相关 w 当两事物或现象在数量上的协同变化呈直线当两事物或现象在数量上的协同变化呈直线 趋势时则称为趋势时则称为(linear correlationlinear correlation), , 又称简单相关(又称简单相关(simple correla
2、tionsimple correlation),用于分),用于分 析双变量正态分布资料。析双变量正态分布资料。 w 表示两变量相关关系的重要指标就是相关系数。表示两变量相关关系的重要指标就是相关系数。 一、相关系数的意义一、相关系数的意义 (correlation coefficient) (correlation coefficient) 用符号用符号r r 表示。它描述两变量间相关关系的密切程度和相关表示。它描述两变量间相关关系的密切程度和相关 方向。方向。 w 其数值其数值11r r1 1,当,当r r为正值时,表示一变量随另一变为正值时,表示一变量随另一变 量的增加而增加称为量的增加而
3、增加称为; w 当当r r为负值时,表示一变量随另一变量的增加而减少,为负值时,表示一变量随另一变量的增加而减少, 称为称为。 w 当当r r愈接近愈接近1 1,表示两变量的相关愈密切;当,表示两变量的相关愈密切;当r r 愈接近愈接近0 0时,表示两变量相关程度愈低;当时,表示两变量相关程度愈低;当r r0 0时,称时,称 为为,表示两变量无直线相关关系。,表示两变量无直线相关关系。 w 一般认为,当样本含量较大的情况下一般认为,当样本含量较大的情况下 (n n100100),大致可按下列标准估计两变量相关的),大致可按下列标准估计两变量相关的 程度程度 r r0.7 0.7 高度相关高度相
4、关 0.70.7r r0.4 0.4 中度相关中度相关 0.40.4r r0.2 0.2 低度相关低度相关 图 相关系数示意图 w二、相关系数的计算二、相关系数的计算 w 相关系数相关系数r r的计算公式:的计算公式: YYXX XY ll l YYXX YYXX r 22 )()( )(( 式中式中l lXX XX与 与l lYY YY分别为变量 分别为变量X X与与Y Y的离均差平方和,的离均差平方和,l lXY XY为两 为两 变量变量X X 、Y Y的离均差积和。的离均差积和。 w计算公式为:计算公式为: n X Xl XX 2 2 )( n Y YlYY 2 2 )( n YX XY
5、l XY )( w 例例 某研究者测量某研究者测量1010名名2020岁男青年身高与前岁男青年身高与前 臂长。问身高与前臂长有无直线相关关系?臂长。问身高与前臂长有无直线相关关系? w计算步骤:计算步骤: w(1 1)由原始数据绘制散点图,本资料呈直线相关)由原始数据绘制散点图,本资料呈直线相关 趋势。趋势。 表 身高与前臂长数据与计算表 身高(cm) X 前臂长(cm) Y X2 Y2 XY (1) (2) (3) (4) (5) 170 45 28900 2025 7650 173 42 29929 1764 7266 160 44 25600 1936 7040 155 41 24025
6、 1681 6355 173 47 29929 2209 8131 188 50 35344 2500 9400 178 47 31684 2209 8366 183 46 33489 2116 8418 180 49 32400 2401 8820 165 43 27225 1849 7095 1725 X 454 Y 298525 X2 20690 Y2 78541 XY w(2 2)根据表)根据表7-17-1原始数据计算出原始数据计算出X X,Y Y,X X2 2, Y Y2 2,XYXY 。 w 本例本例X X17251725,Y Y454454, wX X2 229852529852
7、5,Y Y2 22069020690,XYXY7854178541。 w(3 3)计算)计算X X、Y Y的离均差平方和与离均差积和的离均差平方和与离均差积和 5 .962 10 1725 298525 )( 22 2 n X XlXX 4 .78 10 454 20690 )( 22 2 n Y YlYY w(4 4)求相关系数)求相关系数r r 226 10 4541725 78541 )( n YX XYl XY 8227. 0 4 .785 .962 226 YYXX XY ll l r w相关系数的检验:检验相关系数相关系数的检验:检验相关系数r r是否来自总是否来自总 体相关系数体
8、相关系数为为0 0的总体。的总体。 T T检验法检验法 例例 w例例 对上述资料所得对上述资料所得r r值,检验值,检验2020岁男青年岁男青年 身高与前臂长是否有直线相关关系。身高与前臂长是否有直线相关关系。 w(1 1)建立检验假设)建立检验假设 H Ho o:0 ,0 ,两变量间无直线相关关系两变量间无直线相关关系 H H1 1:0 ,0 ,两变量间有直线相关关系两变量间有直线相关关系 w0.050.05 w(2 2)计算)计算t t值值 本例本例n n=10=10, r r=0.8227 =0.8227 , 按公式按公式 计算计算t t值值 09. 4 210 8227. 01 822
9、7. 0 2 1 22 n r r t w(3 3)确定)确定P P值值,作出推断结论,作出推断结论 按按n n-2=8-2=8 查查t t界值表,得界值表,得 P P0.050.05,按,按 0.050.05水准,拒绝水准,拒绝 H Ho o,接受,接受H H1 1,故可认为,故可认为2020岁男青年身高与前臂长岁男青年身高与前臂长 呈正直线相关关系。呈正直线相关关系。 w2.2.查表法查表法 查附表查附表14, 14, r r界值表列出了相关系界值表列出了相关系 数数r r与与0 0差别显著性的判断界值,按自由度差别显著性的判断界值,按自由度 n-2n-2查查r r界值表,当界值表,当r
10、rrr,n-2 ,n-2时,则 时,则P P ; 反之,反之,r r r r,n-2 ,n-2 时,则 时,则P P。本例。本例r r 0.82270.8227,大于,大于r r0.05(8) 0.05(8) 0.632 0.632 ,故,故P P0.050.05。r r 值有意义。检验结果与值有意义。检验结果与t t检验相同。检验相同。 第二节第二节 直线回归直线回归 w一、直线回归的概念一、直线回归的概念 w 1.1.:反映两变量:反映两变量数量依存数量依存的关系,即指由的关系,即指由 一个变量推算另一个变量的数量关系。直线回归是一个变量推算另一个变量的数量关系。直线回归是 回归分析中最基
11、本最简单的一种,故又称回归分析中最基本最简单的一种,故又称 (simple regressionsimple regression)。)。 w 2.2.反映回归关系的方程称为直线回归方程。反映回归关系的方程称为直线回归方程。 bXaY 式中式中 为应变量为应变量Y Y的估计值,的估计值,a a 为回归直线为回归直线Y Y轴上的截轴上的截 距,距,b b 为回归系数即回归方程的斜率。为回归系数即回归方程的斜率。 Y 二、直线回归方程的求法二、直线回归方程的求法 w 最小二乘法(又称最小平方法)是一种 数学优化技术。它通过最小化误差的平方和 寻找数据的最佳函数匹配。利用最小二乘法 可以简便地求得未
12、知的数据,并使得这些求 得的数据与实际数据之间误差的平方和为最 小。 w 求直线回归方程,关键在于计算求直线回归方程,关键在于计算a a、b b两个系数,两个系数, 根据数学上的根据数学上的最小二乘法原理最小二乘法原理即保证即保证各实测点至回各实测点至回 归直线的纵向距离的平方和最小归直线的纵向距离的平方和最小。 n X X XX XY l l XX YYXX b 2 )( )( XbYa n Y Y w例例 利用前例资料已知利用前例资料已知2020岁男青年身高与前岁男青年身高与前 臂长之间存在直线相关关系,现求身高与臂长之间存在直线相关关系,现求身高与 前臂长的直线回归方程。前臂长的直线回归
13、方程。 w计算步骤计算步骤: w(1 1)列回归系数计算表同表)列回归系数计算表同表9-19-1,求出,求出X X , Y Y ,XY XY , X X2 2 , YY2 2 。 w(2 2)本例)本例XX=1725 =1725 ,YY=454 =454 ,XYXY=78541 =78541 , XX2 2=298525 =298525 ,YY2 2=20690 =20690 。前面已经计算出。前面已经计算出 l lxx xx=962.5 =962.5 ,l lxy xy=226 =226 5 . 172 10 1725 n X X4 .45 10 454 n Y Y w(3 3)求回归系数)
14、求回归系数b b和截距和截距a a 2348. 0 5 .962 226 XX XY l l b 897. 45 .1722348. 04 .45XbYa XY2348. 0897. 4 (4 4)列出回归方)列出回归方 程程 将求出的将求出的 a a 和和 b b 代入公式得代入公式得 回归系数的假设检验回归系数的假设检验 wTb 检验 w三、回归直线的绘制三、回归直线的绘制 w 在自变量在自变量X X的的实测值范围实测值范围,任意指定相距较远且易读,任意指定相距较远且易读 的两个数值,代入直线回归方程,求出相应的的两个数值,代入直线回归方程,求出相应的Y Y的估计值,的估计值, 确定两点,
15、用直线连接。确定两点,用直线连接。 w 如本例取如本例取X X1 1=155=155,则,则 ;X X2 2=185=185,则。在图上确定,则。在图上确定 (155155,41.29141.291)和()和(185185,48.33548.335)两个点,直线连接,)两个点,直线连接, 即得出直线回归方程的图形。即得出直线回归方程的图形。 图图 2020岁男青年身高与前臂长散点图岁男青年身高与前臂长散点图 w 1. 1.作相关回归分析作相关回归分析要有实际意义要有实际意义。不要把毫无。不要把毫无 联系的两种现象作相关回归分析。联系的两种现象作相关回归分析。 w 2.2.相关关系相关关系不一定
16、是因果关系不一定是因果关系,也可能是伴随,也可能是伴随 关系。关系。 w 3.3.在进行直线相关与回归分析之前,在进行直线相关与回归分析之前,应先绘制应先绘制 散点图散点图,当观察到点的分布呈直线趋势时,方可进,当观察到点的分布呈直线趋势时,方可进 行分析,如散点图呈曲线趋势,应进行曲线回归分行分析,如散点图呈曲线趋势,应进行曲线回归分 析。析。 第三节第三节 进行直线相关与回归分析时进行直线相关与回归分析时 应注意的问题应注意的问题 w4.4.直线相关与回归的区别直线相关与回归的区别 w 在资料需求上在资料需求上,相关分析相关分析要求两变量要求两变量X X与与Y Y均为服从正均为服从正 态分
17、布的随机变量,即两者都不能预先指定;态分布的随机变量,即两者都不能预先指定;回归分析要回归分析要 求求Y Y是正态随机变量是正态随机变量,而,而X X可以不是正态随机变量而是一确可以不是正态随机变量而是一确 定值,此时回归分析称为定值,此时回归分析称为型回归型回归,X X也可以是正态随机也可以是正态随机 变量,此时回归分析称为变量,此时回归分析称为型回归型回归。 w在意义上在意义上,相关反映两变量的,相关反映两变量的相关关系相关关系;回归反映两变;回归反映两变 量间的量间的依存关系依存关系。 w在应用上在应用上,说明两变量间的相关程度及相关方向用相关;,说明两变量间的相关程度及相关方向用相关; 说明两变量间的依存变化的数量关系用回归。说明两变量间的依存变化的数量关系用回归。 w5. 5. 相关与回归的联系相关与回归的联系 w 在同一组数据,相关系数在同一组数据,相
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 合作项目回顾与未来规划函6篇范文
- 市场营销数据分析可视化操作手册
- 酒店客房管理与服务质量提升指南手册
- 烹饪美食的食谱制作手册
- 项目进度延误应对方案预案
- 可再生能源与清洁技术推广指南
- 文明礼貌做合格学生小学主题班会课件
- 跨境电商平台产品上架审核标准与操作手册
- 企业经营管理实战案例分析指南
- 关于2026年度部门营销策略优化的公告(6篇)
- 机械设备的润滑课件
- 国开电大本科《理工英语4》机考总题库
- 二升三暑期奥数培优(学生教材)
- 门式启闭机主梁下主梁1工艺设计卡
- 管理者如何带好团队
- 人教版四年级下册数学期末测试卷(模拟题)
- 人教版数学必修一课后习题答案
- YS/T 1018-2015铼粒
- GB/T 27941-2011多联式空调(热泵)机组应用设计与安装要求
- 2023年天津市高考语文模拟试卷试题原创(含答案详解)
- 工程总承包EPC项目组织机构及其运作是
评论
0/150
提交评论