变量之间的相关关系(课堂PPT)_第1页
变量之间的相关关系(课堂PPT)_第2页
变量之间的相关关系(课堂PPT)_第3页
变量之间的相关关系(课堂PPT)_第4页
变量之间的相关关系(课堂PPT)_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、12.3 2.3 变量间的相关关系变量间的相关关系2.3.1 2.3.1 变量之间的相关关系变量之间的相关关系2.3.2 2.3.2 两个变量的线性相关两个变量的线性相关 第二课时第二课时2复习回顾复习回顾1 1、相关关系、相关关系自变量取值一定时,因变量的取值带有一定自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系随机性的两个变量之间的关系. .正相关的散点图中的点散布在从左下角到右正相关的散点图中的点散布在从左下角到右上角的区域,负相关的散点图中的点散布在上角的区域,负相关的散点图中的点散布在从左上角到右下角的区域从左上角到右下角的区域 2 2、正相关和负相关的两个相关变量

2、的、正相关和负相关的两个相关变量的散点图的特点散点图的特点33.3.观察人体的脂肪含量百分比和年龄的样本观察人体的脂肪含量百分比和年龄的样本数据的散点图,这两个相关变量成正相关数据的散点图,这两个相关变量成正相关. .我们需要进一步考虑的问题是,当人的年龄增我们需要进一步考虑的问题是,当人的年龄增加时,体内脂肪含量到底是以什么方式增加呢?加时,体内脂肪含量到底是以什么方式增加呢?对此,我们从理论上作些研究对此,我们从理论上作些研究. .45思考思考1 1:在各种各样的散点图中,有些散点图中的在各种各样的散点图中,有些散点图中的点是杂乱分布的,有些散点图中的点的分布有一点是杂乱分布的,有些散点图

3、中的点的分布有一定的规律性,年龄和人体脂肪含量的样本数据的定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?散点图中的点的分布有什么特点? 这些点大致分布在一条直线附近这些点大致分布在一条直线附近. .知识探究(一):回归直线知识探究(一):回归直线 6如果散点图中的点的分布,从整体上看大致在一如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有条直线附近,则称这两个变量之间具有线性相关线性相关关系关系,这条直线叫做,这条直线叫做回归直线回归直线. .该直线叫该直线叫回归方程回归方程。 注注: :如果关于两个变量统计数据的散点图呈如果关于两个变量统

4、计数据的散点图呈现发散状现发散状, ,则这两个变量之间不具有相关关系则这两个变量之间不具有相关关系. .720 2530354045 50 55 60 65年龄脂肪含量0510152025303540如图如图 :思考思考2:2:那么,我们该怎样来求出这个回归方程?那么,我们该怎样来求出这个回归方程?我们有这样几种方案?我们有这样几种方案?对一组具有线性相关关系的样本数据,如果能够求出它的回归方程,对一组具有线性相关关系的样本数据,如果能够求出它的回归方程,那么我们就可以比较具体、清楚地了解两个相关变量的内在联系,那么我们就可以比较具体、清楚地了解两个相关变量的内在联系,并根据回归方程对总体进行

5、估计并根据回归方程对总体进行估计. . 8202530 35 4045 50 55 60 65年龄脂肪含量05101520253035409202530 35 4045 50 55 60 65年龄脂肪含量0510152025303540我们把由一个变量的变化我们把由一个变量的变化去推测另一个变量的方法去推测另一个变量的方法称为称为回归方法。回归方法。10实际上,求回归方程的关键是如何用数学的实际上,求回归方程的关键是如何用数学的方法来刻画方法来刻画“从整体上看,各点与此直线的从整体上看,各点与此直线的距离最小。距离最小。整体上最接近整体上最接近 思考:思考:回归直线与散点图中各点的位置回归直线

6、与散点图中各点的位置应具有怎样的关系?应具有怎样的关系? (x1, y1)(x2,y2)(xi,yi)(xn,yn)11(x1, y1)(x2,y2)(xi,yi)(xn,yn)假设两个具有线性相关关系的变量的一组样本假设两个具有线性相关关系的变量的一组样本数据:数据:(x(x1 1,y y1 1) ),(x(x2 2,y y2 2) ),(x(xn n,y yn n) ),设,设其回归方程为其回归方程为ybxa我们可用点我们可用点 与这条直线上横标为与这条直线上横标为 的点之的点之间的距离来刻画点间的距离来刻画点 到直线距离的远近,即到直线距离的远近,即( ,)iix yix( ,)iix

7、y() (1,2,3, )iiybxain用这n个距离之和 来刻画各点到直线的”整体距离”1()niiiybxa1221()niiQyy2221122()()(a)nnybxaybxaybx(x1, y1)(x2,y2)(xi,yi)(xn,yn)由于绝对值使得计算不方便,实际应用中采用13根根据有关数学原理分析,当据有关数学原理分析,当 时,时,1122211()(),()nniiiiiinniiiixxyyx ynx ybxxxnxaybx总体偏差总体偏差 为最小,这样就得到了回归方为最小,这样就得到了回归方程,这种求回归方程的方法叫做最小二乘法程,这种求回归方程的方法叫做最小二乘法. .

8、回归方程回归方程21()niiiQyyybxa注:注:对具有线性相关关系的两个变量,其回归直线一定对具有线性相关关系的两个变量,其回归直线一定通过样本点的中心通过样本点的中心,yx(其中回归方程的斜率为 截距为 )ba141.1.回归方程被样本数据惟一确定,各样本点回归方程被样本数据惟一确定,各样本点大致分布在回归直线附近大致分布在回归直线附近. .对同一个总体,对同一个总体,不同的样本数据对应不同的回归直线,所以不同的样本数据对应不同的回归直线,所以回归直线也具有随机性回归直线也具有随机性. . 2 2. .对于任意一组样本数据,利用上述公式都对于任意一组样本数据,利用上述公式都可以求得可以

9、求得“回归方程回归方程”,如果这组数据不具,如果这组数据不具有线性相关关系,即不存在回归直线,那么有线性相关关系,即不存在回归直线,那么所得的所得的“回归方程回归方程”是没有实际意义的是没有实际意义的. .因此,因此,对一组样本数据,应先作散点图,在具有线对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程性相关关系的前提下再求回归方程. .15解:散点图如图所示由散点图可知:在平面直角坐标系中,各点散布在左下角到右上角的区域,这些点大致分布在一条直线附近,因此x、y具有线性相关关系141421148.0727.2619403.234181iiiiixyx yx 1411422

10、1140.578140.524iiiiix yx ybxxaybx 故可得:故可得:所求回归直线方程为0.5770.448xy16在上例中:若某人在上例中:若某人3737岁,则其体内脂肪含岁,则其体内脂肪含量的百分比约为多少?量的百分比约为多少?0.5770.448xy由此可以估计年龄为由此可以估计年龄为3737岁的人其体内脂肪含量的岁的人其体内脂肪含量的百分比约为百分比约为20.901%20.901%0.577 37 0.44820.90117求样本数据的线性回归方程步骤求样本数据的线性回归方程步骤第一步,作散点图,确定第一步,作散点图,确定x,yx,y具有线性相关关系;具有线性相关关系;

11、1122211()(),()nniiiiiinniiiixxyyx ynx ybaybxxxxnx第三步,计算第三步,计算 ybxa第四步,写出回归方程第四步,写出回归方程 第二步,求第二步,求 1niiix y21niixxy18例例1 1: 有一个同学家开了一个小卖部,他为了研有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个究气温对热饮销售的影响,经过统计,得到一个卖出的饮料杯数与当天气温的对比表:卖出的饮料杯数与当天气温的对比表: (1 1)画出散点图;)画出散点图;(2 2)从散点图中发现气温与热饮杯数之)从散点图中发现气温与热饮杯数之 间关系间关系的一般

12、规律;的一般规律;(3 3)求回归方程;)求回归方程;(4 4)如果某天的气温是)如果某天的气温是22,预测这天卖出的热,预测这天卖出的热饮杯数饮杯数. .19当当x=2x=2时,时,y=143.063y=143.063. .20例例2 2:假设某设备的使用年限x(年)和所支出的维修费用y(万元)有如下统计资料:使用年限使用年限x x( (年年) )2 23 34 45 56 6维修费用维修费用y y( (万元万元) )2.22.23.83.85.55.56.56.57.07.0由资料知 y对 x呈线性关系,试求:;,) 1 (的值中的回归直线方程ababxy(2)估计使用年限是10年时,维修

13、费用估计是多少?21解解:(1) 制表:制表:i12345合计合计xi2345620yi2.23.85.56.57.025xi24916253690 xi yi4.411.422.032.542.0 112.3. 3 .112,90, 5, 4:51512iiiiiyxxyx于是有23. 1103 .1245905453 .1122b08.0423.15xbya22(2) 回归直线方程是.08. 023. 1xy(2)估计使用年限是10年时,维修费用估计是多少?)(4 .1238.1208. 01023. 1,10万元时当yx答:估计使用10年时,维修费用估计是12.4万元。23练习练习某种产

14、品是的广告费支出某种产品是的广告费支出x x(单位:百万元)(单位:百万元)与销售额与销售额y y(单位:百万元)之间有如下对(单位:百万元)之间有如下对应数据应数据(1)画出散点图;(2)如果x与y具有相关关系,求回归直线方程,并说明b的意义24解(1)散点图如图所示:1735910305080销售额(百万元)广告费(百万元)(2)由散点图可知:X与Y具有相关关系515215501380145iiiiixyx yx 51522156.517.55iiiiix yx ybaybxxx故可得:故可得:所求回归直线方程为6.517.5yxb表示广告每增加100万元,销售量平均增加650元25课堂总

15、结课堂总结1、两种相关关系:正相关、负相关、两种相关关系:正相关、负相关2、线性回归方程:、线性回归方程:回归直线所在方程的斜率与截距的一般公式回归直线所在方程的斜率与截距的一般公式: :1122211()(),().nniiiiiinniiiixxyyx ynxybxxxnxaybx ybxaybxa26则 b= ,a= , 1.由一组 5 个数据(xi,yi)算得 4,5,xy211112.3,90,nniiiiix yx回归方程为 . 1.230.081.230.08yx巩固练习巩固练习:;)()(1221121xbyaxnxyxnyxxxyyxxbniiniiiniiniii,4.75

16、257yx2对于回归方程对于回归方程 当当x=28时时,y的估计值是的估计值是39027(0 0),( 0)x,(0 ) y,()x y,3线性回归方程表示的直线线性回归方程表示的直线 必定过()必定过().22.5yx4 4设有一个回归方程设有一个回归方程, 变量变量x 增加增加1 1个单位个单位长度时,变量长度时,变量y y()()平均增加平均增加2.5个单位长度个单位长度 平均增加平均增加0.5个单位长度个单位长度平均减少平均减少2.5个单位长度个单位长度 平均减少平均减少0.5个单位长度个单位长度yabxDC28思考思考:根据最小二乘法的知识根据最小二乘法的知识,我们对于任何数我们对于

17、任何数据都可以利用最小二乘计算出其回归方据都可以利用最小二乘计算出其回归方程程,问问:是否所有的问题是否所有的问题,我们都可以利我们都可以利用最小二乘来估计用最小二乘来估计?下面的数据给定了两个变量之间的关系下面的数据给定了两个变量之间的关系X12345678Y1491625364964请利用最小二乘法求出这两个变量之间的线性回归方程请利用最小二乘法求出这两个变量之间的线性回归方程29解解根据数据显示:根据数据显示:5 .25, 5 . 4yx其他数据如表其他数据如表1296512343216125642781204644936251694120464493625169413687654321合计合计iiyxiy2ixix进而可以求得进而可以求得b=9a=-15于是,线性回归方程为:于是,线性回归方程为: Y=-15+9x30事实上,从表中的数据可以看出:事实上,从表中的数据可以看出:2xy 从而我们利用最小二乘估计时,已经失去从而我们利用最小二乘

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论