广东肇庆市高中数学第三章统计案例3.1回归分析的基本思想和初步应用学案新人教A版选修23_第1页
广东肇庆市高中数学第三章统计案例3.1回归分析的基本思想和初步应用学案新人教A版选修23_第2页
广东肇庆市高中数学第三章统计案例3.1回归分析的基本思想和初步应用学案新人教A版选修23_第3页
广东肇庆市高中数学第三章统计案例3.1回归分析的基本思想和初步应用学案新人教A版选修23_第4页
广东肇庆市高中数学第三章统计案例3.1回归分析的基本思想和初步应用学案新人教A版选修23_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 .DOC资料. 3.1回归分析的基本思想及其初步应用一、学习要求1.了解相关关系、正相关、负相关、回归直线的概念;2.通过典型案例的探究,进一步了解回归分析的基本思想、方法及其初步应用。3.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相互关系;4.能根据给出的线性回归方程系数公式建立线性回归方程。拼十年寒窗挑灯苦读不畏难;携双亲期盼背水勇战定夺魁。如果你希望成功,以恒心为良友,以经验为参谋,以小心为兄弟,以希望为哨兵。二、先学后讲1变量间的相关关系变量间确实存在关系,但又不具备函数所要求的确定性,它们的关系是带有随机性的,也就是一种非确定性关系。2散点图把从研究某两个变量的关系

2、中获取得的容量为的样本数据用点的形式表示为,称这样的一些点为样本点。把样本点画在平面直角坐标系上,以表示具有相关关系的两个变量的一组数据的图形叫做散点图。(把称为解释变量,把称为预报变量。)画散点图的目的是通过变量的散点图判断两个变量更近似于什么样的函数关系,以确定是否直接用线性回归模型来拟合原始数据。3.相关关系的分类散点图中点的分布位置是在从左下角到右上角的区域,对于两个变量的这种相关关系,称为正相关。(也就是说,正相关指的是两个变量有相同的变化趋势,即从整体上看一个变量会随另一个变量变大而变大,这在散点图上反映就是散点的分布在斜率大于0的直线附近。)散点图中点的分布位置是在从左上角到右下

3、角的区域,对于两个变量的这种相关关系,称为负相关。(也就是说,负相关指的是两个变量有相反的变化趋势,即从整体上看一个变量会随另一个变量变大而变小,这在散点图上反映就是散点的分布在斜率小于0的直线附近。)例如:对变量,有观测数据(),得散点图(1);对变量,有观测数据(),得散点图(2)由这两个散点图可以判断变量与有负相关关系,有正相关关系。4.两个变量的线性相关关系对于散点图,可以做出如下判断:如果所有样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系。如果所有样本点都落在某一函数曲线附近,变量之间就有相关关系。如果散点图中点的分布从整体上看大致在一条直线附近,

4、我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线,其方程称为回归直线方程。【这里“大致”的意思是指:这样的直线不止一条,在整体上与这个点最接近的一条即为回归直线。像平均数可以作为一个变量的数据的代表一样,这条直线可以作为两个变量具有线性相关关系的代表。】5回归直线方程(1)当两个具有相关关系的变量近似地满足一次函数关系时,所求出的函数关系就是回归直线方程。(2)回归方程中的(称为回归系数)由公式:求出。(计算时,先求出, );再由求出的值,并写出回归直线方程。(3)回归直线方程中的表示增加1个单位时,的变化量为。它是回归直线的斜率的估计值。(4)可以利用回归直线方程预报在取某一个值

5、时,的估计值。但这里所得到的值是预报值,而不是精确值,它带有很大的随机性,可能对于某一次实际值而言会有很大的出入。(5)设样本点为,则称为样本点的中心。回归直线一定过这一点。(对于单变量样本数据而言,平均数是样本数据的中心,类似地对双变量样本而言,回归直线是样本点的中心。)三、问题探究合作探究例1从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:编号12345678身高/cm165165157170175165155170体重/kg4857505464614359(1)以身高为自变量,体重为因变量,画出散点图;(2)求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为17

6、2cm的女大学生的体重。解:(1)根据表中数据,画出散点图如右图所示。(2) , , , 线性回归方程为:.当时,即身高为172cm的女大学生的预报体重为。【方法归纳】第一步:作散点图; 第二步:求回归直线方程:;第三步:用回归直线方程进行预报。自主探究1已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是( )。 【解析】设回归直线的方程为,依题意可知,又样本点的中心在直线上,即,得,所以回归直线的方程为。故选。2厂某产品产量(千件)与单位成本(元)满足回归直线方程是,则下列说法正确的是( )。 (答案:)产量每增加1000件,单位成本下降1.82元产量每减少1

7、000件,单位成本上升1.82元产量每增加1000件,单位成本上升1.82元产量每减少1000件,单位成本下降1.82元四、总结提升本节课你主要学习了 。五、问题过关1.一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:转速(转/秒)1614128每小时生产有缺点的零件数(件)11985(1)画出散点图并判断它们是否有相关关系;(2)如果与有线性相关关系,求回归直线方程(精确到0.001);(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么机器的运转速度应控制在什

8、么范围内?解:(1)散点图如下:由以上散点图可以看出,这些点近似在一条直线附近上下波动,故和具有相关关系。(2), ,,回归直线方程为:.(3)令,解得,所以机器的运转速度应控制在每秒15转内。【选修2-3】 3.1回归分析的基本思想及其初步应用(知识回顾:数学3(必修)第84页“2.3变量间的相关关系”)一、学习要求通过典型案例的探究,进一步了解回归分析的基本思想、方法及其初步应用。二、问题探究合作探究例1关为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间(单位:小时)与当天投篮命中率之间的关系:时间12345命中率0.40.50.60.60

9、.4(1)求小李这5天的平均投篮命中率;(2)用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率。(线性回归方程中系数计算公式,其中,表示样本均值。)解:(1)小李这5天的平均投篮命中率为:;(2)小李这5天打篮球的平均时间为:(小时);,线性回归方程为:。当时,故预测小李该月6号打6小时篮球的投篮命中率为0.53。自主探究1,的取值如下表:01342.24.34.86.7从散点图分析,与线性相关,回归直线方程为,当时,则的值是 。解:,当时,.四、总结提升本节课你主要学习了 。五、问题过关1.下表是某厂14月份用水量(单位:百吨)的一组数据:月份1234用水量4.5432.5由散

10、点图可知,用水量与月份之间有较好的线性相关关系,其线性回归直线方程是,则( )。 【解析】,回归直线方程必过定点,。故选。2.某种商品价格与该商品日需求量之间的几组对照数据如下表:价格(元/kg)1015202530日需求量(kg)1110865()求关于的线性回归方程;()当价格元/kg时,日需求量的预测值为多少?解: () , ,所求线性回归方程为。()由()知当时, ,当价格元/ kg时,日需求量的预测值为kg。【选修2-3】 3.1回归分析的基本思想及其初步应用一、学习要求1通过典型案例的探究,了解回归分析的基本思想、方法及其初步应用;2了解随机误差、解释变量、预报变量、残差和残差图的

11、意义、残差平方和的意义;3相关指数计算公式及其意义,并能通过相关指的大小评价模型的拟合效果。二、先学后讲1回归分析(阅读课本选修12第2页至第5页)对具有相关关系的两个变量进行统计分析的方法叫做回归分析。用回归分析的方法对两个具有线性相关关系的变量进行研究的步骤:收集数据作散点图求回归直线方程利用方程进行预报。2随机误差【问题提出】第1课时的例1(课本选修12第2页例1)中:“身高为的女大学生的体重一定是吗?如果不是,引起误差的原因是什么?”不是。是身高为的女大学生的平均体重的估计值,而不一定是某位身高为的女大学生的真实体重也就是说,身高为的女大学生的平均体重大约是,并且大部分的女大学生的体重

12、在附近。可见,用“”这个回归方程不能给出每一个身高为的女大学生的体重的预测值,只能给出她们平均体重的预测值。即不能用一次函数来描述某大学中女大学生的身高与体重之间的关系。用“”这一线性回归模型来表示身高与体重之间的关系。随机误差:。它是引起预报值与真实值之间的误差的原因之一。其估计值为。3残差对于样本点,而言,它们的随机误差为,其估计值为, ,称为相应点的残差。【要点说明】 (1)残差等于观察值减预测值。表示预报变量(因变量)中不能由回归方程解释的部分。(2)可以通过残差发现原始数据中的可疑数据,就是残差特别大的样本点,考察相应的样本数据是否有错。对残差特别大的样本点,要确认在采集这个样本点时

13、是否出现人为的错误,若是,予以纠正;若不是,查找其它原因。(3)分析残差图可以判断模型选择是否合适(模型的拟合效果好坏)。4相关指数(1)相关指数的计算公式: 。(2)相关指数的作用在的表达式中:“”是总偏差平方和,它仅与样本数据有关,与所选用模型无关,是一个确定的数;“”是残差平方和,在回归分析中,它代表了数据点和它在回归直线上相应位置的差异。残差平方和越小,取值越大;残差平方和越大,取值越小。在回归分析中,常用用相关指数来刻划回归的效果。在线性回归模型中,表示解释变量对于预报变量变化的贡献率。取值越大(越接近于1),模型的拟合效果越好(即解释变量和预报变量的相关性越强);取值越小,模型的拟

14、合效果越差。如果对于某组数据可以采取几种不同的回归方程进行回归分析,则可以通过比较几个的值,选择的值大的模型作为这组数据的模型。在上节课的例1中,表明“女大学生的身高解释了的体重变化”,或者说“女大学生的体重差异有是由身高引起的”。三、问题探究合作探究例1关于与有如下数据:245683040605070为了对与两个变量进行统计分析,现有以下两种线性模型:,试比较哪一个模型拟合的效果更好。解:,对于模型,、的数据如下表:245683040605070-0.5-3.510-6.50.5-20-1010020对于模型,、的数据如下表:245683040605070-1-58-9-3-20-1010020对于模型,得 对于模型,得 ,选用模型的拟合的效果更好。四、总结提升本节课你主要学习了 。五、问题过关1.回归分析中,相关指数的值越大,说明残差平方和( )。(答案:)越小 越大 可能大也可能小 以上都不对2. 如果散点图中的所有样本点都在一条直线上,则解释变量和预报变量之间的关系是;解释变量和预报变量的残差平方和等于;相关指数. (答案:函数关系;0;1。)3.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论