高中数学 1.1回归分析的基本思想及其初步应用课件 新人教A版选修12(1).ppt_第1页
高中数学 1.1回归分析的基本思想及其初步应用课件 新人教A版选修12(1).ppt_第2页
高中数学 1.1回归分析的基本思想及其初步应用课件 新人教A版选修12(1).ppt_第3页
高中数学 1.1回归分析的基本思想及其初步应用课件 新人教A版选修12(1).ppt_第4页
高中数学 1.1回归分析的基本思想及其初步应用课件 新人教A版选修12(1).ppt_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

成才之路数学,路漫漫其修远兮吾将上下而求索,人教a版选修1-11-2,统计案例,第一章,5月31日是世界无烟日有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手这些疾病与吸烟有关的结论是怎样得出的呢?若从数学角度区分,这里的疾病和吸烟就是彼此相关的两个变量如何用数学的方法来刻画这种变量之间的关系呢?本章要学习的统计案例就是通过对一对变量使用线性回归的方法来研究变量之间的对应关系通过本章的学习,我们将知道如何研究变量之间的相关关系,如何模拟变量之间的函数关系,如何检验两个变量之间的独立性,1.1回归分析的基本思想及其初步应用,第一章,通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系通过求线性回归方程,探究相关性检验的基本思想通过对典型案例的探究,体会回归分析在生产实际和日常生活中的广泛应用,重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法相关指数和残差分析难点:解释残差变量的含义,回归直线系数的计算求解,思维导航1下列图中的y与x相关吗?,相关关系,新知导学1当一个变量取值改变时,另一个变量的取值随之改变,但带有_,这样的两个变量之间的关系叫做相关关系,随机性,思维导航2上图2中各点散布在一条直线附近,可否用这条直线对y随x的变化作出近似估计?如果可以,这条直线怎样求?如何刻画这种估计的可靠性?,线性回归分析,新知导学2回归分析是处理两个变量之间_常用的一种统计方法若两个变量之间具有线性相关关系,则称相应的回归分析为_,相关关系,线性回归分析,4线性相关关系强与弱的判断:用相关系数r来描述线性相关关系的强弱当r0时,表明两个变量_;当r0时,表明两个变量_r的绝对值越接近1,表明两个变量的线性相关性越_;r的绝对值接近于0时,表明两个变量之间_线性相关关系通常当|r|大于_时,认为两个变量有很强的线性相关关系5随机误差的概念:当样本点散布在某一条直线的附近,描述两个变量之间的关系是用线性回归模型_来表示,其中_为模型的未知参数,_称为随机误差,正相关,负相关,强,几乎不存在,0.75,ybxae,a和b,e,5随机误差的概念:当样本点散布在某一条直线的附近,描述两个变量之间的关系是用线性回归模型_来表示,其中_为模型的未知参数,_称为随机误差,ybxae,a和b,e,6回归效果的刻画我们也可以用相关指数r2来刻画回归的效果,其计算公式是r2_.在线性回归模型中,r2表示解释变量对预报变量变化的_r2的值越大,说明残差平方和越小,也就是说模型的拟合效果越_,贡献率,好,新知导学7在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后,通过残差_来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析,残差分析,8利用图形来分析残差特性,作图时纵坐标为_,横坐标可以选为_,这样作出的图形称为残差图如果图中有某个样本点的残差比较大,需要确认在采集这个样本点的过程中是否有人为的错误如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因另外,残差点比较均匀地落在_中,说明选用的模型比较合适这样的带状区域的宽度越_,说明模型拟合精度越高,回归方程的预报精度越高回归分析问题有线性回归问题和非线性回归问题,对于非线性回归问题,往往利用转换变量的方法转化为线性回归问题,残差,样本编号,水平的,带状区域,窄,答案c,2在两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数r2如下,其中拟合效果最好的模型是()a模型1的相关指数r2为0.98b模型2的相关指数r2为0.80c模型3的相关指数r2为0.50d模型4的相关指数r2为0.25答案a,解析相关指数r2的取值范围为0,1,其中r21,即残差平方和为0,此时预测值与观测值相等,y与x是函数关系,也就是说在相关关系中r2越接近于1,说明随机误差的效应越小,y与x相关程度越大,模型的拟合效果越好r20,说明模型中x与y无关,故选a,3(2015湖北文)已知变量x和y满足关系y0.1x1,变量y与z正相关下列结论中正确的是()ax与y正相关,x与z负相关bx与y正相关,x与z正相关cx与y负相关,x与z负相关dx与y负相关,x与z正相关答案c解析因为y0.1x1,0.10),所以z0.1axab,0.1a0.所以x与z负相关故选c,4为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是()al1和l2有交点(s,t)bl1与l2相关,但交点不一定是(s,t)cl1与l2必定平行dl1与l2必定重合答案a,解析由题意知(s,t)是甲、乙两位同学所做试验的样本点的中心,而线性回归直线恒过样本点的中心,故选a,5(2015山东沂水县高二期中)已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线方程是_.,有下列说法:线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;,概念的理解和判断,答案c方法规律总结解答概念辨析题,应紧扣线性回归分析中每个概念的定义进行,要准确把握概念的内涵,下面变量关系是相关关系的是()学生的学习态度与学习成绩之间的关系;教师的执教水平与学生的学习成绩之间的关系;学生的身高与学生的学习成绩之间的关系;家庭的经济条件与学生的学习成绩之间的关系abcd答案a解析是相关关系,是非相关关系,假设关于某设备的使用年限x和所支出的维修费y(万元)有如下的统计资料:,回归直线方程,答案a,为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:,线性回归分析,解析(1)散点图如下图所示:,3随机误差及其产生的原因从散点图中我们可以看到,样本点散布在某一条直线附近,而不是在一条直线上,所以不能用一次函数ybxa来描述它们之间的关系,而是用线性回归模型ybxae来表示,其中e称为随机误差产生随机误差的主要原因有以下3个方面:(1)用线性回归模型近似真实模型所引起的误差可能存在非线性的函数能更好地描述y与x之间的关系,但是现在却用线性函数来表述这种关系,结果会产生误差这种由模型近似所引起的误差包含在e中,(2)忽略了某些因素的影响影响变量y的因素不只变量x,可能还包括其他许多因素(例如在描述身高和体重关系的模型中,体重不仅受身高的影响,还会受遗传基因、饮食习惯、生长环境等其他因素的影响),它们的影响都体现在e中(3)观测误差由于测量工具等原因,导致y的观测值产生误差(比如一个人的体重是确定的数,但由于测量工具的影响和测量人技术的影响可能会得到不同的观测值,与真实值之间存在误差),这样的误差也包含在e中,一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得数据如下:把零件数x作为解释变量,加工时间y作为预报变量(1)计算总偏差平方和、残差平方和及相关指数;(2)作出残差图;(3)进行残差分析,解析(1)由x、y的数据得散点图如图由散点图可以认为样本点大致分布在某条直线的附近,因此可以用线性回归模型来拟合设线性回归方程为x,列出下表:,(2)作出残差图如图,横坐标为零件数的数据,纵坐标为残差,(3)由题中数据可得样本相关系数r的值为0.9998,再结合散点图可以说明x与y有很强的线性相关关系由r2的值可以看出回归效

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论