2015-2016学年高中数学 31回归分析的基本思想及其初步应用课件 新人教A版选修2_第1页
2015-2016学年高中数学 31回归分析的基本思想及其初步应用课件 新人教A版选修2_第2页
2015-2016学年高中数学 31回归分析的基本思想及其初步应用课件 新人教A版选修2_第3页
2015-2016学年高中数学 31回归分析的基本思想及其初步应用课件 新人教A版选修2_第4页
2015-2016学年高中数学 31回归分析的基本思想及其初步应用课件 新人教A版选修2_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、成才之路 数学,路漫漫其修远兮 吾将上下而求索,人教A版 选修2-3,统计案例,第三章,你坐过火车、乘过飞机吗?晕车、晕机与性别有无关系?肺癌是人类的一大杀手,吸烟与患肺癌的关联性究竟有多大?你了解过你们班同学的身高与体重吗,身高与体重是否线性相关?你统计过你们班同学的考试成绩吗,物理成绩的高低与数学成绩关联度有多大?这些都是统计学研究的内容 本章我们将要学习独立性检验和回归分析的基本思想、方法学习本章要注意学习收集、整理、分析数据的方法,体会统计分析的基本思想、建模思想和现代计算技术在统计中的应用,体会统计思维和确定性思维的差异,3.1 回归分析的基本思想 及其初步应用,第三章,通过典型案例

2、的探究,了解回归分析的基本思想、方法及初步应用 体会统计方法的特点及应用的广泛性,提高对现代计算技术与统计的应用的认识,重点:线性回归模型及相关概念,用回归分析方法作出推断 难点:对线性回归模型、残差分析、相关性检验的理解和用相关指数检验模型的拟合效果,温故知新 请回顾复习在必修3中学过的两个变量的线性相关,回归直线,回归直线方程的求法,回归直线方程,新知导学 1回归分析是处理两个变量之间_的一种统计方法若两个变量之间具有线性相关关系,则称相应的回归分析为_,相关关系,线性回归分析,相关系数r,当r0时,表明两个变量_;当r0时,表明两个变量_r的绝对值越接近1,表明两个变量的线性相关性越_;

3、r的绝对值接近于0时,表明两个变量之间几乎不存在线性相关关系通常当|r|大于_时,认为两个变量有很强的线性相关关系,正相关,负相关,强,0.75,牛刀小试 1(2015武汉市重点中学高二期末)在对两个变量x,y进行线性回归分析时,有下列步骤: 对所求出的回归直线方程作出解释; 收集数据(xi,yi),i1,2,n; 求线性回归方程;,求相关系数; 根据所搜集的数据绘制散点图 如果根据可行性要求能够作出变量x,y具有线性相关的结论,则在下列操作顺序中正确的是( ) A B C D 答案 D,解析 对两个变量进行回归分析时, 首先收集数据(xi,yi),i1,2,n;根据所搜集的数据绘制散点图 观

4、察散点图的形状,判断线性相关关系的强弱, 求相关系数,写出线性回归方程, 最后依据所求出的回归直线方程作出解释; 故正确顺序是 故选D,线性回归分析,新知导学 4随机误差 (1)随机误差的概念:当样本点散布在某一条直线的附近,而不是在一条直线上时,不能用一次函数ybxa来描述两个变量之间的关系,而是用线性回归模型_来表示,这里_称为解释变量,_称为预报变量,_称为随机误差,E(e)_,D(e)_.,ybxae,x,y,e,0,2,(2)随机误差及其产生的原因 从散点图中我们可以看到,样本点散布在某一条直线附近,而不是在一条直线上,所以不能用一次函数ybxa来描述它们之间的关系,我们用下面的线性

5、回归模型来表示:ybxae,其中a、b为模型的未知数,e称为随机误差产生随机误差的主要原因有以下3个方面: 用线性回归模型近似真实模型(真实模型是客观存在的,通常我们并不知道真实模型是什么)所引起的误差可能存在非线性的函数能更好地描述y与x之间的关系,但是现在却用线性函数来表述这种关系,结果会产生误差 这种由模型近似所引起的误差包含在e中,忽略了某些因素的影响影响变量y的因素不只变量x,可能还包括其他许多因素(例如在描述身高和体重关系的模型中,体重不仅受身高的影响,还会受遗传基因、饮食习惯、生长环境等其他因素的影响),它们的影响都体现在e中 观测误差由于测量工具等原因,导致y的观测值产生误差(

6、比如一个人的体重是确定的数,但由于测量工具的影响和测量人技术的影响可能会得到不同的观测值,与真实值之间存在误差),这样的误差也包含在e中,残差,样本编号,7残差分析 (1)在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后,通过残差_来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析,(2)在残差图中,如果残差点比较均匀地落在_ _中,说明选用的模型比较合适这样的带状区域的宽度越窄,说明模型拟合精度_,回归方程的预报精度也_ 如果图中有某个样本点的残差比较大,需要确认在采集这个样本点的过程中是否有人为的错

7、误如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因,水平的带状,区域,越高,越高,贡献率,R2的值越大,说明残差平方和越小,也就是说模型的拟合效果(即回归效果)越_ 在含有一个解释变量的线性模型中,R2恰好等于_的平方,好,相关系数r,答案 B,A某人年龄37岁,他体内脂肪含量为20.90% B某人年龄37岁,他体内脂肪含量为20.90%的概率最大 C某人年龄37岁,他体内脂肪含量的期望值为20.90% D20.90%是对年龄为37岁的人群中的大部分人的体内脂肪含量所作出的估计 答案 D,点评 本题考查的知识点是线性回归方程,熟练掌

8、握并正确理解回归分析的实际意义,是解答的关键,4为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是( ) Al1和l2有交点(s,t) Bl1与l2相关,但交点不一定是(s,t) Cl1与l2必定平行 Dl1与l2必定重合 答案 A 解析 由题意知(s,t)是甲、乙两位同学所做试验的样本点的中心,而线性回归直线恒过样本点的中心,故选A,5(2014天门市调研)下图是根据变量x、y的观测数据(x

9、i,yi)(i1,2,10)得到的散点图,由这些散点图可以判断变量x、y具有相关关系的图是( ) A B C D 答案 D,解析 根据散点图中点的分布情况,可判断中的变量x,y具有相关的关系,关于两个变量x和y的7组数据如下表所示:,变量间的相关性检验,(2015河南周口市高二期末)为了解春季昼夜温差大小与某种子发芽多少之间的关系,现在从4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天100颗种子浸泡后的发芽数,得到如下资料:,求回归直线方程,分析 (1)5天中选2天,发芽种子数均不小于25,符合古典概型特征,用古典概型求解; (2)依据最小二乘法公式求解,解析 (1),

10、假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下表的统计资料: 若由资料知,y与x呈线性相关关系,线性回归分析,分析 y与x呈线性相关关系,用线性相关的公式分别计算,(1)在给定的坐标系中画出表中数据的散点图;,有一测量水流的实验装置量水堰,测得试验数据如下表:,非线性回归问题,分析 作散点图,观察确定y与x的近似函数关系,作变量替换,列出新的对应值表求出对应的线性回归方程,再作变量替换得回归方程 解析 根据测得数据作出散点图,如图,根据已有的函数知识,可以发现样本点分布在某一条幂函数型曲线Qh(、是待定的正常数)的周围为此将Qh两边取对数,得到lgQlghlg,令lgQy,lghx,于是式可化为yxlg.这样y就是x的线性函数了可以利用线性回归模型来建立y和x之间的线性回归方程ybxa(b,lga)了,(2015河南周口市高二期末)以模型ycekx去拟合一组数据时,为了求出回归方程,设zlny,其变换后得到线性回归方程z0.3x4,则c_. 答案 e4 解析 ycekx, 两边取对数,可得lnyln(cekx)lncl

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论