数学(人教版选修12)课件11回归分析的基本思想及其初步应用_第1页
数学(人教版选修12)课件11回归分析的基本思想及其初步应用_第2页
数学(人教版选修12)课件11回归分析的基本思想及其初步应用_第3页
数学(人教版选修12)课件11回归分析的基本思想及其初步应用_第4页
数学(人教版选修12)课件11回归分析的基本思想及其初步应用_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章统计案例1.1回归分析的基本思想及其初步应用1.会用散点图分析两个变量是否存在相关关系.(重点)2.会求回归方程,掌握建立回归模型的步骤,会选择回归模型.(重点、难点)1.回归分析回归分析是对具有____________的两个变量进行统计分析的一种常用方法.2.线性回归模型(1)由散点图易发现,样本点散布在某一条直线附近,而不是一条直线上,所以不能用一次函数y=bx+a描述它们之间的关系,因此用线性回归模型y=bx+a+e来表示,其中a、b为未知参数,e为______________.相关关系随机误差(3)解释变量和预报变量线性回归模型与一次函数模型的不同之处是增加了随机误差项e,因变量y的值由___________和_____________共同确定,即自变量x只解释部分y的变化,在统计中,我们也把自变量x称为解释变量,因变量y称为预报变量.自变量x随机误差e3.刻画回归效果的方式残差样本编号身高数据体重估计值越小解释预报4.非线性回归分析(1)非线性相关关系:样本点分布在某一条曲线的周围,而不是一条直线附近.我们就称这两个变量之间不具有线性相关关系而是非线性相关关系.(2)非线性回归方程线性化①y=axn(其中a,x,y均为正值)(幂函数型函数)lgy=lga+nlgx,令u=lgy,v=lgx,b=lga,则u=nv+b,图象为一直线.②y=cax(a>0,c>0)(指数型函数)lgy=xlga+lgc,令u=lgy,b=lgc,d=lga,则u=dx+b,图象为一直线.1.在下列各组量中:①正方体的体积与棱长;②一块农田的水稻产量与施肥量;③人的身高与年龄;④家庭的支出与收入;⑤某户家庭的用电量与电价.其中量与量之间的关系是相关关系的是(

)A.①②

B.②④⑤C.①③④ D.②③④解析:①是函数关系V=a3;⑤电价是统一规定的,与用电量有一定的关系,但这种关系是确定的关系;②③④中的两个量之间的关系都是相关关系,因为水稻的产量与施肥量在一定范围内是正比、反比或其他关系,并不确定;人的身高一开始随着年龄的增加而增大,之后则不变化或降低,在身高增大时,也不是均匀增大的;家庭的支出与收入有一定的关系,在一开始,会随着收入的增加而支出也增加,而当收入增大到一定的值后,家庭支出趋向于一个常数值,也不是确定关系.答案:D2.关于回归分析,下列说法错误的是(

)A.回归分析是研究两个具有相关关系的变量的方法B.线性相关系数可以是正的,也可以是负的C.回归模型中一定存在随机误差D.散点图能明确反映变量间的关系解析:用散点图反映两个变量间的关系时,存在误差,故D错误.答案:D4.已知线性回归直线方程式为y=2-2.5x,则x=25时,y的估计值是________.解析:将x=25代入回归方程y=2-2.5×25=-60.5.答案:-60.52.线性回归分析(1)由线性回归方程给出的是一个预报值而非精确值.(2)随机误差的主要来源①线性回归模型与真实情况引起的误差;②省略了一些因素的影响产生的误差;③观测与计算产生的误差.(3)残差分析是回归分析的一种方法.(4)用相关指数R2来刻画回归效果.R2越大,意味着残差平方和越小,即模型的拟合效果越好;R2越小,残差平方和越大,即模型的拟合效果越差.【想一想】

2.回归分析中,利用线性回归方程求出的函数值一定是真实值吗?为什么?提示:不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食,是否喜欢运动等.【想一想】

3.在线性回归模型y=bx+a+e中,e的作用是什么?提示:e的作用是提供选择模型的准则,以及在模型合理的情况下探究最佳估计值a,b的工具.3.建立回归模型的基本步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程).(4)按一定规则(如最小二乘法)估计回归方程中的参数.(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大或残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否合适等.

有下列说法:①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归方程=x+,可以估计和观测变量的取值和变化趋势;④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.其中正确命题的个数是(

)A.1

B.2C.3 D.4回归分析的有关概念[思路探究]可借助于线性相关概念及性质逐一作出判断.答案:C1.解答例1中④时,必须明确具有线性相关关系的两个变量间才能求得一个线性回归方程,否则求得的方程无实际意义.因此必须先进行线性相关性判断,后求线性回归方程.2.回归分析的过程:(1)随机抽取样本,确定数据,形成样本点;(2)由样本点形成散点图,判断是否具有线性相关关系;(3)由最小二乘法确定线性回归方程;(4)由回归方程观察变量的取值及变化趋势.1.下列四个命题中正确的是(

)①在线性回归模型中,e是bx+a与预报真实值y的误差,它是一个观测的量;②残差平方和越小的模型,拟合的效果越好;③用R2来刻画回归效果,R2越小,拟合的效果越好;④在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,且带状区域宽度越窄,说明拟合精度越高,回归方程的预报精度越高.A.①③ B.②④C.①④ D.②③解析:e是一个不可观测的量,故①不正确;R2越小残差平方和越大,即模型的拟合效果越差,故③不正确;②④是正确的.答案:B

为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:(1)作出散点图并求线性回归方程;(2)求出R2;(3)进行残差分析.线性回归分析[思路探究]作残差分析时,一般从以下几个方面予以说明:(1)散点图;(2)相关指数;(3)残差图中的异常点和样本点的带状分布区域的宽窄.(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与重量成线性关系.(2)残差图也是用来刻画拟合效果的,判断依据是:残差点比较均匀地分布在水平的带状区域中,带状区域越窄,说明模型拟合精度越高,回归方程预报精度越高.非线性回归分析1.两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y=c1ec2x,我们可以通过对数变换把指数关系变为线性关系,令z=lny,则变换后样本点应该分布在直线z=bx+a(a=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论