高中数学选择性必修3课件:8 2 2 第二课时 非线性回归模型及回归模型的拟合效果的判断(人教A版)_第1页
高中数学选择性必修3课件:8 2 2 第二课时 非线性回归模型及回归模型的拟合效果的判断(人教A版)_第2页
高中数学选择性必修3课件:8 2 2 第二课时 非线性回归模型及回归模型的拟合效果的判断(人教A版)_第3页
高中数学选择性必修3课件:8 2 2 第二课时 非线性回归模型及回归模型的拟合效果的判断(人教A版)_第4页
高中数学选择性必修3课件:8 2 2 第二课时 非线性回归模型及回归模型的拟合效果的判断(人教A版)_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二课时非线性回归模型及回归模型的拟合效果的判断1.进一步掌握一元线性回归模型参数的统计意义,会用相关统计软件.2.了解非线性回归模型.3.会通过分析残差和利用R2判断回归模型的拟合效果.课标要求素养要求通过学习回归模型的应用及对回归模型的拟合效果的判断,提升数学运算及数据分析素养.课前预习课堂互动分层训练内容索引课前预习知识探究11.残差的概念观测值观测值残差残差分析2.刻画回归效果的方式(1)残差图法作图时________为残差,________可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.纵坐标横坐标越小越大大小3.非线性回归模型对于非线性回归分析问题,应先进行变量代换,求出代换后的经验回归方程,再求非线性经验回归方程.点睛在使用经验回归方程进行预测时,需要注意的问题:(1)经验回归方程只适用于所研究的样本的总体;(2)所建立的经验回归方程一般都有时效性;(3)解释变量的取值不能离样本数据的范围太远.一般解释变量的取值在样本数据范围内,经验回归方程的预报效果好,超出这个范围越远,预报的效果越差;(4)不能期望经验回归方程得到的预报值就是响应变量的精确值.

点睛在使用经验回归方程进行预测时,需要注意的问题:(1)经验回归方程只适用于所研究的样本的总体;(2)所建立的经验回归方程一般都有时效性;(3)解释变量的取值不能离样本数据的范围太远.一般解释变量的取值在样本数据范围内,经验回归方程的预报效果好,超出这个范围越远,预报的效果越差;(4)不能期望经验回归方程得到的预报值就是响应变量的精确值.

1.思考辨析,判断正误√(1)残差平方和越接近0,线性回归模型的拟合效果越好.(

)(2)在画两个变量的散点图时,

响应变量在x轴上,解释变量在y轴上.(

)提示

在画两个变量的散点图时,

响应变量在y轴上,解释变量在x轴上.(3)R2越小,

线性回归模型的拟合效果越好.(

)提示

R2越大,

线性回归模型的拟合效果越好.(4)回归分析前,要先进行相关性的分析.(

)××√AB4.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性作试验,并用回归分析的方法分别求得相关系数r与残差平方和m如表:

甲乙丙丁r0.820.780.690.85m106115124103则________同学的试验结果体现了A,B两变量更强的线性相关性.解析

由题表可知,丁同学的相关系数r最大且残差平方和m最小,故丁同学的试验结果体现了A,B两变量更强的线性相关性.丁课堂互动题型剖析2课堂互动题型剖析2题型一残差分析与决定系数R2的应用【例1】假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:x15.025.830.036.644.4y39.442.942.943.149.2(1)以x为解释变量,y为预报变量,作出散点图;解散点图如下.(2)求y关于x的经验回归方程,对于基本苗数56.7预报成熟期有效穗;解由(1)中散点图看出,样本点大致分布在一条直线的附近,有比较好的线性相关关系,因此可以用经验回归方程刻画它们之间的关系.故估计成熟期有效穗为51.143.(3)计算各组残差,并计算残差平方和;(4)求R2,并说明(2)中求出的回归模型的拟合程度.思维升华【训练1】

为研究质量x(单位:g)对弹簧长度y(单位:cm)的影响,对不同质量的6个物体进行测量,数据如下表:x51015202530y7.258.128.959.9010.911.8(1)作出散点图并求经验回归方程;解散点图如图所示.样本点分布在一条直线附近,y与x具有线性相关关系.(2)求出R2并说明回归模型拟合的程度;解列表如下:(3)进行残差分析.解由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正错误,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在宽度不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与所挂物体的质量成线性关系.【例2】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.题型二非线性回归分析(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?解①由(2)知,当x=49时,②根据(2)的结果知,年利润z的预报值故年宣传费为46.24千元时,年利润的预报值最大.求非线性经验回归方程的步骤(1)确定变量,作出散点图.(2)根据散点图,选择恰当的拟合函数.(3)变量置换,通过变量置换把非线性经验回归问题转化为线性回归问题,并求出经验回归方程.(4)分析拟合效果:通过计算决定系数或画残差图来判断拟合效果.(5)根据相应的变换,写出非线性经验回归方程.思维升华【训练2】

下表为收集到的一组数据:x921232527293235y711212466115325(1)作出x与y的散点图,并猜测x与y之间的关系;解作出散点图如下图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线y=c1ec2x的周围,其中c1,c2为待定的参数.(2)建立x与y的关系,预报回归模型并计算残差;解对y=c1ec2x两边取对数,得lny=lnc1+c2x,令z=lny,则有变换后的样本点应分布在直线z=bx+a(a=lnc1,b=c2)的周围,这样就可以利用线性回归模型来建立y与x之间的非线性经验回归方程了,数据可以转化为x21232527293235z1.9462.3983.0453.1784.1904.7455.784残差(3)利用所得模型,预报x=40时y的值.1.牢记2个知识点 (1)残差的概念;(2)刻画回归效果的方式.2.掌握3种方法 (1)线性回归分析的方法;(2)残差分析与决定系数的应用的方法;(3)非线性回归分析的方法.3.注意1个易错点

回归分析时,必须先画散点图,确定两个变量是否有关系,有什么样的关系,然后确定是哪种回归模型才能进一步求解.

课堂小结分层训练素养提升3

A.10亿元 B.9亿元

C.10.5亿元 D.9.5亿元C2.对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是(

)A解析用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.3.在回归分析中,R2的值越大,说明残差平方和(

) A.越大 B.越小 C.可能大也可能小 D.以上均错B4.若一函数模型为y=sin2α+2sinα+1,为将y转化为t的经验回归方程,则需作变换t等于(

)B解析因为y是关于t的经验回归方程,实际上即y是关于t的一次函数,又因为y=(sinα+1)2,若令t=(sinα+1)2,则可得y与t的函数关系式为y=t,此时变量y与变量t是线性相关关系.哪位同学的试验结果体现拟合A,B两变量关系的模型拟合精度高(

)A.甲 B.乙

C.丙 D.丁D

甲乙丙丁散点图残差平方和115106124103二、填空题6.某种产品的广告支出费用x(单位:万元)与销售额y(单位:万元)的数据如下表:x24568y3040605070107.已知具有相关关系的两个随机变量的一组观测数据的散点图分布在函数y=3e2x+1的图象附近,则可通过转换得到的经验回归方程为_____________________.u=1+ln3+2x解析

由y=3e2x+1,得lny=ln(3e2x+1),即lny=2x+1+ln3,令u=lny,则经验回归方程为u=1+ln3+2x.8.在研究气温和热茶销售杯数的关系时,若求得决定系数R2≈0.85,则表明气温解释了__________的热茶销售杯数变化,而随机误差贡献了剩余的__________,所以气温对热茶销售杯数的效应比随机误差的效应大得多.85%15%解析由决定系数R2的意义可知,R2≈0.85表明气温解释了85%,而随机误差贡献了剩余的15%.三、解答题9.已知某种商品的价格x(单位:元/件)与需求量y(单位:件)之间的关系有如下一组数据:x1416182022y1210753求y关于x的经验回归方程,并说明回归模型拟合效果的好坏.列出残差表:所以回归模型的拟合效果较好.10.为了研究甲型H1N1中的某种细菌随时间x变化的繁殖个数y,收集数据如下:天数x123456繁殖个数y612254995190求y关于x的回归方程.解作出散点图如图(1)所示.由散点图看出样本点分布在一条指数型曲线y=cebx的周围,则lny=bx+lnc.令z=lny,a=lnc,则z=bx+a.x123456z1.792.483.223.894.555.2511.(多选题)下列说法正确的是(

) A.残差点分布的带状区域越窄,回归方程的拟合效果越好 B.残差平方和越小,决定系数R2越大 C.决定系数R2可以大于1 D.通过经验回归方程得到的预报值是响应变量的可能取值的平均值,不一定是响应变量的精确值

解析由R2的计算公式,知B正确,C错误;A,D均正确.ABDy=e0.25x-2.5813.某电容器充电后,电压达到100V,然后开始放电,由经验知道,此后电压U随时间t变化的规律用公式U=Aebt(b<0)表示,现测得时间t(s)时的电压U(V)如下表:t/s012345678910U/V100755540302015101055试求:电压U关于时间t的经验回归方程(提示

对公式两边取自然对数,把问题转化为线性回归分析问题).解对U=Aebt两边取对数得lnU=lnA+bt,令y=lnU,a=lnA,x=t,则y=a+bx,y与x的对应数据如下表:x012345678910y4.64.34.03.73.43.02.72.32.31.61.614.某地区不同身高的未成年男性的体重平均值如表所示:身高x(cm)60708090100110体重y(kg)6.137.909.9912.1515.0217.50身高x(cm)120130140150160170体重y(kg)20.9226.8631.1138.8547.2555.05(1)试建立y关于x的经验回归方程;解

根据题表中的数据画出散点图如图所示.由图可看出,样本点分布在某条指数函数曲线y=c1ec2x的周围,于是令z=lny,得下表:x60708090100110z1.812.072.302.502.712.86x120130140150160170z3.043.293.44

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论