一元线性回归模型参数的最小二乘估计高二下数学人教A版(2019)选择性必修第三册_第1页
一元线性回归模型参数的最小二乘估计高二下数学人教A版(2019)选择性必修第三册_第2页
一元线性回归模型参数的最小二乘估计高二下数学人教A版(2019)选择性必修第三册_第3页
一元线性回归模型参数的最小二乘估计高二下数学人教A版(2019)选择性必修第三册_第4页
一元线性回归模型参数的最小二乘估计高二下数学人教A版(2019)选择性必修第三册_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8.2.2

非线性关系的回归模型(3)第八章成对数据的统计分析2024/7/18.2一元线性回归模型及其应用---思想:变换为线性回归模型一.求一元线性回归方程的步骤:(1)以成对样本数据描出散点图,通过散点图观察成对样本数据是否线性相关(2)判断两个变量之间的线性相关关系

(4)残差分析:残差表、残差图对回归模型的拟合效果进行评估。复习引入其中:例1

人们常将男子短跑100m的高水平运动员称为“百米飞人”.下表给出了1968年之前男子短跑100m世界纪录产生的年份和世界纪录的数据.试依据这些成对数据,建立男子短跑100m世界纪录关于纪录产生年份的经验回归方程.编号12345678年份18961912192119301936195619601968记录/s11.8010.6010.4010.3010.2010.1010.009.951.画散点图

以成对数据中的世界纪录产生年份为横坐标,世界纪录为纵坐标作散点图,得到右图在左图中,散点看上去大致分布在一条直线附近,似乎可用一元线性回归模型建立经验回归方程.探究新知2.求经验回归方程将经验回归直线叠加到散点图,得到下图:

用Y表示男子短跑100m的世界纪录,t表示纪录产生的年份,利用一元线性回归模型来刻画世界纪录和世界纪录产生年份之间的关系.根据最小二乘法,由表中的数据得到经验回归方程为①探究新知问题1

从图中可以看到,经验回归方程较好地刻画了散点的变化趋,请再仔细观察图形,你能看出其中存在的问题吗?例如,第一个世界纪录所对应的散点远离经验回归直线,并且前后两时间段中的散点都在经验回归直线的上方,中间时间段的散点都在经验回归直线的下方.散点并不是随机分布在经验回归直线的周围,而是围绕着经验回归直线有一定的变化规律,即成对样本数据呈现出明显的非线性相关的特征.探究新知问题2你能对模型进行修改,以使其更好地反映散点的分布特征吗?3.修改模型仔细观察右图,可以发现散点更趋向于落在中间下凸且递减的某条曲线附近.函数y=-lnx的图象具有类似的形状特征.

注意到100m短跑的第一个世界纪录产生于1896年,因此可设非线性回归方程为:

y=f(t)=c1+c2ln(t-1895)

(其中c1、c2为未知参数,且c2<0).追问

如何利用成对数据估计参数c1和c2?

探究新知为了利用一元线性回归模型估计参数c1和c2,我们引进一个中间变量x,令x=ln(t-1895),,则Y=c2x+c1通过x=ln(t-1895),将年份变量数据进行变换,得到新的成对数据,如下表.编号12345678年份/t18961912192119301936195619601968x0.002.833.263.563.714.114.174.29记录/s11.8010.6010.4010.3010.2010.1010.009.95如果上表对应的散点图呈现出很强的线性相关特征,我们就可以借助一元线性回归模型和新的成对数据,对参数c1和c2作出估计,进而可以得到Y关于t的非线性经验回归方程.画出上表中成对数据的散点图,由散点图可知,现在散点的分布呈现出很强的线性相关特征,故可以一元线性回归模型建立经验回归方程.探究新知根据最小二乘法,并利用表中数据可得新的经验回归方程为将经验回归直线叠加到散点图,如图所示:将x=ln(t-1895)代入

得到由创纪录年份预报世界纪录的经验非线性回归方程:②探究新知问题3

对于通过创纪录时间预报世界纪录的问题,我们建立了两个回归模型,得到了两个回归方程,你能判断哪个回归方程拟合的精度更好吗?②

(1)直接观察法.在同一坐标系中画出成对数据散点图、经验回归方程①的图象(红色)以及非线性经验回归方程②的图象(蓝色).我们发现,散点图中各散点都非常靠近②的图像,表明非线性经验回归方程②对于原始数据的拟合效果远远好于经验回归方程①.探究新知①(2)残差分析:

残差平方和越小,模型拟合效果越好.用ti表示编号为i的年份数据,用yi表示编号为i的纪录数据,则经验回归方程①和②的残差计算公式分别为两个经验回归方程的残差(精确到0.001)如下表所示.编号12345678t189619121921193019361956196019680.591-0.284-0.301-0.218-0.1960.1110.0920.205-0.0010.007-0.0120.015-0.0180.052-0.021-0.022观察各项残差的绝对值,发现经验回归方程②远远小于①,即经验回归方程②的拟合效果要远远好于①.探究新知(2)残差分析:

残差平方和越小,模型拟合效果越好.编号12345678t189619121921193019361956196019680.591-0.284-0.301-0.218-0.1960.1110.0920.205-0.0010.007-0.0120.015-0.0180.052-0.021-0.022在一般情况下,直接比较两个模型的残差比较困难,因为在某些散点上一个模型的残差的绝对值比另一个模型小,而另一些散点的情况则相反.可以通过比较残差的平方和来比较两个模型的效果.由可知Q2小于Q1.因此在残差平方和最小的标准下,非线性回归模型的拟合效果要优于一元线性回归模型的拟合效果.探究新知(3)用决定系数R2来比较这两个模型的拟合效果通过前面的讨论我们知道,当残差的平方和越小,经验回归模型的拟合效果就越好,故我们可以用决定系数R2来验证模型的拟合效果.决定系数R2的计算公式为残差平方和偏差平方和(与经验回归方程有关)(与经验回归方程无关)R2越大,表示残差平方和越小,即模型的拟合效果越好R2越小,表示残差平方和越大,即模型的拟合效果越差.显然0≤R2≤1,R2越接近1,则线性回归刻画的效果越好.探究新知编号12345678t189619121921193019361956196019680.591-0.284-0.301-0.218-0.1960.1110.0920.205-0.0010.007-0.0120.015-0.0180.052-0.021-0.022(3)用决定系数R2来比较这两个模型的拟合效果由上述残差表可算出经验回归方程①和②的决定系数R2分别为由于因此经验回归方程②的刻画效果比经验回归方程①的好很多.探究新知

另外,我们还可以用新的观测数据来检验模型的拟合效果.事实上,我们还有1968年之后的男子短跑100m世界纪录数据,如下表所示.编号91011121314151617181920t198319881991199119941996199920052007200820082009Y/s9.939.929.909.869.859.849.799.779.749.729.699.58

在散点图中继续绘制上表中的散点(绿色),再添加经验回归方程①所对应的经验回归直线,以及经验回归方程②所对应的经验回归曲线,得到下图.

显然绿色散点分布在蓝色经验回归曲线的附近,远离红色经验回归直线,表明经验回归方程②对于新数据的预报效果远远好于①.探究新知问题3

在上述问题情境中,男子短跑100m世界纪录和纪录产生年份之间呈现出对数关系,能借助样本相关系数刻画这种关系的强弱吗?在使用经验回归方程进行预测时,需注意以下问题1.回归方程只适用于我们所研究的样本的总体;2.我们所建立的回归方程一般都有时间性;3.样本采集的范围会影响回归方程的适用范围;4.不能期望回归方程得到的预报值就是预报变量的精确值.事实上,它是预报变量的可能取值的平均值.探究新知问题4本节我们学习了哪些分析模型的回归效果方法?(2)残差平方和(1)残差分析好的回归方程对应的残差散点图应是均匀地分布在横轴两侧的带状区域内.且带状区域越窄,说明模型拟合效果越好.列残差表画残差图(3)决定系数R2法残差平方和越小,说明模型拟合效果越好.R2越大,说明模型拟合效果越好.探究新知建立非线性经验回归模型的基本步骤:1.确定研究对象,明确哪个是解释变量,哪个是响应变量;2.由经验确定非线性经验回归方程的模型;3.通过变换,将非线性经验回归模型转化为线性经验回归模型;4.按照公式计算经验回归方程中的参数,得到经验回归方程;5.消去新元,得到非线性经验回归方程;6.得出结果后分析残差图是否有异常.探究新知非线性回归分析(1)指数型函数y=ebx+a类①函数y=ebx+a

的图象,如图所示线性回归分析②两边取对数得lny=lnebx+a,即

lny=bx+a令z=lny,把原始数据(x,y)转化为(x,z),再根据求解线性回归模型的方法求出a,b.(2)对数型函数y=blnx+a

类①函数y=blnx+a的图象,如图所示②设u=lnx,原方程可转化为

y=bu+a把原始数据(x,y)转化为(u,y),再根据求解线性回归模型的方法求出a,b.探究新知[2020全国卷I-5]某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)得到下面的散点图:由此散点图,在10°C至40°C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()课堂练习

x2023252730z22.4334.6对数变换z=lny练习2.2020年初,新型冠状病毒(COVID-19)引起的肺炎疫情爆发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如下表所示:由表格可得y

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论