《回归分析基本思想及其初步应用(第3课时)》教学设计_第1页
《回归分析基本思想及其初步应用(第3课时)》教学设计_第2页
《回归分析基本思想及其初步应用(第3课时)》教学设计_第3页
《回归分析基本思想及其初步应用(第3课时)》教学设计_第4页
《回归分析基本思想及其初步应用(第3课时)》教学设计_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1/1选修1-23.1回归分析基本思想及其初步应用第三课时(谷杨华)一、教学目标1.核心素养:通过学习回归分析的基本思想及其初步应用,初步形成基本的数据分析能力.学习目标(1)1.1.3.1温习线性回归模型,.理解建立回归模型的基本步骤.(2)1.1.3.2通过非线性回归分析,能将非线性回归模型转化为线性回归模型.(3)1.1.3.3通过非线性回归分析,判断几种不同模型的拟合程度.3.学习重点通过非线性回归分析,能将非线性回归模型转化为线性回归模型.4.学习难点通过非线性回归分析,判断几种不同模型的拟合程度二、教学设计(一)课前设计1.预习任务 任务1 阅读教材P6-P8,思考在回归分析中,建立回归模型的基本步骤是什么? 任务2 当两个变量不呈线性相关关系时,如何建立回归模型?预习自测1.有下列数据:x123y35.9912.01下列四个函数中,模拟效果最好的为()A.B.C.D.解:A2.已知回归方程,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和是()A.0.01B.0.02C.0.03D.0.04解:C(二)课堂设计1.知识回顾(1)线性回归方程:,其中.,(2)线性回归模型:y=bx+a+e其中a和b为模型的未知参数,e称为随机误差.(3)数据点和它在回归直线上相应位置的差异是随机误差的效应,称为残差.由,得.(4)相关系指数:(5)是刻画回归效果的量,除了表示回归模型的拟合效果,也表示解释变量和预报变量的线性相关关系(在线性回归模型中).越大,说明残差平方和越小,模型的拟合效果越好,在线性回归模型中,越接近于1,回归的效果越好(因为越接近于1,表示解释变量和预报变量的线性相关性越强)2.问题探究问题探究一建立回归模型的基本步骤是什么? ●活动一归纳提升,总结一般方法例1某城区为研究城镇居民月家庭人均生活费支出和月人均收入的相关关系,随机抽取10户进行调查,其结果如下:月人均收入x/元3003904205205707007608008501080月人均生活费y/元255324335360450520580600630750试预测人均月收入为1100元和人均月收入为1200元的两个家庭的月人均生活费.【知识点:线性回归,线性相关关系】详解:作出散点分布图如图,由图可知,月人均生活费与人均收入之间具有线性相关关系.通过计算可知,,,,所以,所以回归直线方程为计算相关系数得r=0.993136,故月人均收入与月人均生活费之间具有显著相关关系.作残差图如图,由图可知,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.计算相关指数得=0.9863,说明城镇居民的月人均生活费的差异有98.63%是由月人均收入引起的.由以上分析可知,我们可以利用回归方程来作为月生活费的预报值.将x=1100代入回归方程得y=784.59元;将x=1200代入回归方程得y=850.58元.故预测月人均收入分别为1100元和1200元的两家庭的月人均生活费分别为784.59元和850.58元.点拨:建立回归模型的基本步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出解释变量和预报变量的散点图,观察它们之间的关系(是否存在线性关系等).(3)由经验确定回归方程的类型(如果我们观察到诗句呈线性关系,则选用线性回归方程).(4)按一定的规则(如最小二乘法)估计回归方程中的参数.(5)得出结论后分析残差图是否有异常(如个别数据对应的残差绝对值过大,残差呈现不随机的规律性等),若存在异常,则检查数据是否有误或模型是否合适等.问题探究二若两变量为非线性相关关系,如何建立回归模型?重点、难点知识★▲●活动一整合旧知,发现新问题当两个变量呈线性相关关系时,我们通过模拟线性回归模型,用回归分析的基本思想对两个变量进行研究.若当有些变量间的关系并不是线性相关,怎样确定回归模型?例2一只红铃虫的产卵数y和温度x有关,现收集了7组观测数据列于下表中,试建立y与x之间的回归方程.编号1234567温度x/°C21232527293235产卵数y/个711212466115325【知识点:线性回归,线性相关关系】详解:根据收集数据,作散点图:●活动二观察发现,寻找新模型样本点并没有分布在某个带状区域内,因此两个变量不呈线性相关关系,即不能直接用线性回归方程来建立两个变量之间的关系.怎样确定回归模型?首先要作出散点图,如果散点图中的样本点并没有分布在某个带状区域内,则两个变量不呈现线性相关关系,不能直接利用回归方程来建立两个变量之间的关系,根据已有的函数知识,观察样本点是否呈指数函数关系或二次函数关系,选定适当的回归模型.根据已有的函数知识,从散点图中可以看到样本点分布在某一条指数函数曲线的周围.●活动三非线性转化为线性问题如果两个变量呈现非线性相关关系,怎样求出回归方程?可以通过对解释变量进行变换,如对数变换或平方变换,先得到另外两个变量间的回归方程,再得到所求两个变量的回归方程.现在,我们通过对数变换把指数关系变为线性关系,即对两边取自然对数令,建立z与x之间的线性回归方程分析x与z之间的关系,通过画散点图(如下图),可知x与z之间是存在着线性回归关系,可以用最小二乘法求出线性回归方程z=a+bx.由表1的数据可以得到变换后的样本数据表x21232527293235z1.9462.3983.0453.1784.1904.7455.784列表计算出各个量编号1234567合计温度x/°C21232527293235192产卵数y/个711212466115325569z=lny1.9462.3983.0453.1784.1904.7455.78425.285xi2441529625729841102412255414xizi40.955.276.185.8121.5151.8202.4733.727.4293.6125414733.71问题探究三能否用其它模型来拟合上述问题?如何判断各种的模型的拟合效果? ●活动一二次曲线模型样本点还可以看作是分布在二次函数曲线的周围.,建立y与t之间的线性回归方程.分析y与t之间的关系,通过画散点图(如下图),可看到y与t的散点图并不分布在一条直线的周围,即不宜用线性回归方程来拟合它,即不宜用二次曲线来拟合y与x之间的关系,这个结论还可以用残差分析得到.●活动二对比提升为比较两个不同模型的残差,需建立相应的回归模型,用线性回归模型拟合回归方程.所以,即y关于x的二次回归方程为.●活动三残差分析指数回归模型与二次回归模型中哪个能更好地刻画红铃虫的产卵数y与温度x的关系?通过什么数据说明?一般在参数个数一定的条件下,相关指数越大或残差平方和越小说明模型拟合得越好.计算每个模型的相关指数,并进行模型的比较.指数函数模型的相关指数二次函数模型的相关指数从相关指数的计算结果来看,指数函数模型的比二次函数模型的更接近于1,所以指数函数模型的回归效果好.再从残差图看:从图中可看出指数函数模型的残差点比较均匀地落在水平的带状域中,所以指数函数模型拟合精度较二次函数模型的高.点拨:归纳判断模型拟合效果的方法:(1)可以通过变换后的散点图观察两个新变量之间是否存在线性回归方程;(2)通过残差分析比较两种模型的拟合效果.一般情况下,比较两个模型的残差比较困难(某些样本点上一个模型的残差的绝对值比另一个模型的小,而另一些样本点的情况则相反),故通过比较两个模型的残差的平方和的大小来判断模型的拟合效果.残差平方和越小的模型,拟合的效果越好.3.课堂总结【知识梳理】(1)建立回归模型的基本步骤①确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.②画出解释变量和预报变量的散点图,观察它们之间的关系(是否存在线性关系等).③由经验确定回归方程的类型(如果我们观察到诗句呈线性关系,则选用线性回归方程).④按一定的规则(如最小二乘法)估计回归方程中的参数.⑤得出结论后分析残差图是否有异常(如个别数据对应的残差绝对值过大,残差呈现不随机的规律性等),若存在异常,则检查数据是否有误或模型是否合适等.(2)归纳判断模型拟合效果的方法:①可以通过变换后的散点图观察两个新变量之间是否存在线性回归方程;②通过残差分析比较两种模型的拟合效果.一般情况下,比较两个模型的残差比较困难(某些样本点上一个模型的残差的绝对值比另一个模型的小,而另一些样本点的情况则相反),故通过比较两个模型的残差的平方和的大小来判断模型的拟合效果.残差平方和越小的模型,拟合的效果越好. 【重难点突破】(1)如果两个变量不呈现线性相关关系,常见的两个变量间的关系还有指数函数关系、二次函数关系.(2)两个变量间的非线性关系可以通过对解释变量的变换(对数变换、平方变换等)转化为另外两个变量的线性关系.(3)比较不同模型的拟合效果,可以通过残差平方和的大小,相关指数的大小来判断.4.随堂检测1.变量x,y的散点图如图所示,那么x,y之间的样本相关系数r最接近的值为()A.1B.-0.5C.0D.0.5答案:C解析:【知识点:线性回归,线性相关关系】2.某学校开展研究性学习活动,某同学获得一组实验数据如下表:x1.99345.16.12y1.54.047.51218.01对于表中数据,现给出下列拟合曲线,其中拟合程度最好的是()A.y=2x-2B.y=(eq\f(1,2))xC.y=log2xD.y=eq\f(1,2)(x2-1)【知识点:线性回归,线性相关关系】解:D4.已知方程eq\o(y,\s\up10(^))=0.85x-82.71是根据女大学生的身高预报她的体重的回归方程,其中x的单位是cm,eq\o(y,\s\up10(^))的单位是kg,那么针对某个体(160,53)的残差是()A.-0.29B.0.29C.-0.58D.3【知识点:线性回归,线性相关关系】解:A5.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线的周围,令,求得线性回归方程为=0.25x-2.58,则该模型的回归方程为________.【知识点:线性回归,线性相关关系】解:∵=0.25x-2.58,z=lny,∴(三)课后作业基础型自主突破1.两个变量有线性相关关系且残差的平方和等于0,则()A.样本点都在回归直线上B.样本点都集中在回归直线附近C.样本点比较分散D.不存在规律【知识点:线性回归,线性相关关系】解:A2.散点图在回归分析中的作用是()A.查找个体个数B.比较个体数据大小关系C.探究个体分类D.粗略判断变量是否相关【知识点:线性回归,线性相关关系】解:D3.为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是().A.l1和l2有交点(s,t)B.l1与l2相交,但交点不一定是(s,t)C.l1与l2必定平行D.l1与l2必定重合【知识点:线性回归,线性相关关系】解:A都过样本中心点(s,t),但斜率不确定.4.甲、乙、丙、丁四位同学各自对A,B两变量做回归分析,分别得到散点图与残差平方和如下表甲乙丙丁散点图残差平方和115106124103哪位同学的实验结果体现拟合A,B两变量关系的模型拟合精度高?()A.甲B.乙C.丙D.丁【知识点:线性回归,线性相关关系】解:D5.在研究气温和热茶销售杯数的关系时,若求得相关指数R2≈________,表明“气温解释了85%的热茶销售杯数变化”或者说“热茶销售杯数差异有85%是由气温引起的”.【知识点:线性回归,线性相关关系】解:0.85能力型师生共研6.若一函数模型为,为将转化为关于的线性回归方程,则需作的变换=()A.B.C.D.以上都不对【知识点:线性回归,线性相关关系】答案:C解析:关于的线性回归方程,实际上就是关于的一次函数,又因为7.某学生在高三学年最近九次考试中的数学成绩加下表:第x考试123456789数学成绩y(分)121119130106131123110124116设回归直线方程y=bx+a,则点(a,b)在直线x+5y﹣10=0的()A.左上方B.左下方C.右上方D.右下方【知识点:线性回归,线性相关关系】解:C8.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下:加工零件x(个)1020304050加工时间y(分钟)6469758290经检验,这组样本数据具有线性相关关系,那么对于加工零件的个数x与加工时间y这两个变量,下列判断正确的是()A.成正相关,其回归直线经过点(30,75)B.成正相关,其回归直线经过点(30,76)C.成负相关,其回归直线经过点(30,76)D.成负相关,其回归直线经过点(30,75)【知识点:线性回归,线性相关关系】解:B探究型多维突破9.下表提供了甲产品的产量(吨)与利润(万元)的几组对照数据.(1)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(2)计算相关指数的值,并判断线性模型拟合的效果.参考公式:,【知识点:线性回归方程的算法;,回归方程的应用】(1)∴,,∴,∴∴关于的线性回归方程(2)∴∴线性模型拟合的效果较好10.某公司采用众筹的方式募集资金,开发一种创新科技产品,为了解募集资金(单位:万元)与收益率之间的关系,对近个季度筹到的资金和收益率的数据进行统计,得到如下数据表:(1)通过绘制并观察散点图的分布特征后,分别选用与作为众筹到的资金与收益率的拟合方式,再经过计算,得到这两种拟合方式的回归方和下表统计数值,试运用相关指数比较以上两回归方程的拟合效果;(2)根据以上拟合效果较好的回归方程,解答:预测众筹资金为万元时的收益率.(精确到)【知识点:线性回归,线性相关关系】解:(1)由已知,得对于方程,相关指数;对于方程,相关指数,所以方程的拟合效果更好.(2)当时,;(四)自助餐1.变量x与y之间的回归方程表示()A.x与y之间的函数关系B.x与y之间的不确定性关系C.x与y之间的真实关系形式D.x与y之间的真实关系达到最大限度的吻合【知识点:线性回归,线性相关关系】解:D2.已知回归方程,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和是()A.0.01B.0.02C.0.03D.0.04【知识点:线性回归,线性相关关系】解:C3.一台机器由于使用时间较长,但还可以使用,它按不同的转速生产出来的某机器零件有一些会有缺点,每小时生产有缺点零件的多少随机器运转的速度而变化,下表是抽样试验结果:转速x/(rad/s)1614128每小时生产有缺点的零件数y/件11985若实际生产中,允许每小时的产品中有缺点的零件数最多为10个,那么机器的转速应该控制所在的范围是()A.10转/s以下B.15转/s以下C.20转/s以下D.25转/s以下【知识点:线性回归,线性相关关系】解:B4.已知x,y的取值如下表:x0134y2.24.34.86.7若x,y具有线性相关关系,且回归方程为=0.95x+a,则a的值为()A.0.325B.2.6C.2.2D.0【知识点:线性回归,线性相关关系】解:B由已知得=2,=4.5,而回归方程过点,则4.5=0.95×2+a,∴a=2.6.5.某工厂为了新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单位x(元)456789销量y(件)908483807568由表中数据,求得线性回归方程为,若在这些样本点中任取一点,则它在回归直线左下方的概率为()A.eq\f(1,6)B.eq\f(1,3)C.eq\f(1,2)D.eq\f(2,3)【知识点:线性回归,线性相关关系】解:B6.某企业对自己的拳头产品的销售价格(单位:元)与月销售量(单位:万件)进行调查,其中最近五个月的统计数据如下表所示:价格99.510.511销售量11865由散点图可知,销售量与价格之间有较强的线性相关关系,其线性回归直线方程是:()A.10B.5C.13D.2【知识点:线性回归,线性相关关系】解:A7.以下四个命题,其中正确的序号是________.①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程中,当解释变量x每增加一个单位时,预报变量平均增加0.2个单位;④对分类变量X与Y的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大.【知识点:线性回归,线性相关关系】解:②③①是系统抽样;对于④,随机变量K2的观测值k越小,说明两个相关变量有关系的把握程度越小.8.对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i=1,2,…,8),其线性回归方程是,且x1+x2+x3+…+x8=2(y1+y2+y3+…+y8)=6,则实数的值是________.【知识点:线性回归,线性相关关系】答案:解析:依题意可知样本点的中心为eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(3,4),\f(3,8))),则,解得.9.某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与医院抄录了至月份每月日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:日期月日月日月日月日月日月日昼夜温差就诊人数(个)该兴趣小组确定的研究方案是:先从这六组数据中选举组,用剩下的组数据求线性回归方程,再用被选取的组数据进行检验.(1)若选取的是月与月的两组数据,请根据至月份的数据,求出关于的线性回归方程;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?(参考公式:)【知识点:线性回归,线性相关关系】解:(1)由数据求得,由公式求得,.所以回归方程是.(2)当时,;同样,当时,,所以,该小组所得线性回归方程是理想的.10.某种书每册的成本费(元)与印刷册数(千册)有关,经统计得到数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论