版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
3.1.1回归分析的根本思想及其初步应用【教学目标】1.了解回归分析的根本思想方法及其简单应用.会解释解释变量和预报变量的关系.【教学重难点】教学重点:回归分析的应用.教学难点:a、b公式的推到.【教学过程】一、设置情境,引入课题引入:对于一组具有线性相关关系的数据(x,y),(x,y),(x,y),•••,(x,y).其回归直线112233nn方程的截距和斜率的最小二乘法估计公式分别为:x=区xy=区y(x,y)称为样本点的中心。ninii=1i=1如何推到着两个计算公式二、引导探究,推出公式从已经学过的知识,截距a和斜率b分别是使Q(a,B)丄(y-Px-a)2取最小值时iii=1a,P的值,由于n^____Q(a,p)=乙[y—Px—(y—Px)+(y-px)-a]2iii=1=乙{[y-Px-(y-Px)]2+2[y-Px-(y-Px)]•[(y-Px)-a]+[(y-Px)-a]2}iiiii=1xiii=1ii=乙[y-Px-(y-Px)]2+2乙[y-Px-(y-Px)]•[(y-Px)-a]+n(y-Px-a)xiii=1iii=1因为所以Q(a,卩)=Q(a,卩)=乙[y-卩x-(y-卩x)]2+n[(y-卩x)-a]2xiii=1Enn*'',(x-x)2-2P乙(x-x)(y-y)+乙(y-y)2+n(y-Px-a)2iiiii=1i=1i=1__(x-x)(y-y)[乙(x-x)(y-y)]2niiii、=n(y-Px-a)2+厶(x-x)2[P-i=1、、]2―+厶(y-y)2ii=1iiii=1在上式中,后两项和a,卩无关,艺(x-x)2艺(x-x)2iii=1i=1而前两项为非负数,因此要使Q取得最小值,当且仅当前两项的值均为0.,既有通过上式推导,可以训练学生的计算能力,观察分析能力,能够很好训练学生数学能力,必须在老师引导下让学生自己推出。所以:a=y-bxb所以:a=y-bxb二i=1--x)(y-y)i艺(x-x)2ii=1三、例题应用,剖析回归根本思想与方法例1、从某大学中随机选取8名女大学生,其身高和体重的数据如下列图:编号12345678身高/cm「165165157170175165155170体重/kg4857505464614359画出以身高为自变量x,体重为因变量y的散点图求根据女大学生的身高预报体重的回归方程求预报一名身高为172cm的女大学生的体重解:〔1〕由于问题中要求根据身高预报体重,因此选取身高为自变量x,体重为因变量y作散点图b=0.849,a=-85.712⑵回归方程:y=0.849x-85.712.⑶对于身高172cm的女大学生,由回归方程可以预报体重为:四、当堂练习观察两相关变量得如下数据x—1—2—3—4—553421y—9—7—5—3—115379求两个变量的回归方程.答:tx=0,y=0,昱x2=110,昱xy=110,iiii=1i=1所以所求回归直线方程为y=x五、课堂小结1・a、b公式的推到过程。2.y=bx+a通过(x,y)六、布置作业课本90页习题11.1回归分析的根本思想及其初步应用
课前预习学案一、预习目标通过截距a与斜率b分别是使QQ,卩)=£(y-Px-a)2取最小值时,求a,卩的值。iii=1二、预习内容:对于一组具有线性相关关系的数据(X,y),(x,y),(x,y),•••,(x,y).其回归直线方112233nn程的截距和斜率的最小二乘法估计公式:a=,b=x=,y=3.样本点的中心三、提出问题如何使Q(a,卩)值最小,通过观察分析式子进行试探推到课内探究学案一、学习目标了解回归分析的根本思想和方法培养学生观察分析计算的能力二、学习重难点学习重点:回归方程y=bx+a,学习难点:a、b公式的推到三、学习过程1•使Q(a,卩)值最小时,a,卩值的推到艺(x-x)(y-y)2.结论卩=—a=y-px乙(x-x)2ii=1y=bx+a中a和b的含义是什么4.(x,y)一定通过回归方程吗四、典型例题例1•研究某灌溉倒水的流速y与水深x之间的关系,测得一组数据如下:水深X〔m〕1.401.501.601.701.801.902.002.10流速y(m/s)1.701.79丄881.952.032.102.162.21(1)求y与x的回归直线方程;
⑵预测水深为1.95m时水的流速是多少分析:〔1〕y与x的回归直线方程为y=0.733x+0.6948⑵当水深为1.95m时,可以预测水的流速约为2.12m/s五、当堂练习1•对两个变量y和x进行回归分析,得到一组样本数据:(x,y),(x,y),(x,y),•••,(x,y).112233nn那么以下说法不正确的选项是〔〕A.由样本数据得到的回归方程y=bx+a必过样本中心(x,亍)B•残差平方和越小的模型,拟合的效果越好c•用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好D.假设变量y与x之间的相关系数r=-0.9362,那么变量y与x之间具有线性相关关系2•某地每单位面积菜地年平均使用氮肥量xkg与每单位面积蔬菜年平均产量yt之间的关系有如下数据:年份19851986198719881989199019911992x(kg)7074807885929095y(t)5.16.06.87.89.010.210.012.0年份1993199419951996199719981999x(kg)92108115123130138145y(t)11.511.011.812.212.512.813.0假设x与y之间线性相关,求蔬菜年平均产量y与使用氮肥量x之间的回归直线方程,并估计每单位面积蔬菜的年平均产量.〔x=101,yq10.11,为x2=161,为xy=I6%.8〕iiii=1i=1解:设所求的回归直线方程为y=bx+a,那么16076・8一155业空16076・8一155业空Q0.0937,a161125一1551012亍一bx=10.11-0.09375101q0.6463.ii4=为x2一15x2ii=1所以,回归直线方程为:y=0.0937x+0.6463当x=150kg时,每单位面积蔬菜的年平均产量y=0.09375150+0.6463q14.701(kg)课后练习与提咼1、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x〔吨〕与相应的生产能耗y(吨标准煤)的几组对照数据:
x3456y2.5344.5⑴请画出上表数据的散点图;⑵请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据〔2〕求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤〔参考数值:3x2.5+4x3+5x4+6x4.5=66.5〕解:〔1〕由题设所给数据,可得散点图如以下列图〔2〕由对照数据,计算得:工X2i工X2ii=1=86,X=3+4+5+6=4.5,亍=2.5+3+4+4.54工xy=66.5iii=1所以,由最小二乘法确定的回归方程的系数为:因此,所求的线性回归方程为y=0.7x+0.35由〔2〕的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为90—(0.7x100+0.35)=19.65〔吨标准煤〕。1.2回归分析的根本思想及其初步应用回归分析的根本思想及其初步应用【教学目标】1•了解相关系数r;2了解随机误差;3会简单应用残差分析【教学重难点】教学重点:相关系数和随机误差教学难点:残差分析应用。【教学过程】一、设置情境,引入课题上节例题中,身高172cm女大学生,体重一定是60kg吗如果不是,其原因是什么二、引导探究,发现问题,解决问题1y=0.849x—85.712对于b=0.849是斜率的估计值,说明身高x每增加1个单位,体重就,说明体重与身高具有的线性相关关系。2如何描述线性相关关系的强弱(1)r>0说明两个变量正相关;〔2〕r<0说明两个变量负相关;〔3〕r的绝对值越接近1,说明相关性越强,r的绝对值越接近0,说明相关性越弱。〔4〕当r的绝对值大于0.75认为两个变量具有很强的相关性关系。3身高172cm的女大学生显然不一定体重是60.316kg,但一般可以认为她的体重接近于60.316kg.样本点与回归直线的所有的样本点不共线,而是散布在某一条直线的附近,该直线表示身高与体重的关系的线性回归模型表示y=bx+a+ee是y与y=bx+a的误差,e为随机变量,e称为随机误差。
E(e)=O,D(e)=o2>0.④D(e)越小,预报真实值y的精度越高。⑤随机误差是引起预报值y与真实值y之间的误差之一。⑥a,b为截距和斜率的估计值,与a,b的真实值之间存在误差,这种误差也引起y与真实值y之间的误差之一。4思考产生随机误差项e的原因是什么5探究在线性回归模型中,e是用y预报真实值y的误差,它是一个不可观测的量,那么应该怎样研究随机误差如何衡量预报的精度①D(e)2来衡量随机误差的大小。②e=y-y③e=y-y=y-bx-a1n—2i=1iii1n—2i=11Q(a,b)(n>2)n—2入O⑤Q(a,b)称为残差平方和,。2越小,预报精度越高。6思考当样本容量为1或2时,残差平方和是多少用这样的样本建立的线性回归方程的预报误差为0吗7残差分析区(y-y)2ii判断原始数据中是否存在可疑数据;②残差图③相关指数R2=1-賁Z(y-y)2ii=1R2越大,残差平方和越小,拟合效果越好;R2越接近1,说明回归的效果越好。8建立回归模型的根本步骤:确定研究对象,明确哪个变量时解释变量,哪个变量时预报变量。画出确定好的解释变量和预报变量得散点图,观察它们之间的关系;由经验确定回归方程的类型;按一定规那么估计回归方程中的参数;得出结果后分析残差图是否异常。三、典型例题使用年数x12345678910年均价格y〔美元〕2651194314941087765538484290226204分析:由表格先画出散点图,可以看出随着使用年数的增加,轿车的平均价格在递减,但
不在一条直线附近,但据此认为y与x之间具有线性回归关系是不科学的,要根据图的形状进行合理转化,转化成线性关系的变量间的关系。解:作出散点图如以下列图可以发现,各点并不是根本处于一条直线附近,因此,y与x之间应是非线性相关关系.与已学函数图像比较,用y=e处+a来刻画题中模型更为合理,令Z=Iny,那么Z=bx+a,题中数据变成如下表所示:X12345678910y7.8837.572「7.3096.9916.6406.2886.1825.6705.4215.318在散点图中可以看出变换的样本点分布在一条直线附近,因此可以用线性回归模型方程拟合,由表中数据可得r0.996,r>0.75,认为x与z之间具有线性相关关系,由表中数据的b--0.298,a沁8.165,所以z=-0.298x+8.165,最后回代z=lny,艮卩y=e—0・298x+8.165四、当堂练习:1两个变量y与X的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是〔〕A模型1的R2=0.98B模型2的R2=0.80C模型3的R2=0.50d模型4的R2=0.25答案A五、课堂小结1相关系数r和相关指数R22残差分析六、作业布置课本90页习题31.2回归分析的根本思想及其初步应用回归分析的根本思想及其初步应用课前预习学案一、预习目标1了解相关系数r和相关指数R22了解残差分析3了解随机误差产生的原因二、预习内容1相关系数r艺(x—x)(y—y)ii①r=r>0说明两个变量;r<0说明两个变量;r的绝对值越接近1,说明两个变量相关性,r的绝对值越接近0,表示两个变量之间当r的绝对值大于认为两个变量具有很强的相关性关系。2随机误差①在线性回归模型:y=bx+a+e中,a和b为模型的,e是y与y=bx+a之间的,通常e为随机变量,称为随机误差,它的均值E(e)二,方差D(e)二e0y=bx+a+e②线性回归模型的完整表达式为f、c/、随机误差e的方差Q2越小,通过回〔E(e)=O,D(e)=a2归直线y=bx+a预报真实值y的精确度3残差分析残差对于样本点(x,y),(x,y),(x,y),•••,(x,y)•而言,相应于它们的随机误差为112233nne==(i=1,2,3,…,n)i其估算值为e==(i=1,2,3,…,n).称为相应于点(x,y)的残差。iii残差平方和:类比样本方差估计总体方差的思想,可以用b2==工(x-x)(y-y)ii〔n>2〕作为b2的估计量,其中a=y-bx,b=**,Q(a,b)称为残差乙(x-x)2ii=1平方和,可以用b2衡量回归方程的预报精度,b2越小,预报精度用图形来分析残差特性:用R2=1-来刻画回归的效果。三、提出问题1随机误差产生的原因是什么2如何建立模型拟合效果最好课内探究学习一、学习目标了解相关系数和相关指数的关系.2理解随机误差产生的原因.33会进行简单的残差分析二、学习重难点学习重点1相关系数r2相关指数R23随机误差学习难点残差分析的应用三、学习过程1相关系数r=r的性质:一3随机误差的定义:4相关指数R2=5R2的性质:6残差分析的步骤:四、典型例题例随着我国经济的快速开展,城乡居民的审核水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查10个家庭,得数据如下:家庭编号123456「78910x收入(千兀)0.81.11.31.51.51.82.02.22.42.8y支出千兀0.71.01.21.01.31.51.31.72.02.5判断家庭平均收入与月平均生活支出是否相关假设二者线性相关,求回归直线方程。思路点拨:利用散点图观察收入x和支出y是否线性相关,假设呈现线性相关关系,可利用公式来求出回归系数,然后获得回归直线方程。解:作散点图观察发现各个数据对应的点都在一条直线附近,所以二者呈现线性相关关系。(2)X=存0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+2.8)=1.74,所以回归方程y=0.8136x+0.004
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 数字技术赋能企业转型升级指南
- 建筑工程项目管理质量控制要点解析
- 社区活动中心管道漏水紧急停水供社区志愿者预案
- 绿色生活主题社区建设方案
- 项目运作中风险防控保障承诺函5篇
- 食品安全质量保障责任承诺书3篇范文
- 交通安全管理及智能交通系统应用
- 销售策略与谈判技巧指导书
- 年度工作计划提交确认函7篇范本
- 五年级上册数学植树问题(两端都栽)
- 2026年1月浙江省高考(首考)思想政治试题(含答案)
- 2026年大学后勤集团办公室文秘招聘笔试写作题
- 高中地理合格考知识提纲2025-2026学年高中地理人教版必修一-二
- GB 17840-1999防弹玻璃
- 高分子化工概述
- 广通股校学员专用技术文字讲义
- 光谱电化学课件
- 燃料供应预警及应急预案(终版)
- 满堂支架拆除技术交底
- 螺栓连接实验-2015.11.20
- DF4内燃机车电路图
评论
0/150
提交评论