(回归分析的基本思想及其初步应用)人教版高中数学选修2-3教学课件(第3.1课时)_第1页
(回归分析的基本思想及其初步应用)人教版高中数学选修2-3教学课件(第3.1课时)_第2页
(回归分析的基本思想及其初步应用)人教版高中数学选修2-3教学课件(第3.1课时)_第3页
(回归分析的基本思想及其初步应用)人教版高中数学选修2-3教学课件(第3.1课时)_第4页
(回归分析的基本思想及其初步应用)人教版高中数学选修2-3教学课件(第3.1课时)_第5页
已阅读5页,还剩28页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、讲解人:精品课件 时间:2020.6.1PEOPLES EDUCATION PRESS HIGH SCHOOL MATHEMATICS ELECTIVE 2-33.1回归分析的基本思想及其初步应用第3章 统计案例人教版高中数学选修2-3第一页,共三十三页。在数学3中,我们对两个具有线性相关关系的变量利用回归分析的方法进行了研究,其步骤为:画散点图求回归直线方程用直线方程进行预报课前导入第二页,共三十三页。函数关系是一种确定性关系,而相关关系是一种非确定性关系.那么,这节课我们就学习对具有相关关系的两个变量进行统计分析的一种常用方法回归分析.提问:“名师出高徒”这句彦语的意思是什么?有名气的老师

2、就一定能教出厉害的学生吗?这两者之间是否有关?课前导入第三页,共三十三页。探究 对于一组具有线性相关关系的数据 (x1,y1),(x2,y2),(xn,yn), 我们知道回归直线y=bx+a的斜率和截距的最小二乘估计分别为新知探究第四页,共三十三页。其中 称为样本点的中心,你能推导出这两个计算公式吗? 回归直线过样本点的中心新知探究第五页,共三十三页。 从已经学过的知识我们知道,斜距 和斜率 分别是使取最小时 的值.由于 新知探究第六页,共三十三页。继续答题新知探究第七页,共三十三页。这正是我们所要推导的公式.在上式中,后两项和 无关,而前两项为非负数,因此要使Q取得最小值,当且仅当前两项的值

3、均为0,即有新知探究第八页,共三十三页。 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示: 例题1编号12345678身高/cm165165157170175165155170体重/kg 48 57 50 54 64 61 43 59求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重.新知探究第九页,共三十三页。解答第一步:画散点图新知探究第十页,共三十三页。第二步:求回归方程第三步:代值计算 计算器得:故线性回归方程:当x=172时,新知探究第十一页,共三十三页。显然,身高172cm的女大学生的体重不一定是60.316kg,但一般可以认为她

4、的体重在60.316kg左右,下图中的样本点和回归直线的相互位置说明了这一点.探究高为172c的女大学生的体重一定是60.316kg吗?如果不是,其原因是什么?新知探究第十二页,共三十三页。由于所有的样本点不共线,而只是散布在某一条直线的附近,所以身高和体重的关系可用线性回归模型 y=bx+a+e来表示,这里a和b为模型的未知参数,e是y与bx+a之间的误差.通常e为随机变量,称为随机误差.它的均值E(e)=0,方差D(e)= 20,这样线性回归的完整表达式为y=bx+a+eE(e)=0, D(e)= 2.新知探究第十三页,共三十三页。注意存在误差的原因 (1)随机误差,其大小取决于随机误差的

5、方差. 在线性回归模型中,随机误差e的方差 2越小 ,用bx+a预报真实值y的精度越高. (2) 和 为斜率和截距的估计值,它们与真实值a和b之间也存在误差.要牢记!新知探究第十四页,共三十三页。探究在线性回归模型中,e是用bx+a预报真实值y的随机误差,它是一个不可观测的量,那么应该怎样研究随机误差呢?在实际应用中,我们用回归方程 中的 估计bx+a. 由于随机误差e=y-(bx+a),所以 是e的估计值. 对于样本点 (x1,y1),(x2,y2),(xn,yn)新知探究而言,它们的随机误差为ei=yi-bxi-a,i=1,2,n,其估计值为称为相应于点(xi,yi)的残差(residua

6、l).要牢记!第十五页,共三十三页。思考如何发现数据中的错误?如何衡量模型的拟合效果? (1)可以利用残差图来分析残差特性; (2)可以利用.来刻画回归的效果.何为残差图?新知探究第十六页,共三十三页。 残差图 作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.编号12345671020304050607080-10-20-30-40-50-6090100要牢记!新知探究第十七页,共三十三页。 对R2的理解(1)在含有一个解释变量的线性模型中, R2恰好等于相关系数r的平方.(2)对于已经获取的样本数据, R2表达式中的 为确定的数. 因此R2

7、越大,意味着残差平方和越小,即模型的拟合效果越好;反之,越差.要牢记!新知探究第十八页,共三十三页。 用身高预报体重时,需要注意以下问题 (1)回归方程只适用于我们所研究的样本总体; (2)我们所建立的回归方程一般都有时间性; (3)样本取值的范围会影响回归方程的适用范围; (4)不能期望回归方程得到的预报值就是预报变量的精确值.新知探究第十九页,共三十三页。 建立回归模型的基本步骤: (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量; (2)画出解释变量和预报变量的散点图,观察它们之间的关系; (3)由经验确定回归方程的类型; (4)按一定规则估计回归方程中的参数; (5)得出

8、结果后分析残差图是否有异常,若有异常,检查数据是否有误,或模型是否合适等.要牢记!新知探究第二十页,共三十三页。为了对x、Y两个变量进行统计分析,现有以下两种线性模型 和 试比较哪一个模型拟合的效果更好.例题2关于X与Y有如下数据:x24568y3040605070新知探究第二十一页,共三十三页。分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论.84.5%82%,所以甲选用的模型拟合效果较好.解答新知探究第二十二页,共三十三页。1. 某校有学生2000人,其中高三学生500人,为了了解学生身体素质情况,采用按年级

9、分层抽样的方法,从该学生中抽取一个200人的样本,则样本中高三学生的人数为_.解析:本题考查抽样的方法. 由已知抽样比200/2000=1/10,故样本中高三学生数为500*(1/10)=50.课堂练习第二十三页,共三十三页。2.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程 课堂练习第二十四页,共三十三页。(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤试根据(2)求出的线性回归方程,预测生产1

10、00吨甲产品的生产能耗比技改前降低多少吨标准煤?解析: (1)如下图课堂练习第二十五页,共三十三页。 故线性回归方程为y=0.7x+0.35. (3)根据回归方程的预测,现在生产100吨产品消耗的标准煤的数量为0.7100+0.35=70.35. 课堂练习第二十六页,共三十三页。1.选择 (1)下列说法中正确的有:( ) 若r0,则x增大时,y也相应增大; 若r0,则x增大时,y也相应增大; 若r=1或r=-1,则x与y的关系完全对应(由函数关系),在散点图上各个点均在一条直线上 A. B. C. D. C课堂练习第二十七页,共三十三页。(2)对两个变量y与x进行回归分析,分别选择不同的模型,

11、它们的相关系数r如下,其中拟合效果最好的模型是( ) A.模型的相关系数r为0.98 B.模型的相关系数r为0.80 C.模型的相关系数r为0.50 D.模型的相关系数r为0.25A课堂练习第二十八页,共三十三页。(3)对有线性相关关系的两个变量建立的回归直线方程 中,回归系数 ( ) A.可以小于0 B.小于0 C.能等于0 D.只能等于0A课堂练习第二十九页,共三十三页。2.解答题(1)现随机抽取了我校10名学生在入学考试中的数学成绩(x)与入学后的第一次考试中的数学成绩(y),数据如下: 学生号12345678910 x12010811710410311010410599108y84648468696869465771 试问这10个学生的两次数学考试成绩是否具有显著性线性相关关系?课堂练习第三十页,共三十三页。查表得自由度为10-2=8相应的相关关系临界值 由 知,两次数学考试成绩有显著性的线性相关关系.易得则相关系数为解答课堂练习第三十一页,共三十三页。 1.数学知识 (1)建立回归模型及残差图分析的基本步骤; (2)不同模型拟合效果的比较方法; (3)相关指数和残差的分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论