高中数学回归_课件苏教版选修1-2_第1页
高中数学回归_课件苏教版选修1-2_第2页
高中数学回归_课件苏教版选修1-2_第3页
高中数学回归_课件苏教版选修1-2_第4页
高中数学回归_课件苏教版选修1-2_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、回归分析回归分析对一作直线运动的质点的运动过程观测了对一作直线运动的质点的运动过程观测了8 8次,次,得到如下表所示的数据:得到如下表所示的数据:问题情境:问题情境:时刻时刻 x/s12345678位置观测值位置观测值 y/cm5.57.510.011.715.716.117.021.1 问题:试估计问题:试估计x为为9s时的位置时的位置y的值是多少?的值是多少?0246810510152025方法是:先作出散点图,如下所示方法是:先作出散点图,如下所示从图中我们看出点呈直线趋势,即时间从图中我们看出点呈直线趋势,即时间x与观测值与观测值y之间之间有着较好的线性关系。再根据有着较好的线性关系。

2、再根据数学数学(必修(必修3)的线)的线性回归的系数公式得线性回归方程为:性回归的系数公式得线性回归方程为: 那么问题就解决了!那么问题就解决了!xy1214. 25361. 36287.22,9yx则令学生活动:学生活动: 这个结果是否一定很准确?为什么? 结果不准确,而是存在一些误差,其原因有:所用的确定型函数不恰当忽略了某些因素的影响存在观测误差6287.22, 9yx则令 注:注:两个相互联系的变量之间的关系大体有两两个相互联系的变量之间的关系大体有两种:一是确定性函数关系,另一个是非确定性种:一是确定性函数关系,另一个是非确定性关系(如相关关系)关系(如相关关系)建构数学:建构数学:

3、用 表示上述两个变量x与y关系,也称为线性回归模型。其中是确定性函数关系, 表示随机误差 。 bxaybxay对于一个问题来说,如果用 这样的模型表示两个变量的关系,那么(1)这个模型合理吗?)这个模型合理吗?(2)如果模型合理,又如何求出其中的)如果模型合理,又如何求出其中的a与与b的值?的值?bxay先解决问题(先解决问题(2 2):):如何求如何求a a与与b b的精确值?的精确值? 设有n对数据 先描出散点图(部分)如下所示:)3 , 2 , 1)(,(niyxii0246810510152025ABD.c图中每一个点,都有一对应的随机误差)(iiibxay我们希望总误差最小,即下式值

4、最小 而此时求出的a与b值可作为较精确的值, 通常记为 计算公式为:(1) niiiniiabxy1212)(此处为最小二乘法(见此处为最小二乘法(见数学数学必修必修3)ba与121()()()niiiniixxyybxxayb x 也可以化为 1221( )niiiniix ynx ybxn xayb xxbay 称为线性回归方程,对应的直线为回归直线, 为回归截距, 为回归系数, 为回归值。a by xy1214. 25361. 3数学应用数学应用1:例1:下表给出了我国从1949年到1999年的人口数据资料,根据表中数据估计我国2004年的人口数。年份(x)194919541959196

5、41969197419791984198919941999人口数/百万(y)5426036727058079099751035110711771246求回归方程步骤:求回归方程步骤:(1 1)作散点图(有样本点是否呈直线趋势来判断两个)作散点图(有样本点是否呈直线趋势来判断两个变量是否线性相关)变量是否线性相关)(2 2)根据公式求回归系数)根据公式求回归系数 和回归截距和回归截距(3 3)写出回归方程,根据需要进行预测估计)写出回归方程,根据需要进行预测估计a b简解:作出散点图发现点在一条直线附近,可以用来表示变量x与y关系,根据公式(1)算得则线性回归方程为从而估计出2004年的人口数。

6、591.527453.14abxy453.14591.527bxay再解决问题(再解决问题(1 1):):检验模型检验模型是否合理?是否合理? 对随机抽取的n对数据 样本相关系数样本相关系数r的计算公式为(2))3 , 2 , 1)(,(niyxii1222211( ) )( ) )niiinniiiix ynx yrxn xyn y称为对两个变量的相关性检验称为对两个变量的相关性检验相关系数相关系数r的性质:的性质:(1) 1r (2) 越接近于越接近于1,x与与y的线性相关的线性相关 程度越强;程度越强;r(3) 越接近于越接近于0,x与与y的线性相关的线性相关程度越弱;程度越弱;r对对r

7、进行显著性检验,步骤如下:进行显著性检验,步骤如下:(1)提出统计假设)提出统计假设 :变量:变量x, y不具有线性不具有线性 相关关系相关关系(2)如果以)如果以95%的把握做判断,通过课本的把握做判断,通过课本93页页的的附录附录1查出一个查出一个r的临界值的临界值 (其中(其中1-0.95=0.05称为检验水平)称为检验水平)(3)计算样本相关系数)计算样本相关系数r(4)做出统计判断:)做出统计判断:若若 则否定假设则否定假设 ,表明有表明有95%的的 把握认为变量把握认为变量x, y之间具有线性相关关系;之间具有线性相关关系;若若 则不拒绝假设,即没有充分理由则不拒绝假设,即没有充分

8、理由认为变量认为变量x, y具有线性相关关系具有线性相关关系0H05. 0r05.0rr 0H05.0rr 对于刚才讲的例题对于刚才讲的例题1,可以这样检,可以这样检验:验:(1)提出统计假设)提出统计假设 :变量:变量x, y不具有线性相关关系不具有线性相关关系(2)由)由0.05与与 在课本在课本93页查得页查得(3)根据公式()根据公式(2)计算得线性相关系数为)计算得线性相关系数为r =0.998(4)因为)因为|r| =0.9980.602,所以有,所以有95%的把握认为变量的把握认为变量 x, y具有线性相关关系,即所求出的线性方程是有意义的具有线性相关关系,即所求出的线性方程是有

9、意义的0H2n602. 005. 0r例例2:随机抽取:随机抽取8对母女的身高数据,试根据这对母女的身高数据,试根据这些数据探讨些数据探讨y与与x之间的关系。之间的关系。母亲身高母亲身高x/cm154157158159160161162163女儿身高女儿身高y/cm155156159162161164165166数学应用数学应用2:简解:作出散点图发现点在一条直线附近, 几个值都可以算出来(通过计算器计算) 又 认为x与y具有线性关系又由公式(1)得则回归方程为,11212niiiniiniiyxyxyx1222211( ) )( ) )niiinniiiix ynxyrxn xyn y963. 0963. 0707. 005. 0r191.53345. 1abxy345. 1191.53提醒:提醒:在用公式(在用公式(2)计算样本相关系数)计算样本相关系数r时,需要根据时,需要根据公式特点先求出公式特点先求出,11212niiiniiniiyxyxyx回顾反思:回顾反思:1.判断两个变量是否具有线性相关关系,可以通过散点图或者进行相关性检验判断。2.对具有线性关系的两个变量,他们的回归方程通过公式(公式(1 1)来求出,方程到底是否有意义还需要进行相关性检验(用(用到公式(到公式(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论