北师大版高中数学选修2-3回归分析_第1页
北师大版高中数学选修2-3回归分析_第2页
北师大版高中数学选修2-3回归分析_第3页
北师大版高中数学选修2-3回归分析_第4页
北师大版高中数学选修2-3回归分析_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

回归分析知识结构收集数据(随机抽样)整理、分析数据估计、推断简单随机抽样分层抽样系统抽样用样本估计总体变量间的相关关系用样本的频率分布估计总体分布用样本数字特征估计总体数字特征线性回归分析1、两个变量的关系不相关相关关系函数关系线性相关非线性相关问题1:现实生活中两个变量间的关系有哪些呢?相关关系:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。思考:相关关系与函数关系有怎样的不同?函数关系中的两个变量间是一种确定性关系相关关系是一种非确定性关系函数关系是一种理想的关系模型相关关系在现实生活中大量存在,是更一般的情况问题2:对于线性相关的两个变量用什么方法来刻划之间的关系呢?2、最小二乘估计最小二乘估计下的线性回归方程:回归直线必过样本点的中心3、回归分析的基本步骤:画散点图求回归方程预报、决策这种方法称为回归分析。回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。复习回顾*

用线性回归方程进行回归分析:

(1)画散点图;(2)求回归系数:(3)写回归直线方程,并用方程进行预测说明。任何数据,不管它们的线性相关关系如何,都可以用最小二乘法求出线性回归方程,为使建立的线性回归方程有意义,在利用最小二乘法求线性回归方程之前,先要对变量间的线性相关关系作个判断,通常可以作散点图。但在某些情况下,从散点图中不容易判断变量间的线性关系,另外,如果数据量较大时,画散点图比较麻烦,此时我们有没有其他方法来刻画变量之间的线性相关关系呢?新课探究为解决这个问题,我们可通过计算线性相关系数r,来判断变量间相关程度的大小,计算公式为:新课探究的最小值为:据前面的分析,回归系数使得误差由知,即,则新课探究值越大,误差越小,则变量的线性相关程度就越高;值越接近于0,越大,线性相关程度就越低。当时,,两变量的值总体上呈现同时增加的趋势,则称两变量正相关;当时,,一变量增加,另一变量有减小的趋势,则称两变量负相关;当时,则称两变量线性不相关。相关系数r的性质新课探究相关系数1.计算公式2.相关系数的性质(1)|r|≤1;(2)|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小。负相关正相关思考交流变量的线性相关系数r如何求?我们知道,相关系数的计算公式为:要求r,只需求出相关的量:,,,和。,,可得,,,由数据表,经过计算,可知:这能说明什么??这说明肱骨和股骨有较强的线性相关程度。计算下表变量的线性相关系数r。并观察,通过计算可以发现什么?根据数据列表计算如下:解析:1-5025002-43169-123-34916-12405025053491612643169127502500019100750由表可知:,,则可得,,,你发现什么了??

r=0,则变量间并不存在线性相关关系。即此时建立线性回归方程是没有意义的。实际上,从散点图上我们也可以验证这一点:易看出,几个样本点都落在同一个半圆上,而不是条状分布,此时建立线性回归方程无任何意义,这与相关系数r的计算结果相一致。样本点的分布如何?许多先进国家对驾驶员的培训,大多采用室内模拟教学和训练,而后再进行实地训练并考试,这种方法可以大大节约训练的费用。问题是这种方法有效吗?下表是12名学员的模拟驾驶成绩x与实际考试成绩y的记录(单位:分):试问:两者的相关性如何?请画出散点图,并求出y与x间的线性相关系数。动手做一做x985550877789y956045857587x799894837473y759792807172解答:可求出r=0.9871,说明实际考试成绩y与模拟驾驶成绩x有较强的线性相关程度。拓展思考

相关系数r越大,变量间的线性关系就越强,那么r的值究竟大到什么程度就认为线性关系较强?相关系数r>0正相关;r<0负相关.通常,r∈[-1,-0.75]——负相关很强;r∈[0.75,1]——正相关很强;r∈[-0.75,-0.3]——负相关一般;r∈[0.3,0.75]——正相关一般;r∈[-0.25,0.25]——相关性较弱;相关关系的测度

(相关系数取值及其意义)-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加小结*

线性相关系数r:值越大,误差越小,则变量的线性相关程度就越高;值越接近于0,越大,线性相关程度就越低。*,其中。当时,两变量正相关;当时,两变量负相关;当时,两变量线性不相关。*复习回顾其中复习回顾*

线性相关系数r及性质:值越大,变量的线性相关程度就越高;值越接近于0,线性相关程度就越低。*,其中。当时,两变量正相关;当时,两变量负相关;当时,两变量线性不相关。*1、下表是随机抽取的8对母女的身高数据,试根据这些数据探讨y与x之间的关系。母亲身高女儿身高cm154157158159160161162163cm155156159162161164165166练习解:所以:

所以可以认为与之间具有较强的线性相关的

关系.线性回归模型y=a+bx中线性回归方程为新课讲解下表按年份给出了1981~2001年我国出口贸易量(亿美元)的数据,根据此表你能预测2008年我国的出口贸易量么?从散点图中观察,数据与直线的拟合性不好,若用直线来预测,误差将会很大。而图像近似指数函数,呈现出非线性相关性。分析:考虑函数来拟合数据的变化关系,将其转化成线性函数,两边取对数:即线性回归方程,记1981年为x=1,1982年为x=2,‥变换后的数据如下表:设,则上式变为,对上表数据求线性回归方程得:即:由此可得:,曲线如图:这样一来,预测2008年的出口贸易量就容易多了。将下列常见的非线性回归模型转化为线性回归模型。作变换得线形函数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论