高中数学第一章统计案例1.1回归分析1.1.2相关系数知识导航素材.docx_第1页
高中数学第一章统计案例1.1回归分析1.1.2相关系数知识导航素材.docx_第2页
高中数学第一章统计案例1.1回归分析1.1.2相关系数知识导航素材.docx_第3页
高中数学第一章统计案例1.1回归分析1.1.2相关系数知识导航素材.docx_第4页
高中数学第一章统计案例1.1回归分析1.1.2相关系数知识导航素材.docx_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.1.2 相关系数自主整理判断两个变量之间的线性相关关系的方法有(1)_;(2)_.高手笔记1.假设两个随机变量的数据分别为(x1,y1),(x2,y2),(xn,yn),则变量间线性相关系数r的计算公式为:r=.2.r-1,1,(1)|r|值越大,误差Q越小,变量之间的线性相关程度越高.(2)|r|值越接近0,Q越大,变量之间的线性相关程度越低.(3)当r0时,lxy0,b=0,两个变量正相关;当r0时,lxy0,b=0,两个变量负相关;当r=0时,两个变量线性不相关.3.线性相关系数的计算: 线性相关系数是用来衡量两个变量之间线性相关关系强弱的一个量.计算时一般是在求线性回归方程的基础上,一并计算出,只是在列表时需列出yi和yi2栏目,通常当r大于0.75时,认为两个变量有很强的线性相关关系,从而表明建立回归模型是必要的,可用求出来的线性回归方程来预报其他量.名师解惑为什么要计算线性相关系数? 剖析:我们前一节讲了用“最小二乘法”求两变量之间的线性回归方程,而求出的线性回归方程中y与样本中yi存在着误差,我们用误差的平方和Q(a,b)达到最小值时的a、b的取值来确定线性回归方程为y=a+bx.那么拟合得好不好不一定,要想拟合得好必须使误差的平方和Q(a,b)尽可能地小,而当b=,a=-b时,Q(a,b)=1(xi-x)2b2+n-(a+bx)22,Q(a,b)最小=1=(1-r2).Q0,由此可看出1-r20,即r-1,1且当|r|值越大,1-r2越接近于0,Q(a,b)就越小,两变量之间的线性相关程度就越高,此时拟合得就越好.如果某组数据可能采取几种不同的回归方程进行分析,则可以通过比较r的值来作出选择,即选择r2较大的模型来作为这组数据的模型,那么,要建立一个回归模型其基本步骤大致可分为确定研究的对象,明确哪个变量随着哪个变量变化,即弄清谁是预测变量.作出样本数据的散点图,观察它们之间的关系(是否存在线性关系).由经验确定回归方程的类型(如果散点图呈现线性关系,则选用线性回归方程y=a+bx).列表并计算a、b及r的值.根据r的取值,判断回归方程是否拟合得好,若拟合的不好,可另选回归模型重新计算.得到较为合适的回归模型后,可用来预测所需要的量.这里要注意,由回归方程得到的预报值并不一定就是预报变量的精确值.事实上,它是预报变量的可能取值的平均值.讲练互动【例1】维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y来衡量,这个指标越高,耐水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x(g/L)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据.甲醛浓度(g/L)18202224262830缩醛化度(克分子%)26.8628.3528.7528.8729.7530.0030.36(1)画散点图;(2)求回归方程;(3)求相关系数r.解析:将有关数据代入公式计算.解:(1)(2)列表:ixiyixi2xiyi11826.86324483.4822028.3540056732228.75484632.542428.87576692.8852629.75676773.562830.0078484073030.36900910.80168202.944 1444 900.16=24,=,b=0.264 3,a=-b=22.649,回归方程为y=22.649+0.264 3x,(3)=5 892,r=0.96.由此可知,回归方程很好地拟合甲醛浓度与缩醛化度之间的线性关系.绿色通道 由散点图可看出两变量符合线性关系,由公式计算求出回归方程和相关系数.变式训练1.以下是收集到的新房屋的销售价格y和房屋的大小x的数据.房屋大小/m211511080135105销售价格/万元24.821.618.429.222(1)画出数据的散点图;(2)求线性回归方程及相关系数r,并作出评价.解:(1)(2)ixiyixi2yi2xiyi111524.813 225615.042 852211021.612 100466.562 37638018.46 400338.561 472413529.218 225852.643 94251052211 0254842 31054511660 9752 756.812 952=109,=23.2,b=0.196,a=-b=23.2-0.196109=1.836,回归方程为y=1.836+0.196x,r=0.96,拟合程度较高.【例2】为了了解某地母亲身高x与女儿身高y的相关关系,现随机测得10对母女的身高,所得数据如下表所示:母亲身高x/cm159160160163159154159158159157女儿身高y/cm158159160161161155162157162156(1)试对x与y进行一元线性回归分析,并预测当母亲身高为161 cm时,女儿的身高为多少?(2)求相关系数r,并分析模型的拟合效果.解析:由题意知先求回归方程,再预测.解:ixiyixi2yi2xiyi115915825 28124 96425 122216015925 60025 28125 440316016025 60025 60025 600416316126 56925 92126 243515916125 28125 92125 599615415523 71624 02523 870715916225 28126 24425 758815815724 96424 64924 806915916225 28126 24425 7581015715624 64924 33624 4921 5881 591252 222253 185252 688(1)=,=159.1,b=0.78.a=-b=159.1-0.78158.8=35,回归方程为y=35+0.78x.当x=161 cm时,y=160.58 cm,女儿身高为160.58 cm,(2)r=0.715,说明用回归方程拟合的较好.绿色通道 了解相关性检验的必要性.如果不作相关性检验,我们仍然可以求出x与y的回归直线方程.但这时的回归直线方程已经没有任何实际价值了,它也就不能反映变量x与y之间的变化规律.只有在x与y之间具有相关关系时,求回归直线方程才有实际意义,也才可以用于预测取值的情况.变式训练2.设变量x、y存在相关关系,今测得下列10组数据.x23456810121416y152025303545608082105(1)写出y关于x的线性回归方程;(2)预测x=25时y的取值;(3)求线性相关系数r.解:(1)i12345678910xi2345681012141680yi152025303545608082105497xi24916253664100144196256850yi22254006259001 2252 0253 6006 4006 7241

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论