高中数学 第1章 统计案例 1.2 回归分析知识导航学案 苏教版选修12.doc_第1页
高中数学 第1章 统计案例 1.2 回归分析知识导航学案 苏教版选修12.doc_第2页
高中数学 第1章 统计案例 1.2 回归分析知识导航学案 苏教版选修12.doc_第3页
高中数学 第1章 统计案例 1.2 回归分析知识导航学案 苏教版选修12.doc_第4页
高中数学 第1章 统计案例 1.2 回归分析知识导航学案 苏教版选修12.doc_第5页
免费预览已结束,剩余3页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.2 回归分析知识梳理1.回归直线方程为_,其中=_,=_.2.回归直线不能精确地反映x与y之间的关系,y的值不能由x完全确定,它们之间是_关系,y=a+bx+,其中_是确定性函数,称为_,将_称为线性回归模型.3.随机误差产生的主要原因有:(1)所用的确立性函数不恰当引起的误差;(2)_;(3)_.4.对于x、y随机取到的n对数据(xi,yi)(i=1,2,n),样本相关系数的计算公式为=_=_.5.线性相关系数的性质:(1)1;(2)越接近于_,y的线性相关程序越强;(3)越接近于_,y的线性相关程序越弱.知识导学 在研究两个变量之间的关系时,首先可以利用散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据. 作相关检验的依据可以利用样本相关系数,当0时,表明x与y正相关;0时,表明x与y正相关,0.75时,变量x、y有很强的相关关系,因而求回归直线方程才有意义,也才可以预测取值的情况.解:作线性相关性检验,=(159+160+157)=158.8.=(158+159+156)=159.1-10=(1592+1602+1572)-10158.82=47.6-=(159158+160159+157156)-10158.8159.1=37.2-10=(1582+1592+1562)-10159.12=56.9因此=0.71由于0.71接近于1,表明x与y有较强的相关关系,因而求回归直线方程有必要.又=0.78=159.1-0.78158.8=35.2由此得回归直线方程为=35.2+0.78x;回归系数=0.78反映出当母亲身高每增加1 cm时女儿身高平均增加0.78 cm, =35.2可以理解为女儿身高中不受母亲身高影响的部分,当母亲身高为161 cm时预报女儿身高为:=0.78161+35.2=160.78161 cm,这就是说当母亲身高为161 cm时,女儿身高大致也为161 cm.绿色通道:判断x与y是否具有线性相关关系,还可以先作出散点图,从点的分布特征来判定是否线性相关. 黑色陷阱:有些同学不对问题进行必要的相关性检验,直接求x与y的回归直线方程,它就没有任何实际价值,也就不能发现变量x与y间的变化规律,另外,要注意计算的正确性.【变式训练】某班5名学生的数学和化学成绩如下表所示,对x与y进行回归分析,并预报某学生数学成绩为75分时,他的化学成绩是多少?学生学科abcde数学成绩(x)8876736663化学成绩(y)7865716461解:对x与y作相关性判断.=(88+76+73+66+63)=73.2=(78+65+71+64+61)=67.8=882+762+732+662+632=27 174=782+652+712+642+612=23 167=8878+7665+7173+6466+6163=25 054-=27 174-573.22=382.8-=25 054-573.267.8=239.2-=23 167-567.82=182.8r=0.904.由于r=0.904接近于1,表明两个变量之间存在着线性相关关系.0.625,=67.8-73.20.625=22.05=0.625x+22.05 当x=75时,69.故次时他的化学成绩为69分.【例2】 一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得数据如下:零件数x(个)102030405060708090100加工时间y(个)626875818995102108115122(1)y与x是否具有线性相关关系;(2)如果y与x具有线性相关关系,求回归直线方程;(3)根据求出的回归直线方程,预测加工200个零件所用的时间为多少.思路分析:这是一个回归分析问题,应先进行线性相关检验或作散点图来判断x与y是否具有线性相关关系,如果线性相关,才可以求解后面的问题,否则就使得求回归直线方程没有意义.要作相关性检验,应先利用.= 求出样本相关系数,利用当0时,两个变量正相关;当0.75时,认为两个变量有很强的线性相关关系.解:(1)列出下表:i12345678910xi102030405060708090100yi626875818995102108115122xiyi6201 3602 2503 2404 4505 7007 1408 6401035012200=55, =91.7 =0.999 8由于=0.999 80.75,因此x与y之间有很强的线性相关关系,因而可求回归直线方程.(2)设所求的回归直线方程为=.则有=0.668=91.7-0.66855=54.96.因此,所求的回归直线方程为y=0.668x+54.96.(3)这个回归直线方程的意义是当x每增大1时,y的值约增加0.668,而54.96是y不随x增加而变化的部分,因此,当x=200时,y的估计值为y=0.668200+54.96=188.56189.因此,加工200个零件时所用的工时约为189个.【变式训练】 对于x与y有如下观测数据:x1825303941424952y356788910(1)作出散点图;(2)对x与y作回归分析;(3)求出x对y的回归直线方程_;(4)根据回归直线方程,预测y=20时的x值.解:(1)作出散点图(如下图所示)(2)作相关性检验.(18+25+30+39+41+42+49+52)=37(3+5+6+7+8+8+9+10)=7.=182+252+302+392+412+422+492+522=11 920=32+52+62+72+82+82+92+102=428=183+255+306+397+418+428+499+5210=2 257-=2 257-8377=185-=11 920-8372=968.-=428-872=36r=0.991由于r=0.9910.75,因此,认为两个变量有很强的相关关系;(3)回归系数=0.191=7-0.19137=-0.067.所以y对x的回归直线方程=0.191x-0.067;(4)当y=20时,有20=0.191x-0.067,x=105.因此在y的值为20时,x的值约为105.【例3】 某种图书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下,x123510203050100200y10.155.524.082.852.111.621.411.301.211.15检测每册书的成本费y与印刷册数的倒数之间是否具有线性相关关系,如有,求出y对x的回归方程.思路分析:本题与前面的问题有所不同,y与x之间不具有线性回归关系,因而是非线性回归问题,对于非线性回归问题有时不给出经验公式,这时我们可以画出已知数据的散点图,把它与必修1中学过的基本初等函数(幂函数、指数函数、对数函数)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量置换,把问题化为线性回归分析问题,使其得到解决.对于本题不妨设变量u=,题意要求对u与y作相关性检验,如果他们具有线性相关关系,就可以进一步求出y对u的回归直线方程,这时再回代u=,就得到了y对x的回归曲线方程.解:首先作变量置换u=,题目所给数据变成如下表所示的数据.ui10.50.330.20.10.050.030.020.010.005yi10.155.524.082.852.111.621.411.301.211.15可以求得,= =0.999 8由=0.999 80.75,因此,变量y与ui间具有较强的线性相关关系,并且=8.973, =1.125.最后回代a=可得=1.125+因此,y与x的回归方程为=1.125+.【变式训练】 一只红铃虫的产卵数y和温度x有关,现收集了7组观测数据列成下表,试建立y与x之间的回归方程.温度x/21232527293235产卵数y/个711212466115325解:根据收集的数据,作散点图,如下图.从图中可以看出,样本点并没有分布在某个带状区域内,因此两个变量不呈线性相关关系,所以不能直接利用线性回归方程来建立两个变量之间的关系,根据已有的函数知识,可以发现样本点分布在某一条直数函数曲线y=附近,其中c1、c2为待定的参数,我们可以通过对数变换把指数关系变为线性关系,令z=lgy,则变换后样本点分布在直线z=bx+a(a=lnc1,b=lnc2)的附近,这样可以利用线性回归建立y与x的非线性回归方程了.变换的样本点分布在一条直线的附近,因此可以用线性回归方程来拟合.由上表中的数据可得到变换的样本数据表如下表:x21232527293235y1.9462.3983.0453.1784.1904.7455.784可以求得线性回归直线方程为=0.272x-3.843因此红铃虫的产卵数对温度的非线性回归方程为=e0.272x-3.843,另一方面,可以认为图中的样本点集中在某二次曲线y=的附近,其中c3、c4为待定参数,因此可以对温度变量进行变换,令t=x2,然后建立y与t之间的线性回归方程.从而得到y与x之间的非线性回归方程.下表是红铃虫的产卵数和对应温度的平方的线性回归模型拟合表,作出相应的散点图如下图所示:t4415296257298411 0241 225y711212466115325从图中可以看出,y与t的散点图并不分布在一条直线的周围,因此不宜用线性回归方程来拟合它,即不宜用二次函数y=c3x2+c4来拟合x与y之间的关系,因此利用=e0.272x-3.843来拟合效果较好.问题探究问题:在利用线性回归模型解决实际问题的时候,应怎样合理建模,形成规律,总结方法呢?导思:在解决实际问题时,如何理解实际背景呢?线性回归模型与一次函数有什么不同呢?产生随机误差的原因是什么呢?探究:在解决实际问题时,常需要推断,在推断时,不能仅凭主观意愿作出结论,而是需要理清实际背景,要通过实验来收集数据,并根据独立性检验的原理做出合理的推断. 散点图可以形象地展示两个变量的关系,把数据用散点图表示出来,可以直观地了解两个变量的关系,常用横坐标表示解释变量,用纵坐标表示预报变量. 在散点图上画回归直线,回归直线与

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论