2018_2019学年高中数学第一章统计案例1.2_1.3相关系数可线性化的回归分析学案北师大版.docx_第1页
2018_2019学年高中数学第一章统计案例1.2_1.3相关系数可线性化的回归分析学案北师大版.docx_第2页
2018_2019学年高中数学第一章统计案例1.2_1.3相关系数可线性化的回归分析学案北师大版.docx_第3页
2018_2019学年高中数学第一章统计案例1.2_1.3相关系数可线性化的回归分析学案北师大版.docx_第4页
2018_2019学年高中数学第一章统计案例1.2_1.3相关系数可线性化的回归分析学案北师大版.docx_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.2相关系数1.3可线性化的回归分析学习目标1.了解线性相关系数r的求解公式,并会初步应用.2.理解回归分析的基本思想.3.通过可线性化的回归分析,判断几种不同模型的拟合程度知识点一相关系数1相关系数r的计算假设两个随机变量的数据分别为(x1,y1),(x2,y2),(xn,yn),则变量间线性相关系数r.2相关系数r的性质(1)r的取值范围为1,1(2)|r|值越大,误差Q越小,变量之间的线性相关程度越高(3)|r|值越接近0,误差Q越大,变量之间的线性相关程度越低3相关性的分类(1)当r0时,两个变量正相关(2)当r0时,两个变量负相关(3)当r0时,两个变量线性不相关知识点二可线性化的回归分析曲线方程曲线图形变换公式变换后的线性函数幂函数曲线yaxbclnavlnxulnyucbv指数曲线yaebxclnaulnyucbx倒指数曲线clnavulnyucbv对数曲线yablnxvlnxuyuabv1回归分析中,若r1说明x,y之间具有完全的线性关系()2若r0,则说明两变量是函数关系()3样本相关系数的范围是r(,)()类型一线性相关系数及其应用例1下图是我国2012年至2018年生活垃圾无害化处理量(单位:亿吨)的折线图注:年份代码17分别对应年份20122018.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2020年我国生活垃圾无害化处理量附注:参考数据:i9.32,iyi40.17,0.55,2.646.参考公式:相关系数r,回归方程yabt中斜率和截距的最小二乘估计公式分别为:b,ab.解(1)由折线图中数据和附注中参考数据得4,(ti)228,0.55.(ti)(yi)iyii40.1749.322.89,r0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系(2)由1.331及(1)得b0.103,ab1.3310.10340.92.所以y关于t的回归方程为y0.920.10t.将2020年对应的t9代入回归方程得y0.920.1091.82.所以预测2020年我国生活垃圾无害化处理量将约为1.82亿吨反思与感悟(1)散点图只能直观判断两变量是否具有相关关系(2)相关系数能精确刻画两变量线性相关关系的强弱跟踪训练1变量x,y的散点图如图所示,那么x,y之间的相关系数r的最接近的值为()A1B0.5C0D0.5考点题点答案C解析从散点图中,我们可以看出,x与y没有线性相关关系,因而r的值接近于0.类型二可线性化的回归分析例2某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响对近8年的年宣传费xi和年销售量yi(i1,2,8)的数据作了初步处理,得到下面的散点图及一些统计量的值(xi)2(wi)2(xi)(yi)(wi)(yi)46.65636.8289.81.61469108.8表中wi,i.(1)根据散点图判断,yabx与ycd哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)当年宣传费x49时,年销售量的预报值是多少?附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线vu的斜率和截距的最小二乘估计分别为,.考点非线性回归分析题点非线性回归分析解(1)由散点图可以判断,ycd适宜作为年销售量y关于年宣传费x的回归方程类型(2)令w,先建立y关于w的线性回归方程由于d68,cd563686.8100.6,所以y关于w的线性回归方程为y100.668w,因此y关于x的回归方程为y100.668.(3)由(2)知,当x49时,年销售量y的预报值y100.668576.6.反思与感悟由样本数据先作散点图,根据散点图的分布规律选择合适的函数模型如果发现具有线性相关头系,可由公式或计算器的统计功能,求得线性回归方程的两个参数如果发现是指数型函数或二次函数,可以通过一些代数变换,转化为线性回归模型跟踪训练2在一次抽样调查中测得样本的5个样本点,数值如下表:x0.250.5124y1612521求y关于x的回归方程考点非线性回归分析题点非线性回归分析解由数值表可作散点图如图,根据散点图可知y与x近似地呈反比例函数关系,设y,令t,则ykt,原数据变为:t4210.50.25y1612521由置换后的数值表作散点图如下:由散点图可以看出y与t呈近似的线性相关关系,列表如下:itiyitiyit1416641622122443155140.5210.2550.2510.250.06257.753694.2521.3125所以1.55,7.2.所以b4.1344,ab0.8.所以y4.1344t0.8.所以y与x之间的回归方程是y0.8.1给定y与x是一组样本数据,求得相关系数r0.690,则()Ay与x的线性相关性很强By与x线性不相关Cy与x正线性相关Dy与x负线性相关考点线性相关系数题点线性相关系数的应用答案D解析因为|r|0.690|0.75,所以y与x的线性相关性一般,又因为r0.6900Bbr0Dar0时,x和y正相关,则r0;当b0时,x和y负相关,则r0.2关于两个变量x,y与其线性相关系数r,有下列说法:若r0,则x增大时,y也相应增大;若|r|越趋近于1,则x与y的线性相关程度越强;若r1或r1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上其中正确的有()ABCD考点线性相关系数题点线性相关系数的应用答案D解析根据相关系数的定义,变量之间的相关关系可利用相关系数r进行判断:当r为正数时,表示变量x,y正相关;当r为负数时,表示两个变量x,y负相关;|r|越接近于1,相关程度越强;|r|越接近于0,相关程度越弱故可知正确3甲、乙、丙、丁四位同学各自对A,B两变量进行线性相关试验,并用回归分析方法分别求得相关系数r如表:甲乙丙丁r0.820.780.690.85则这四位同学的试验结果能体现出A,B两变量有更强的线性相关性的是()A甲B乙C丙D丁考点线性相关系数题点线性相关系数的应用答案D解析由相关系数的意义可知,相关系数的绝对值越接近于1,相关性越强,结合题意可知,丁的线性相关性更强,故选D.4若一函数模型为yax2bxc(a0),为将y转化为关于t的线性回归方程,则需作变换t等于()Ax2B(xa)2C.2D以上都不对考点非线性回归分析题点非线性回归分析答案C解析y关于t的线性回归方程,实际上就是y关于t的一次函数,因为ya2(a0),故选C.5对于指数曲线yaebx,令ulny,clna,经过非线性化回归分析之后,可以转化成的形式为()AucbxBubcxCybcxDycbx考点非线性回归分析题点非线性回归分析答案A解析对方程yaebx两边同时取对数,然后将ulny,clna代入,不难得出ucbx.6某奶茶店为了了解奶茶销售量与气温之间的关系,随机统计并制作了6天卖出的奶茶的杯数与气温的对照表:气温x()2619141041杯数y201242339383505640经检验,这组样本数据具有线性相关关系,那么,对于气温x()与奶茶销售量y(杯)这两个变量,下列判断正确的是()A呈正相关,其回归直线经过点(12,385)B呈负相关,其回归直线经过点(12,385)C呈正相关,其回归直线经过点(12,386)D呈负相关,其回归直线经过点(12,386)考点线性回归直线方程题点样本点中心的应用答案B解析画出散点图(图略)可知成负相关,又根据表中数据可得12,385,故选B.7有一组数据如下表:X1.9933.0024.0015.0326.121Y1.5014.4137.49812.0417.93现准备从以下函数中选择一个能够近似地表示这组数据满足的规律,其中拟合最好的是()Ay2x2Bylog2xCy2x11Dyx2考点非线性回归分析题点非线性回归分析答案D解析把X看作自变量,Y看作其函数值,从表中数据的变化趋势看,函数递增的速度不断加快A选项中一次函数是以一个恒定的幅度变化,其图像是直线,不符合本题的变化规律B选项为对数型函数,随着X的增大Y的递增速度不断变慢,不符合本题的变化规律C选项为指数型函数,随着X的增大Y的递增速度不断变快,但增长速度超出题目中Y的增长速度,不符合本题的变化规律D选项是二次函数,对比数据知,其最接近这组数据的变化趋势故选D.8.设(x1,y1),(x2,y2),(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线如图,以下说法正确的是()Ax和y的相关系数为直线l的斜率Bx和y的相关系数在0到1之间C当n为偶数时,分布在l两侧的样本点的个数一定相同D由直线l可知,r一定小于0考点线性相关系数题点线性相关系数的应用答案D解析因为r的符号与线性回归方程yabx斜率符号相同,故r一定小于0.二、填空题9在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线yx1上,则这组样本数据的样本相关系数为_考点线性相关系数题点线性相关系数的应用答案1解析根据样本相关系数的定义可知,当所有样本点都在直线yx1上时,相关系数为1.10若已知(yi)2是(xi)2的4倍,(xi)(yi)是(xi)2的1.5倍,则相关系数r的值为_考点线性相关系数题点线性相关系数的应用答案解析由r,得r.11在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线yebxa的周围令zlny,求得线性回归方程为z0.25x2.58,则该模型的回归方程为_考点非线性回归分析题点非线性回归分析答案ye0.25x2.58解析因为z0.25x2.58,zlny,所以ye0.25x2.58.三、解答题12噪声污染已经成为影响人们身体健康和生活质量的严重问题,为了了解声音强度D(单位:分贝)与声音能量I(单位:W/cm2)之间的关系,将测量得到的声音强度Di和声音能量Ii(i1,2,10)数据做了初步处理,得到下面的散点图及一些统计量的值(数据:3.161012,45.7,11.5,(Ii)21.561011,(Wi)20.51,(Ii)(Di)6.881011,(Wi)(Di)5.1,其中WilgIi,i)根据给出的数据,求声音强度D关于声音能量I的回归方程DablgI;附:对于一组数据(1,1),(2,2),(n,n),其回归直线的斜率和截距的最小二乘估计分别为,.考点非线性回归分析题点非线性回归分析解令WilgIi,先建立D关于W的线性回归方程,由于b10,ab160.7,D关于W的线性回归方程为D10W160.7,D关于I的回归方程为D10lgI160.7.四、探究与拓展13已知某个样本点中的变量x,y线性相关,相关系数r0,平移坐标系,则在以(,)为坐标原点的坐标系下的散点图中,大多数的点都落在第_象限考点线性相关系数题点线性相关系数的应用答案一、三解析因为r0时,b0,所以大多数的点都落在第一、三象限14某种书每册的成本费y(元)与印刷册数x(万册)有关,经统计得到数据如下:x123510203050100200y10.155.524.082.852.111.621.411.301.211.15令,检验每册书的成本费y与之间是否具有线性相关关系,若有,求出y对的回归方程(参考数据:1.413014,171.803,iyi15.20878)考点非

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论