免费预览已结束,剩余11页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
学习目标1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度.3.了解非线性回归分析.知识点一线性回归方程思考某电脑公司有5名产品推销员,其工作年限与年推销金额数据如下表:推销员编号12345工作年限x/年35679推销金额y/万元23345请问如何表示推销金额y与工作年限x之间的相关关系?y关于x的线性回归方程是什么?答画出散点图,由图可知,样本点散布在一条直线附近,因此可用回归方程直线表示变量之间的相关关系.设所求的线性回归方程为x,则0.5,0.4.所以年推销金额y关于工作年限x的线性回归方程为0.5x0.4.1.函数关系是一种确定性关系, 而相关关系是一种非确定性关系.2.回归分析是对具有线性相关关系的两个变量进行统计分析的一种常用方法.3.对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),回归直线ybxa的斜率和截距的最小二乘估计公式分别为,.知识点二相关系数1.相关系数的计算公式对于x,y随机取到的n对数据(xi,yi)(i1,2,3,n),样本相关系数r的计算公式为r.2.相关系数r的性质(1)|r|1;(2)|r|越接近于1,x,y的线性相关程度越强;(3)|r|越接近于0,x,y的线性相关程度越弱.知识点三非线性回归分析1.常见的非线性回归模型幂函数曲线yaxb,指数曲线yaebx.倒指数曲线y,对数曲线yabln x.2.非线性函数可以通过变换转化成线性函数,得到线性回归方程,再通过相应变换得到非线性回归方程.类型一求线性回归方程例1某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:x681012y2356(1)请画出上表数据的散点图(要求:点要描粗);(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程x;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.(相关公式:,)解(1)如图:(2)xiyi6283105126158,9,4,x6282102122344,0.7,40.792.3,故线性回归方程为0.7x2.3.(3)由(2)中线性回归方程知,当x9时,0.792.34,预测记忆力为9的同学的判断力约为4.反思与感悟(1)求线性回归方程的基本步骤:列出散点图,从直观上分析数据间是否存在线性相关关系;计算:,iyi;代入公式求出x中参数,的值;写出线性回归方程并对实际问题作出估计.(2)需特别注意的是,只有在散点图大致呈线性时,求出的回归方程才有实际意义,否则求出的回归方程毫无意义.跟踪训练1(1)三点(3,10),(7,20),(11,24)的线性回归方程为_.1.75x5.75;1.75x5.75;1.75x5.75;1.75x5.75.答案解析回归直线恒过(,),7,18.则,四条回归直线中只有过点(7,18).(2)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份2007200820092010201120122013年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9求y关于t的线性回归方程;利用中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:,.解由所给数据计算得(1234567)4,(2.93.33.64.44.85.25.9)4.3,(ti)2941014928,(ti)(yi)(3)(1.4)(2)(1)(1)(0.7)00.110.520.931.614,0.5,4.30.542.3.所求回归方程为0.5t2.3.由知,0.50,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t9代入中的回归方程,得0.592.36.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.类型二相关性检验例2下面的数据是从年龄在40到60岁的男子中随机抽出的6个样本,分别测定了心脏的功能水平y(满分100)以及每天花在看电视上的平均时间x(小时).看电视的平均时间x(小时)4.44.62.75.80.24.6心脏的功能水平y(分)525369578965(1)求心脏的功能水平y与每天花在看电视上的平均时间x之间的样本相关系数r;(2)求心脏的功能水平y与每天花在看电视上的平均时间x的线性回归方程,并讨论方程是否有意义;(3)估计平均每天看电视3小时的男子的心脏的功能水平.解n6,(4.44.64.6)3.716 7,(525365)64.166 7,6()2(4.424.624.62)63.716 7219.766 8,6()2(522532652)664.166 72964.807 7,iyi6 (4.4524.6534.665)63.716 764.166 7124.630 2.(1)心脏的功能水平y与每天花在看电视上的平均时间x之间的相关系数 (2)6.305 0,64.166 76.305 03.716 787.600 5,所以心脏的功能水平y与每天花在看电视上的平均时间x的线性回归方程为6.305 0x87.600 5.查表n24,r0.050.811,因为|r|0.902 50.811,所以有95%以上的把握认为y与x之间有线性关系,这个方程是有意义的.(3)将x3代入线性回归方程6.305 0x87.600 5可得69(分).因此估计平均每天看电视3小时的男子的心脏的功能水平为69分.反思与感悟解决这一类问题时,首先应对问题进行必要的相关性检验,如果不作相关性检验,我们仍然可以求出x与y的线性回归方程,但不知道这时的线性回归方程是否有意义,也就不知道能否反映变量x与y之间的变化规律,只有在x与y之间具有相关关系时,求得的线性回归方程才有意义.跟踪训练2观察两个变量x,y,得到的数据如下表:x246810y64138205285360(1)对变量y与x进行相关性检验;(2)如果y与x之间具有线性相关关系,求回归直线方程.解(1)由相关系数的计算公式得r0.999 7,由r0.050.878得rr0.05,故y与x之间显然具有线性相关关系.(2)设回归直线方程x,根据公式得36.95x11.3.类型三非线性回归分析例3下表为收集到的一组数据:x21232527293235y711212466115325(1)作出x与y的散点图,并猜测x与y之间的关系;(2)建立x与y的关系,预报回归模型;(3)利用所得模型,预报x40时y的值.解(1)作出散点图如图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数型函数曲线y的周围,其中c1、c2为特定的参数.(2)对两边取对数把指数关系变为线性关系,令zln y,则有变换后的样本点应分布在直线zbxa,aln c1,bc2的周围,这样就可以利用线性回归模型来建立y与x之间的非线型回归方程了,数据可以转换为:x21232527293235z1.9462.3983.0453.1784.1904.7455.784求得回归直线方程为0.272x3.849,e0.272x3.849.(3)当x40时,ye0.272x3.8491 131.反思与感悟非线型回归问题的处理方法(1)指数函数型yebxa函数yebxa的图象:处理方法:两边取对数得ln yln ebxa,即ln ybxa,令zln y,把原始数据(x,y)转化为(x,z),再根据线性回归模型的方法求出a,b.(2)对数函数型ybln xa函数ybln xa的图象:处理方法:设xln x,原方程可化为ybxa,再根据线性回归模型的方法求出a,b.(3)ybx2a型处理方法:设xx2,原方程可化为ybxa,再根据线性回归模型的方法求出a,b.跟踪训练3某电容器充电后,电压达到100 v,然后开始放电,由经验知道,此后电压u随时间t变化的规律用公式uaebt(b0)表示,现测得时间t(s)时的电压u(v)如下表:t/s012345678910u/(v)100755540302015101055试求:电压u对时间t的回归方程.(提示:对公式两边取自然对数,把问题转化为线性回归分析问题)解对uaebt两边取对数得ln uln abt,令yln u,aln a,xt,则yabx,y与x的数据如下表:x012345678910y4.64.34.03.73.43.02.72.32.31.61.6根据表中数据画出散点图,如图所示,从图中可以看出,y与x具有较好的线性相关关系,由表中数据求得5,3.045,由公式计算得0.313,4.61,所以y对x的线性回归方程为0.313x4.61.所以ln 0.313t4.61,即e0.313t4.61e0.313te4.61,因此电压u对时间t的回归方程为e0.313te4.61.1.关于回归分析,下列说法错误的是_.(填序号)在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定;散点图反映变量间的线性相关关系,误差较大;散点图中,解释变量在x轴,预报变量在y轴;散点图能明确反映变量间的关系.答案2.如图四个散点图中,适合用线性回归模型拟合其中两个变量的是_.答案解析由图易知两个图中样本点在一条直线附近,因此适合用线性回归模型.3.下表是x和y之间的一组数据,则y关于x的回归方程必过点_.x1234y1357答案(2.5,4)解析回归方程必过样本点的中心(,),即(2.5,4).4.已知x、y之间的一组数据如下表:x0123y1357试:(1)分别计算:、x1y1x2y2x3y3x4y4、xxxx;(2)求出回归方程.解(1)1.5,4,x1y1x2y2x3y3x4y40113253734,xxxx0212223214;(2)2,421.51,故2x1.1.对具有相关关系的两个变量进行统计分析,可从散点图观察大致呈条状分布,可以求线性回归方程并进行预报.2.通过计算相关系数可以判定两个变量的线性相关程度,进行相关性检验.一、填空题1.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为0.85x85.71,则下列结论中不正确的是_.(填序号)y与x具有正的线性相关关系;回归直线过点(,);若该大学某女生身高增加1 cm,则其体重约增加0.85 kg;若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg.答案解析回归方程中x的系数为0.850,因此y与x具有正的线性相关关系,正确;由回归方程系数的意义可知回归直线过点(,),正确;依据回归方程中的含义可知 ,x每变化1个单位,相应变化约0.85个单位,正确;用回归方程对总体进行估计不能得到肯定的结论,故错误.2.若线性回归方程的斜率的估计值是1.23,4,5,则线性回归方程为_.答案1.23x0.08解析线性回归方程x,1.23,即1.23x,线性回归直线一定经过样本点的中心(4,5),代入可得51.234,所以0.08,故线性回归方程为1.23x0.08.3.对于回归分析,下列说法正确的是_.(填序号)在回归分析中,若r0,则两个变量线性不相关;线性相关系数可以是正的,也可以是负的;回归分析中,如果r21,说明x与y之间完全相关;样本相关系数r(1,1).答案解析样本的相关系数应满足1r1.4.根据如下样本数据:x345678y4.02.50.50.52.03.0得到的线性回归方程为x,则_0,_0.(填“,”)答案解析由散点图知0,0.5.某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程x中的为9.4,据此模型预报广告费用为6万元时销售额为_万元.答案65.5解析回归方程过点(3.5,42),则429.43.59.1,所以回归直线方程是9.4x9.1,把x6代入得65.5.6.在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线yx1上,则这组样本数据的样本相关系数为_.答案1解析根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1.7.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线yebxa的周围,令zln y,求得线性回归方程为0.25x2.58,则该模型的回归方程为_.答案e0.25x2.58解析0.25x2.58,zln y,e0.25x2.58.8.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归方程,分别得到以下四个结论:y与x负相关且2.347x6.423;y与x负相关且3.476x5.648;y与x正相关且5.437x8.493;y与x正相关且4.326x4.578.其中一定不正确的结论的序号是_.答案解析中,回归方程中x的系数为正,不是负相关;中,回归方程中的x的系数为负,不是正相关,一定不正确.9.若线性回归方程中的回归系数0,则相关系数r_.答案0解析,r,若0,则r0.10.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本(单位:元)的资料进行线性回归分析,结果如下:,71,79,iyi1 481.则销量每增加1 000箱,单位成本下降_元.答案1.818 2解析由题意知,1.818 2,71(1.818 2)77.36,1.818 2x77.36,销量每增加1千箱,则单位成本下降1.818 2元.二、解答题11.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到数据如下:零件的个数x(个)2345加工的时间y(小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程x,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少时间?(注:,)解(1)散点图如图所示:(2)由表中数据得iyi52.5,3.5,3.5,x54,0.7.1.05.0.7x1.05.回归直线如图中所示.(3)将x10代入回归直线方程,得0.7101.058.05(小时),预测加工10个零件需要8.05小时.12.一机器可以按各种不同的速度运转,其生产物件有一些会有缺点,每
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 19842-2025轨道车辆空调机组
- GB/T 46530-2025营运船舶二氧化碳排放强度等级及评定方法
- GB/T 46441-2025影像材料彩色反射照片臭氧褪色稳定性的试验方法
- 胆囊结石嵌顿的护理
- 雨课堂学堂在线学堂云《财富管理(黑龙江财经学院 )》单元测试考核答案
- 高考化学“3+2”模拟练试卷含答案(七)
- 2026年投资项目管理师之投资建设项目决策考试题库200道含答案【轻巧夺冠】
- 2026航空工业未来机载武器技术协同创新中心校园招聘历年真题汇编附答案解析
- 浙江国企招聘-2025浙江湘旅控股集团有限公司招聘10人历年真题汇编带答案解析
- 2026年度中国石化毕业生招聘历年真题汇编带答案解析
- 河道疏浚沙石运输合同
- 路灯灯头改造施工组织设计(方案)
- GB 8903-2024电梯用钢丝绳
- 羽毛球比赛对阵表模板
- 房屋续租再签合同范本
- 青春健康懂营养智慧树知到期末考试答案章节答案2024年昆明医科大学
- 土壤固化剂对边坡加固
- 非公司企业改制登记(备案)申请书
- 《安装操作系统示范》课件
- 读书与书籍-课件
- 数据中心基础实施培训UPS
评论
0/150
提交评论