




已阅读5页,还剩9页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1.1预习课本P28,思考并完成以下问题1什么是回归分析?2什么是线性回归模型?3求线性回归方程的步骤是什么?1回归分析(1)回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法(2)回归方程的相关计算对于两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)设其回归直线方程为x,其中,是待定参数,由最小二乘法得,(3)线性回归模型线性回归模型,其中a,b为模型的未知参数,通常e为随机变量,称为随机误差x称为解释变量,y称为预报变量点睛对线性回归模型的三点说明(1)非确定性关系:线性回归模型ybxae与确定性函数yabx相比,它表示y与x之间是统计相关关系(非确定性关系),其中的随机误差e提供了选择模型的准则以及在模型合理的情况下探求最佳估计值a,b的工具(2)线性回归方程x中,的意义是:以为基数,x每增加1个单位,y相应地平均增加个单位2线性回归分析(1)残差:对于样本点(xi,yi)(i1,2,n)的随机误差的估计值 iyii称为相应于点(xi,yi)的残差,(yii)2称为残差平方和(2)残差图:利用图形来分析残差特性,作图时纵坐标为残差, 横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图(3)R21越接近1,表示回归的效果越好1判断下列命题是否正确(正确的打“”,错误的打“”)(1)残差平方和越小, 线性回归方程的拟合效果越好()(2)在画两个变量的散点图时, 预报变量在x轴上,解释变量在y轴上()(3)R2越小, 线性回归方程的拟合效果越好()答案:(1)(2)(3)2从散点图上看,点散布在从左下角到右上角的区域内, 两个变量的这种相关关系称为_答案:正相关3在残差分析中, 残差图的纵坐标为_答案:残差4如果发现散点图中所有的样本点都在一条直线上, 则残差平方和等于_, 解释变量和预报变量之间的相关系数等于_答案:01或1求线性回归方程典例某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据x681012y2356(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程 x;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力解(1)散点图如图:(2)iyi6283105126158,9,4,628210212234407,407923,故线性回归方程为07x23(3)由(2)中线性回归方程知,当x9时,079234,故预测记忆力为9的同学的判断力约为4求线性回归方程的三个步骤(1)画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系(2)求回归系数:若存在线性相关关系,则求回归系数(3)写方程:写出线性回归方程,并利用线性回归方程进行预测说明活学活用某工厂18月份某种产品的产量与成本的统计数据见下表:月份12345678产量(吨)5660616470758082成本(万元)130136143149157172183188以产量为x,成本为y(1)画出散点图;(2)y与x是否具有线性相关关系?若有,求出其回归方程解:(1)由表画出散点图,如图所示(2)从上图可看出,这些点基本上散布在一条直线附近,可以认为x和y线性相关关系显著,下面求其回归方程,首先列出下表xiyixxiyi1561303136728026013636008160361143372187234641494096953657015749001 099067517256251 290078018364001 464088218867241 54165481 258382028 7645计算得685,157252217,157252217685539,故线性回归方程为2217x539回归分析题点一:线性回归分析1在一段时间内,某种商品的价格x元和需求量y件之间的一组数据为:x1416182022y1210753求出y对x的回归直线方程,并说明拟合效果的程度解:(1416182022)18,(1210753)741421621822022221 660,iyi14121610187205223620,可得回归系数115所以7411518281所以回归直线方程:115x281列出残差表:yii003040102yi4626042444则(yii)203,(yi)2532R210994所以回归模型的拟合效果很好题点二:非线性回归分析2为了研究某种细菌随时间x变化繁殖个数y的变化,收集数据如下时间x/天123456繁殖个数y612254995190(1)用时间作解释变量,繁殖个数作预报变量作出这些数据的散点图;(2)求y与x之间的回归方程解:(1)散点图如图所示:(2)由散点图看出样本点分布在一条指数函数y1c1ec2x的周围,于是令zln y,则x123456z179248322389455525由计算器算得,069x1112,则有e069x1112(1)当两个变量已明显呈线性相关关系时,则无需作散点图,就可直接求回归直线方程,否则要先判定相关性再求回归方程判断拟合效果的好坏需要利用R2确定,R2越接近1,说明拟合效果越好(2)非线性回归方程的求法根据原始数据(x,y)作出散点图;根据散点图,选择恰当的拟合函数;作恰当的变换,将其转化成线性函数,求线性回归方程;在的基础上通过相应的变换,即可得非线性回归方程 层级一学业水平达标1在对两个变量x,y进行线性回归分析时,有下列步骤:对所求出的回归直线方程作出解释;收集数据(xi,yi),i1,2,n;求线性回归方程;求相关系数;根据所搜集的数据绘制散点图如果根据可行性要求能够作出变量x,y具有线性相关的结论,则在下列操作顺序中正确的是()ABC D解析:选D对两个变量进行回归分析时,首先收集数据(xi,yi),i1,2,n;根据所搜集的数据绘制散点图观察散点图的形状,判断线性相关关系的强弱,求相关系数,写出线性回归方程,最后依据所求出的回归直线方程作出解释;故正确顺序是, 故选D2有下列说法:在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;R2来刻画回归的效果,R2值越大,说明模型的拟合效果越好;比较两个模型的拟合效果, 可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好其中正确命题的个数是()A0 B1C2 D3解析:选D选用的模型是否合适与残差点的分布有关; 对于, R2的值越大, 说明残差平方和越小, 随机误差越小,则模型的拟合效果越好3下图是根据变量x,y的观测数据(xi,yi)(i1,2,10)得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是()A BC D解析:选D根据散点图中点的分布情况,可判断中的变量x,y具有相关的关系4(重庆高考)已知变量x与y正相关,且由观测数据算得样本平均数3,35,则由该观测数据算得的线性回归方程可能为()A04x23 B2x24C2x95 D03x44解析:选A依题意知,相应的回归直线的斜率应为正,排除C,D且直线必过点(3,35)代入A,B得A正确5为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8286100113119支出y(万元)6275808598根据上表可得回归直线方程x,其中076,据此估计,该社区一户年收入为15万元家庭的年支出为()A114万元 B118万元C120万元 D122万元解析:选B由题意知,10,8,80761004,当x15时,0761504118(万元)6以下是某地区的降雨量与年平均气温的一组数据:年平均气温()1251128412841369133312741305年降雨量(mm)542507813574701432464根据这组数据可以推断,该地区的降雨量与年平均气温_相关关系(填“具有”或“不具有”)解析:画出散点图,观察可知,降雨量与年平均气温没有相关关系答案:不具有7在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线yx1上,则这组样本数据的样本相关系数为_解析:根据样本相关系数的定义可知, 当所有样本点都在直线上时, 相关系数为1答案:18下列说法正确的命题是_(填序号)回归直线过样本点的中心(,);线性回归方程对应的直线x至少经过其样本数据点(x1,y1),(x2,y2),(xn,yn)中的一个点;在残差图中,残差点分布的带状区域的宽度越宽,其模型拟合的精度越高;在回归分析中,R2为098的模型比R2为080的模型拟合的效果好解析:由回归分析的概念知正确,错误答案:9某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)8828486889销量y(件)908483807568(1)求回归直线方程x,其中20,;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润销售收入成本)解:(1)(8828486889)85,(908483807568)80,从而20802085250, 故20x250(2)由题意知, 工厂获得利润z(x4)y20x2330x1 00020236125,所以当x825时,zmax36125(元)即当该产品的单价定为825元时,工厂获得最大利润10关于x与y有以下数据:x24568y3040605070已知x与y线性相关,由最小二乘法得65,(1)求y与x的线性回归方程;(2)现有第二个线性模型:7x17,且R2082若与(1)的线性模型比较,哪一个线性模型拟合效果比较好,请说明理由解:(1)依题意设y与x的线性回归方程为65x5,50,65x经过(,),50655,175,y与x的线性回归方程为65x175(2)由(1)的线性模型得yii与yi的关系如下表:yii0535106505yi201010020所以(yii)2(05)2(35)2102(65)2052155(yi)2(20)2(10)2102022021 000所以R110845由于R0845,R2082知RR2,所以(1)的线性模型拟合效果比较好层级二应试能力达标1在建立两个变量y与x的回归模型中,分别选择4个不同模型,求出它们相对应的R2如表,则其中拟合效果最好的模型是()模型1234R2067085049023A模型1B模型2C模型3 D模型4解析:选B线性回归分析中,相关系数为r,|r|越接近于1, 相关程度越大; |r|越小, 相关程度越小,故其拟合效果最好 故选B2如果某地的财政收入x与支出y满足线性回归方程ybxae(单位:亿元),其中b08,a2,|e|05,如果今年该地区财政收入为10亿元,则年支出预计不会超过()A10亿 B9亿C105亿 D95亿解析:选Cx10时,y08102e10e,又|e|05,y1053某咖啡厅为了了解热饮的销售量y(个)与气温x()之间的关系,随机统计了某4天的销售量与气温,并制作了对照表:气温()1813101销售量(个)24343864由表中数据,得线性回归方程2xa当气温为4 时,预测销售量约为()A68 B66C72 D70解析:选A(1813101)10,(24343864)40,40210a,a60,当x4时,y2(4)60684甲、乙、丙、丁4位同学各自对A,B两变量进行回归分析,分别得到散点图与残差平方和(yii)2如下表:甲乙丙丁散点图残差平方和115106124103哪位同学的试验结果体现拟合A,B两变量关系的模型拟合精度高()A甲 B乙C丙 D丁解析:选D根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R2的表达式中(yi)2为确定的数,则残差平方和越小,R2越大),由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些故选D5在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线yebxa的周围,令ln y,求得回归直线方程为025x258,则该模型的回归方程为_解析:因为025x258,ln y,所以ye025x258答案:ye025x2586调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:0254x0321由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_万元解析:以x1代x,得0254(x1)0321,与0254x0321相减可得,年饮食支出平均增加0254万元答案:02547下表是某年美国旧轿车价格的调查资料使用年数12345678910平均价格(美元)2 6511 9431 4941 087765538484290226204观察表中的数据,试问平均价格与使用年数间存在什么样的关系?解:设x表示轿车的使用年数,y表示相应的平均价格,作出散点图由散点图可以看出y与x具有指数关系,令zln y,变换得x12345678910z7883757273096991664062886182567054215318作出散点图:由图可知各点基本上处于一直线,由表中数据可求出线性回归方程:81660298x因为旧车的平均价格与使用年数具有指数关系,其非线性回归方程为e81660298x8某公司利润y(单位:千万元)与销售总额x(单位:千万元)之间有如下对应数据:x
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人工智能教育培训手册
- 工作总结:提升专业能力业务水平
- 2025新疆克拉玛依市面向高校应届毕业生招聘事业编制高中教师48人笔试备考试题及答案解析
- 农学中的农业科技示范园规划设计
- 2025年天津安全工程师安全生产法事故直接原因的分析考试试题
- 2025年唐山市市直事业单位招聘277人笔试备考题库及参考答案详解一套
- 2025年事业单位笔试-江苏-江苏审计学(医疗招聘)历年参考题库含答案解析
- 2025年有色金属行业资源循环利用产业链产业链金融创新报告
- 2025四川达州宣汉县养老服务中心招聘临时工作人员10人笔试备考试题及答案解析
- 2025年医学遗传学病例诊断与咨询考核试卷答案及解析
- (中职中专)财经法规与会计职业道德课件完整版电子教案
- 牛津深圳版九年级上册Module 1 Geniuses Unit1 Wise Man in History话题作文期末复习
- DB37T 5151-2019 园林绿化工程资料管理规程
- 电能表生产流程
- 心电图机操作(课堂PPT)
- 贝多芬F大调浪漫曲—小提琴谱(带钢伴谱)
- 科远DCS系统方案
- 压力传感器(课堂PPT)
- 动物的家ppt课件
- Tip-edge Plus差动直丝弓技术
- 深圳市政府投资市政工程施工质量检查用表
评论
0/150
提交评论