版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人教A版高中数学选择性必修三-8.2第1课时一元线性回归模型及参数的最小二乘估计-学案学习目标1.结合实例,了解一元线性回归模型的含义,了解模型参数的统计意义.2.了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法.3.针对实际问题,会用一元线性回归模型进行预测.一、一元线性回归模型生活经验告诉我们,儿子的身高与父亲的身高具有正相关的关系,为了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高,得到的数据如表所示:编号1234567父亲身高/cm174170173169182172180儿子身高/cm176176170170185176178编号891011121314父亲身高/cm172168166182173164180儿子身高/cm174170168178172165182我们画出散点图(课本105页图8.2-1)并通过计算得到样本相关系数r≈0.886.问题1由样本相关系数可以得到什么结论?问题2这两个变量之间的关系可以用函数模型来刻画吗?知识梳理一元线性回归模型:我们称eq\b\lc\{\rc\(\a\vs4\al\co1(Y=bx+a+e,,Ee=0,De=σ2))为Y关于x的___________模型,其中,Y称为_______或________,x称为______或______;a和b为模型的未知参数,a称为_____参数,b称为________参数;e是Y与bx+a之间的随机________.例1判断下列变量间哪些能用函数模型刻画,哪些能用回归模型刻画?(1)某公司的销售收入和广告支出;(2)某城市写字楼的出租率和每平米月租金;(3)航空公司的顾客投诉次数和航班正点率;(4)某地区的人均消费水平和人均国内生产总值(GDP);(5)学生期末考试成绩和考前用于复习的时间;(6)一辆汽车在某段路程中的行驶速度和行驶时间;(7)正方形的面积与周长.反思感悟在函数关系中,变量X对应的是变量Y的确定值,而在相关关系中,变量X对应的是变量Y的概率分布.换句话说,相关关系是随机变量之间或随机变量与非随机变量之间的一种数量依存关系,对于这种关系,通常运用统计方法进行研究.通过对相关关系的研究又可以总结规律,从而指导人们的生活与生活实践.跟踪训练1若某地财政收入x与支出y满足一元线性回归模型y=bx+a+e(单位:亿元),其中b=0.7,a=3,|e|≤0.5,如果今年该地区财政收入10亿元,年支出预计不会超过()A.9亿元 B.9.5亿元C.10亿元 D.10.5亿元二、最小二乘法和经验回归方程问题3在一元线性回归模型中,表达式Y=bx+a+e刻画了变量Y与x之间的线性相关关系,其中参数a和b未知,确定参数a和b的原则是什么?问题4下列确定直线的四种方法中最具有可行性的是哪一个?方法(1):先画出一条直线,测量出各点到直线的距离,然后移动直线,到达一个使距离和最小的位置,测量出此时的斜率和截距,就得到一条直线.方法(2):可以在散点图中选两点画一条直线,使得直线两侧点的个数基本相同,把这条直线作为所求直线.方法(3):在散点图中多取几对点,确定出几条直线的方程,再分别求出这些直线的斜率、截距的平均数,将这两个平均数作为所求直线的斜率和截距.方法(4):我们可以考虑使各组数据的随机误差e的和最小来确定直线的斜率和截距.知识梳理最小二乘法:我们将eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))称为Y关于x的________________,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做________________,求得的eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^))叫做b,a的________________,其中eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,n,)xi-\x\to(x)2)=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x).例2某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:x24568y3040605070求经验回归方程.参考公式:eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x).反思感悟求经验回归方程的步骤(1)算:计算eq\x\to(x),eq\x\to(y),eq\i\su(i=1,n,x)eq\o\al(2,i),eq\i\su(i=1,n,x)iyi.(2)代:代入公式计算eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^))的值.(3)写:写出经验回归方程.跟踪训练2某班5名学生的数学和物理成绩如表:学生学科ABCDE数学成绩(x)8876736663物理成绩(y)7865716461求物理成绩y对数学成绩x的经验回归方程.三、利用经验回归方程进行预测例3偏差是指个别测定值与测定的平均值之差,在成绩统计中,我们把某个同学的某科考试成绩与该科平均分的差叫某科偏差(实际成绩-平均分=偏差).在某次考试成绩统计中,某老师为了对学生数学偏差x(单位:分)与物理偏差y(单位:分)之间的关系进行分析,随机挑选了8位同学,得到他们的两科成绩偏差数据如下:学生序号12345678数学偏差x20151332-5-10-18物理偏差y6.53.53.51.50.5-0.5-2.5-3.5(1)若x与y之间具有线性相关关系,求y关于x的经验回归方程;(2)若该次考试数学平均分为120分,物理平均分为91.5分,试由(1)的结论预测数学成绩为128分的同学的物理成绩.参考数据和参考公式:eq\i\su(i=1,8,x)iyi=324,eq\i\su(i=1,8,x)eq\o\al(2,i)=1256,经验回归方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),其中eq\b\lc\{\rc\(\a\vs4\al\co1(\o(b,\s\up6(^))=\f(\o(∑,\s\up6(n),\s\do10(i=1))xiyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2)=\f(\o(∑,\s\up6(n),\s\do10(i=1))(xi-\x\to(x))(yi-\x\to(y)),\o(∑,\s\up6(n),\s\do10(i=1))(xi-\x\to(x))2),,\o(a,\s\up6(^))=\x\to(y)-\o(b,\s\up6(^))\x\to(x).))反思感悟(1)判断两个变量是否线性相关:可以利用经验,也可以画散点图.(2)求经验回归方程,注意运算的正确性.(3)根据经验回归方程进行预测估计:估计值不是实际值,两者会有一定的误差.跟踪训练3恩格尔系数法是国际上常用的一种测定贫困线的方法,是指居民家庭年人均食物支出占年人均消费总支出的比重,它随家庭收入的增加而下降,即恩格尔系数越大,生活越贫困.某调研小组通过调查得到了某地年人均消费总支出x(万元)与恩格尔系数y的五组数据如下表:x11.522.53y0.90.70.50.30.2(1)请根据上表数据,用最小二乘法求出y关于x的经验回归方程;(2)若该地某居民家庭年人均消费总支出为2.6万元,估计该居民家庭的恩格尔系数.参考公式:经验回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))中斜率和截距的最小二乘估计公式分别为eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)(xi-\x\to(x))(yi-\x\to(y)),\i\su(i=1,n,)(xi-\x\to(x))2)=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x).1.知识清单:(1)一元线性回归模型.(2)最小二乘法、经验回归方程的求法.(3)利用经验回归方程进行预测.2.方法归纳:数形结合、转化化归.3.常见误区:不判断变量间是否具有线性相关关系,盲目求解经验回归方程致误.1.工人工资y(元)与劳动生产率x(千元)的相关关系的经验回归方程为eq\o(y,\s\up6(^))=50+80x,下列判断正确的是()A.劳动生产率为1000元时,工人工资为130元B.劳动生产率提高1000元时,工人工资平均提高80元C.劳动生产率提高1000元时,工人工资平均提高130元D.当月工资为250元时,劳动生产率为2000元2.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据成对样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的经验回归方程为eq\o(y,\s\up6(^))=0.85x-85.71,则下列结论中不正确的是()A.y与x具有正的线性相关关系B.经验回归直线过点(eq\x\to(x),eq\x\to(y))C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可判定其体重必为58.79kg3.(多选)为研究需要,统计了两个变量x,y的数据情况如表:xx1x2x3…xnyy1y2y3…yn其中数据x1,x2,x3,…,xn和数据y1,y2,y3,…,yn的均值分别为eq\x\to(x)和eq\x\to(y),并且计算样本相关系数r=-0.8,经验回归方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),以下结论正确的为(若|r|>0.75,则线性相关性较强)()A.将以上数据的每个数据都加一个相同的常数后,方差不变B.变量x,y的相关性较强C.当x=x1时,则必有eq\o(y,\s\up6(^))=y1D.eq\o(b,\s\up6(^))<04.某车间为了提高工作效率,需要测试加工零件所花费的时间,为此进行了5次试验,这5次试验的数据列(个数x,加工时间y)为:(10,62),(20,a),(30,75),(40,81),(50,89).若用最小二乘法求得其经验回归方程为eq\o(y,\s\up6(^))=0.67x+54.9,则a的值为________.参考答案与详细解析问题1由散点图的分布趋势表明儿子的身高与父亲的身高线性相关,通过样本相关系数可知儿子的身高与父亲的身高正线性相关,且相关程度较高.问题2不能.因为这两个变量之间不是函数关系,也就不能用函数模型刻画.知识梳理一元线性回归因变量响应变量自变量解释变量截距斜率误差例1解(1)(2)(3)(4)(5)回归模型,(6)(7)函数模型.跟踪训练1D[因为财政收入x与支出y满足一元线性回归模型y=bx+a+e,其中b=0.7,a=3,所以y=0.7x+3+e.当x=10时,得y=0.7×10+3+e=10+e,又|e|≤0.5,即-0.5≤e≤0.5,所以9.5≤y≤10.5,所以年支出预计不会超过10.5亿元.]问题3使表示成对样本数据的各散点在整体上与一条适当的直线尽可能地接近.问题4方法(1),(2),(3)虽然有一定道理,但是比较难操作,方法(4)可以利用点到直线的距离来刻画散点与该直线的接近程度,然后利用所有距离之和刻画所有样本观测数据与该直线的接近程度(具体推导过程参考课本108~109页).知识梳理经验回归方程最小二乘法最小二乘估计例2解eq\x\to(x)=eq\f(2+4+5+6+8,5)=5,eq\x\to(y)=eq\f(30+40+60+50+70,5)=50,eq\i\su(i=1,5,x)iyi=2×30+4×40+5×60+6×50+8×70=1380,5eq\x\to(x)eq\x\to(y)=5×5×50=1250,eq\i\su(i=1,5,x)eq\o\al(2,i)=22+42+52+62+82=145,5eq\x\to(x)2=5×52=125,eq\o(b,\s\up6(^))=eq\f(1380-1250,145-125)=6.5,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=50-6.5×5=17.5,所以所求经验回归方程为eq\o(y,\s\up6(^))=6.5x+17.5.跟踪训练2解eq\x\to(x)=eq\f(1,5)×(88+76+73+66+63)=73.2,eq\x\to(y)=eq\f(1,5)×(78+65+71+64+61)=67.8.eq\i\su(i=1,5,x)iyi=88×78+76×65+73×71+66×64+63×61=25054.eq\i\su(i=1,5,x)eq\o\al(2,i)=882+762+732+662+632=27174.所以eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,5,x)iyi-5\x\to(x)\x\to(y),\i\su(i=1,5,x)\o\al(2,i)-5\x\to(x)2)=eq\f(25054-5×73.2×67.8,27174-5×73.22)≈0.625,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)≈67.8-0.625×73.2=22.05.所以所求经验回归方程是eq\o(y,\s\up6(^))=0.625x+22.05.例3解(1)由题意可得,eq\x\to(x)=[20+15+13+3+2+(-5)+(-10)+(-18)]×eq\f(1,8)=eq\f(5,2),eq\x\to(y)=[6.5+3.5+3.5+1.5+0.5+eq\b\lc\(\rc\)(\a\vs4\al\co1(-0.5))+eq\b\lc\(\rc\)(\a\vs4\al\co1(-2.5))+eq\b\lc\(\rc\)(\a\vs4\al\co1(-3.5))]×eq\f(1,8)=eq\f(9,8),eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(8),\s\do10(i=1))xiyi-8\x\to(x)\x\to(y),\o(∑,\s\up6(8),\s\do10(i=1))x\o\al(2,i)-8\x\to(x)2)=eq\f(324-8×\f(5,2)×\f(9,8),1256-8×\b\lc\(\rc\)(\a\vs4\al\co1(\f(5,2)))2)=eq\f(1,4),所以eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=eq\f(9,8)-eq\f(1,4)×eq\f(5,2)=eq\f(1,2),故经验回归方程为eq\o(y,\s\up6(^))=eq\f(1,4)x+eq\f(1,2).(2)由题意,设该同学的物理成绩为ω,则物理偏差为ω-91.5.而数学偏差为128-120=8,所以ω-91.5=eq\f(1,4)×8+eq\f(1,2),解得ω=94,所以,可以预测这位同学的物理成绩为94分.跟踪训练3解(1)由题意可得eq\x\to(x)=eq\f(1,5)×(1+1.5+2+2.5+3)=2,eq\x\to(y)=eq\f(1,5)×(0.9+0.7+0.5+0.3+0.2)=0.52.eq\i\su(i=1,5,)(xi-eq\x\to(x))(yi-eq\x\to(y))=-1×0.38-0.5×0.18+0.5×(-0.22)+1×(-0.32)=-0.9,eq\i\su(i=1,5,)(xi-eq\x\to(x))2=1+0.25+0.25+1=2.5,则e
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GM/T 0039-2024密码模块安全检测要求
- 产后抑郁的识别与干预个案报告
- 儿童斜视矫正与康复
- 浙江省绍兴市诸暨市重点名校2025-2026学年初三总复习质量测试(一)语文试题含解析
- 安徽庐江县2026届初三英语试题查缺补漏试题(文理)含解析
- 江苏省无锡市小黄卷2026年初三下学期第二次调研(模拟)考试英语试题试卷含解析
- 吉林省松原市宁江区重点名校2025-2026学年全国初三模拟考试(四)英语试题含解析
- 浙江省丽水市级名校2026届初三5月第一次联考语文试题试卷含解析
- 卵巢癌护理研究进展
- 孙云晓拯救男孩需要改变教育模式和评价标准
- 7《我不是最弱小的》课件(内嵌音视频)-2025-2026学年二年级下册语文统编版
- 催收公司内部应急制度
- 2026年宁夏葡萄酒与防沙治沙职业技术学院自主公开招聘工作人员考试参考试题及答案解析
- 重庆市科学素养大赛题库
- 压疮的敷料选择
- 湖南白银股份有限公司2026年公开招聘笔试备考题库及答案解析
- 春节后医院后勤工作年度计划课件
- 4M变更管理程序(含表格)
- GB/T 18941-2003高聚物多孔弹性材料定负荷冲击疲劳的测定
- GB/T 18494.1-2014变流变压器第1部分:工业用变流变压器
- GA 844-2009防砸复合玻璃通用技术要求
评论
0/150
提交评论