河北省承德市高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用学案(无答案)新人教A版选修2-3(通用)_第1页
河北省承德市高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用学案(无答案)新人教A版选修2-3(通用)_第2页
河北省承德市高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用学案(无答案)新人教A版选修2-3(通用)_第3页
河北省承德市高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用学案(无答案)新人教A版选修2-3(通用)_第4页
河北省承德市高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用学案(无答案)新人教A版选修2-3(通用)_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

3.1回归分析的基本思想及其初步应用学习目标. 1通过探索典型案例,了解回归分析的基本思想、方法及初步应用2体会统计方法的特点和应用广泛性,提高对现代计算技术和统计应用的认识重点:用回归分析方法估计线性回归模型和相关概念难点:线性回归模型、残差分析、相关检验理解与相关指数检验模型拟合效果方法:自主学习合作探究师生互动知识的回顾与联系(自主预习)请回顾在必修3中学到的两个变量的线性相关、回归直线、回归直线方程式的求法并进行复习(一)新知识指导学;1 .回归分析是处理两个变量之间的_ _ _ _ _ _ _ _ _ _ _ _ _的统计方法。 如果两个变量之间存在线性关系,则对应的回归分析是: _ _ _ _ _ _ _ _ _ _ _ _ _ _ _2 .回归直线方程式为=x,其中=_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _3.线性相关关系的强度与弱度的判断: _ _ _ _ _ _ _ _ _ _ _ _ _描述线性相关关系的强度对于变量x、y随机提取的n对数据(x1、y1)、(x2、y2)、(xn、yn ),其相关系数r=_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _为称为样本的r0时,两个变量的绝对值越接近1, 如果两个变量的线性相关性为_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ r的绝对值接近0,则表示两个变量之间几乎没有线性相关关系。 如果正常|r|大于_,则认为两个变量具有强线性相关性。(2)牛刀小试验1.(2020武汉市重点中学二期末)对两个变量x,y进行线性回归分析时,有以下步骤说明求出的回归直线方程式收集数据(xi,yi ),I=1,2,n;求线性回归方程式求相关系数根据收集的数据制作散点图如果能够根据可行性要求得出与变量x、y线性相关的结论,则以下的操作顺序正确的是()a .b .c .d .(3)线性回归分析如果1y和x有线性相关关系,回归线性方程式为=x,预报值和真值y的误差是好还是小,因为误差值有正和负,所以直接取它求平均值,正和负的抵消不能正确反映误差的大小,如何解决这个问题?2 .随机误差(1)随机误差概念:如果采样点分散在直线附近而不是直线上,则线性回归模型_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _,而不是用一次函数y=bx a来表示两个变量之间的关系3残差对于采样点(x1,y1)、(x2,y2)、(xn,yn ),回归公式称为=x,作为回归模型中bx a的估计值,随机误差ei=yi-bxi-a的估计值I=_ _ _ _ _ _ _ _ (I=1,2,n )称为与点(xi,yi )对应的残差。4 .残差图以_ (或身高数据、体重的推定值等)为纵轴绘制的曲线图称为残差曲线图。5残差分析(1)研究两个变量之间的关系时,首先根据散布图大致判断是否存在线性相关,判断线性回归模型中是否能够拟合数据,然后用残差_判断模型拟合的效果,判断原始数据中是否存在可疑数据(2)在残差图中,当残差比较均匀地下降到_ _ _ _ _ _ _ _ _ _ _ _ _ _ _时,说明所选择模型是适当的,这样的带状区域的宽度越窄,说明模型适合精度_ _ _ _ _ _ _ _、回归方程式的预报精度也越高.当图中的样本点的残差较大时,有必要确认在提取该样本点的过程中是否存在人为的错误。 如果数据收集有错误,则需要更正,然后再次利用线性回归模型拟合数据,如果数据收集没有错误,则需要找到其他原因6 .正确理解预报变量的变化和说明变量与随机误差的关系预报变量变化程度可以分解为基于说明变量的变化程度和随机误差e的变化程度之和,为了测定回归直线方程式=x的拟合效果,在残差i=yi-i中(xi, yi )是观测到的样本点,i=xi是从回归模型得到的值,残差图的带状区域越窄,模型的拟合精度越高,从回归方程式得到的预报精度越高.在线性回归模型中,R2相对于预报变量变化的说明变量的_ _ _ _ _ _.R2越接近1,表示说明变量与预报变量的线性相关越强,相反,r 2越小,表示随机误差对预报变量的效果越大相关指数R2的计算公式为R2=1-R2值越大,表示残差平方和越小,即模型的拟合效果(回归效果)为_ _ _ _ _ _ _ .在包含一个解释变量的线性模型中,R2正好等于_的平方(2020天门市调查)下图是从变量x、y的观测数据(xi、yi ) (I=1,2,2,10 )得到的散布图,根据这些散布图能够判断出变量x、y具有相关关系的是()A.B. C. D.三种互动方法(1)变量间的相关检查例12个变量x和y相关的7组数据如下表所示(2)求回归直线方程例2020河南周口市高二期末)为了解春天昼夜温差的大小与某种发芽数的关系,现从4月30日中随机选取5天进行研究,分别记录每天昼夜温差和每天100种种子浸渍后的发芽数,获得以下资料日期四月初一四月初七四月十五日肆月廿壹日四月三十日温度差x/101113128发芽数y/粒2325302616(1)从这5天中选择2天,将发芽的种子数分别设为m、n,求出事件“m、n均为25以上”的概率。(2)从这5天开始选择2天,选择4月1日和4月30日的2组数据时,根据这5天的其他3天的数据,求出y的x的线性回归式=x(3)线性回归分析对于某设备的使用年限x和支出的修理费用y (万元),假定有如下表所示的统计使用年限23456修理费2.23.85.56.57.0根据资料,y和x呈线性相关关系(1)线性回归式=x的回归系数,(2)求残差平方和(3)求出相关指数R2(4)估计使用年限为10年时,修理费用是多少?四个班级的总结五当堂检定1.(2020宝鸡市金台区高二期末)回归直线斜率估计为1.23,样本点中心为(4,5 ),回归直线方程为()A.=1.23x 4 B.=1.23x-0.08C.=1.23x 0.8 D.=1.23x 0.082 .甲、乙、丙、丁四位学生分别实验a、b两变量的线性相关,用回归分析法分别求出相关系数r和残差平方和m甲乙丙丁r0.820.780.690.85m106115124103两个学生的实验结果表明,a、b两个变量具有更强的线性相关性()甲乙丙丁3.(2020;重庆处理,3 )已知变量x与y具有正相关性,如果根据观测数据计算出样本平均值=3,=3.5,则能够根据该观测数据计算线性回归方程式()A.=0.4x 2.3 B.=2x-2.4C.=-2x 9.5 D.=-0.3x 4.44.(2020枣阳一中、襄州一中、宣城一中、曾都一中高中三期联合考试)从对应于变量x和y的一组数据(1,y1)、(5,y2)、(7,y3)、(13,y4)、(19,y5)得到的线性回归方程式为=2x 45,则=()A.135 B.90C.67 D.635.(2020淄博市、临淄区单位认定试验)观测两个相关变量,得到以下数据x-1-2-3-4-554321y-0.9-2-3.1-3.9-5.154.12.92.10.9两个变量之间的线性回归表达式为()A.=0.5x-1 B.=xC.=2x 0.3 D.=x 16 .一位母亲通过记录儿子的身高、数据(略),身高和年龄的回归模型=7.19x 73.93,使用这个模型预测这个孩子的身高,有正确的记述()a .身高145.83cm B .身高一定在145.83cm以上c .身高145.83cm左右d .身高145.83cm以下7 .以下五个命题的正确命题编号是_任何两个变量都有相关关系圆的周长与该圆的半径有相关关系某商品需求量与该商品价格存在不确定的关系散布图求出的回归直线方程式可能没有意义两个变量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论