高二数学线性回归知识精讲 苏教版_第1页
高二数学线性回归知识精讲 苏教版_第2页
高二数学线性回归知识精讲 苏教版_第3页
高二数学线性回归知识精讲 苏教版_第4页
高二数学线性回归知识精讲 苏教版_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高二数学线性回归知识精讲 苏教版一. 本周教学内容:线性回归教学目的:1. 了解相关关系、回归分析、散点图的概念 2. 明确事物间是相互联系的,了解非确定性关系中两个变量的统计方法;掌握散点图的画法及在统计中的作用,掌握回归直线方程的求解方法 3. 会求回归直线方程 教学重点:散点图的画法,回归直线方程的求解方法教学难点:回归直线方程的求解方法二. 基础知识:1. 知识结构图 2. 相关关系的概念当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系相关关系是非随机变量与随机变量之间的关系,函数关系是两个非随机变量之间的关系,是一种因果关系,而相关关系不一定是因果关系,所以相关关系与函数关系不同,其变量具有随机性,因此相关关系是一种非确定性关系 (有因果关系,也有伴随关系).因此,相关关系与函数关系的异同点如下:相同点:均是指两个变量的关系 不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系. 3. 回归分析: 对具有相关关系的两个变量进行统计分析的方法叫做回归分析 通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性 4. 散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度 粗略地看,散点分布具有一定的规律 5. 回归直线设所求的直线方程为其中a、b是待定系数. 则 . 于是得到各个偏差.显见,偏差的符号有正有负,若将它们相加会造成相互抵消,所以它们的和不能代表几个点与相应直线在整体上的接近程度,故采用n个偏差的平方和. 表示n个点与相应直线在整体上的接近程度. 记 (说明的意义). 上述式子展开后,是一个关于a、b的二次多项式,应用配方法,可求出使Q为最小值时的a、b的值. 即, ,相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析 特别指出:(1)对回归直线方程只要求会运用它进行具体计算a、b,求出回归直线方程即可. 不要求掌握回归直线方程的推导过程. (2)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实标意义. 否则,求出的回归直线方程毫无意义. 因此,对一组数据作线性回归分析时,应先看其散点图是否成线性. (3)求回归直线方程,关键在于正确地求出系数a、b,由于求a、b的计算量较大,计算时仔细谨慎、分层进行,避免因计算产生失误. (4)回归直线方程在现实生活与生产中有广泛的应用. 应用回归直线方程可以把非确定性问题转化成确定性问题,把“无序”变为“有序”,并对情况进行估测、补充. 因此,学过回归直线方程以后,应增强学生应用回归直线方程解决相关实际问题的意识. 6. 相关系数:相关系数是英国统计学家皮尔逊提出的,对于变量y与x的一组观测值,把=叫做变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度. 7. 相关系数的性质: 1,且越接近1,相关程度越大;且越接近0,相关程度越小.8. 显著性水平:显著性水平是统计假设检验中的一个概念,它是公认的小概率事件的概率值它必须在每一次统计检验之前确定 9. 显著性检验:(相关系数检验的步骤)由显著性水平和自由度查表得出临界值,显著性水平一般取0.01和0.05,自由度为,其中是数据的个数在“相关系数检验的临界值表”查出与显著性水平0.05或0.01及自由度n-2(n为观测值组数)相应的相关数临界值r0 05或r0 01;例如时,0.050.754,0.010.874 求得的相关系数和临界值0.05比较,若0.05,上面与是线性相关的,当r0.05或r0.01,认为线性关系不显著结论:讨论若干变量是否线性相关,必须先进行相关性检验,在确认线性相关后,再求回归直线;通过对两个变量是否线性相关的估计,实际上就是把非确定性问题转化成确定性问题来研究;我们研究的对象是两个变量的线性相关关系,还可以研究多个变量的相关问题,这在今后的学习中会进一步学到 【典型例题】例1. 已知10只狗的红血球体积及红血球的测量值如下45424648423558403950y6.536.309.257.506.995.909.496.206.557.72(红血球体积,mL),y(红血球数,百万)(1)画出上表的散点图;(2)求出回归直线并且画出图形 解:(1)见下图(2)设回归直线为, 即,所以所求回归直线的方程为,图形如下:例2.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间有如下一组对应数据:x1.081.121.191.281.361.481.591.681.801.871.982.07y2.252.372.402.552.642.752.923.033.143.263.363.50(1)画出散点图;(2)求月总成本y与月总产量x之间的回归直线方程解:(1)散点图如图所示;(2)按的顺序计算,最后得到.即所求的回归直线方程为.例3. 在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得数据如下(单位:kg)施化肥量x15202530354045水稻产量y330345365405445450455(1)画出散点图;(2)x与y是否存在线性相关关系;(3)若存在相关关系,请求出回归直线方程。解:(1)散点图如下(2)检验相关系数r的显著性水平: i1234567xi15202530354045yi330345365405445450455xiyi49506950912512150155751800020475=30,=399.3,=7000,=1132725,=87175r=0.9733,在“相关系数检验的临界值表”查出与显著性水平0.05及自由度7-2=5相应的相关系数临界值r0.05=0.7540.9733,这说明水稻产量与施化肥量之间存在线性相关关系.(3)设回归直线方程,利用计算a,b, 得b=a=399.3-4.7530257,则回归直线方程 例4. 一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间有如下一组数据:x1.081.121.191.281.361.481.591.681.801.871.982.07y2.252.372.402.552.642.752.923.033.143.263.363.501)画出散点图;2)检验相关系数r的显著性水平;3)求月总成本y与月产量x之间的回归直线方程.解:i123456789101112xi1.081.121.191.281.361.481.591.681.801.871.982.07yi2.252.372.402.552.642.752.923.033.143.263.363.50xiyi2.432.2642.8563.2643.5904.074.6435.0905.6526.0966.6537.245=,=2.8475,=29.808,=99.2081,=54.2431)画出散点图: 2)r= 在“相关系数检验的临界值表”查出与显著性水平0.05及自由度12-2=10相应的相关系数临界值r0。05=0.5760.997891, 这说明每月产品的总成本y(万元)与该月产量x(万件)之间存在线性相关关系.3)设回归直线方程,利用,计算a,b,得b1.215, a=0.974, 回归直线方程为:【模拟试题】参考公式:0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828一、选择题:(本大题共12小题,每小题5分,共60分)1. 在画两个变量的散点图时,下面哪个叙述是正确的( )A. 预报变量在轴上,解释变量在轴上B. 解释变量在轴上,预报变量在轴上C. 可以选择两个变量中任意一个变量在轴上D. 可以选择两个变量中任意一个变量在轴上2. 两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵截距是a,那么必有( )A. b与r的符号相同B. a与r的符号相同C. b与r的符号相反D. a与r的符号相反3. 一位母亲记录了儿子39岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )A. 身高一定是145.83cmB. 身高在145.83cm以上C. 身高在145.83cm以下D. 身高在145.83cm左右4. 两个变量与的回归模型中,分别选择了4个不同模型,它们的相关指数如下 ,其中拟合效果最好的模型是( )A. 模型1的相关指数为0.98B. 模型2的相关指数为0.80 C. 模型3的相关指数为0.50D. 模型4的相关指数为0.255. 工人月工资(元)依劳动生产率(千元)变化的回归直线方程为,下列判断正确的是( ) A. 劳动生产率为1000元时,工资为50元B. 劳动生产率提高1000元时,工资提高150元C. 劳动生产率提高1000元时,工资提高90元D. 劳动生产率为1000元时,工资为90元6. 为研究变量和的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程和,两人计算知相同,也相同,下列正确的是( )A. 与重合B. 与一定平行 C. 与相交于点D. 无法判断和是否相交7. 考察棉花种子经过处理跟生病之间的关系得到如下表数据:种子处理种子未处理合计得病32101133不得病61213274合计93314407根据以上数据,则( )A. 种子经过处理跟是否生病有关B. 种子经过处理跟是否生病无关C. 种子是否经过处理决定是否生病 D. 以上都是错误的8. 变量与具有线性相关关系,当取值16,14,12,8时,通过观测得到的值分别为11,9,8,5,若在实际问题中,的预报最大取值是10,则的最大取值不能超过( )A. 16B. 17C. 15D. 129. 如果某地的财政收入与支出满足线性回归方程(单位:亿元),其中,如果今年该地区财政收入10亿元,则年支出预计不会超过( )A. 10亿B. 9亿C. 10.5亿D. 9.5亿 10. 在回归分析中,残差图中纵坐标为( )A. 残差B. 样本编号C. D. 11. 三维柱形图中,主副对角线上两个柱形的高度 相差越大,要推断的论述成立的可能性越大( )A. 乘积B. 和C. 差D. 商12. 通过来判断模拟型拟合的效果,判断原始数据中是否存在可疑数据,这种分工称为( )A. 回归分析B. 独立性检验分析C. 残差分析D. 散点图分析二、填空题:(本大题共5小题,每小题6分,共30分,把答案填在题中横线上。)13. 在研究身高和体重的关系时,求得相关指数 ,可以叙述为“身高解释了64%的体重变化,而随机误差贡献了剩余的36%”所以身高对体重的效应比随机误差的效应大得多。14. 某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集哪些数据? 。15. 某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:专业性别 非统计专业统计专业男1310女720为了判断主修统计专业是否与性别有关系,根据表中的数据,得到因,所以判定主修统计专业与性别有关系,则这种判断出错的可能性为 16. 许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素的关系时收集了美国50个州的成年人受过9年或更少教育的百分比()和收入低于官方规定的贫困线的人数占本州人数的百分比()的数据,建立的回归直线方程如下,斜率的估计等于0.8说明 ;成年人受过9年或更少教育的百分比()和收入低于官方的贫困线的人数占本州人数的百分比()之间的相关系数 (填充“大于0”或“小于0”)17. 有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:冷漠不冷漠总计多看电视6842110少看电视203858总计8880168则大约有_ _的把握认为多看电视与人变冷漠有关系。三、解答题(203=60)18. (本大题满分20分)在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人。女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动。(1)根据以上数据建立一个22的列联表;(2)判断性别与休闲方式是否有关系。19. (本大题满分20分)某种书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下:x123510203050100200y10.155.524.082.852.111.621.411.301.211.15检验每册书的成本费y与印刷册数的倒数之间是否具有线性相关关系,如有,求出y对x的回归方程。20. (本大题满分20分)营养学家为研究食物中蛋白质含量对婴幼儿生长的影响,调查了一批年龄在两个月到三岁的婴幼儿,将他们按食物中蛋白质含量的高低分为高蛋白食物组和低蛋白食物组两组,并测量身高,得到下面的数据:高蛋白食物组年龄0.20.50.8111.41.8222.52.532.7身高5454.363666973828380.39193.29494低蛋白食物组年龄0.40.7111.5222.42.831.31.80.23身高52556163.46668.567.972767465695177假定身高与年龄近似有线性关系,检验下列问题:不同食物的婴幼儿的身高有无差异;若存在差异,这种差异有何特点?参考答案1. B2. A3. D4. A5. C6. C7.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论