




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、学必求其心得,业必贵于专精2。3 变量间的相关关系项目内容课题2。3 变量间的相关关系(共2 课时)修改与创新教学目标1。 通过收集现实问题中两个有关联变量的数据认识变量间的相关关系。2.明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系。3.经历用不同估算方法描述两个变量线性相关的过程知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程教学重、难点教学重点 :通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系;利用散点图直观认识两个变量之间的线性关系;根据给出的线性回归方程的系数公式
2、建立线性回归方程教学难点:变量之间相关关系的理解;作散点学必求其心得,业必贵于专精图和理解两个变量的正相关和负相关;理解最小二乘法的思想 .教学准备多媒体课件教学过程第 1 课时导入新课在学校里 ,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题。”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系。这种说法有没有根据呢?请同学们如实填写下表(在空格中打“” ) :好中差你的数学成绩你的物理成绩学生讨论:我们可以发现自己的数学成绩和物理成绩存在某种关系.(似乎就是数学好的,物理也好;数学差的 ,物理也差,但又不学必求其心得,业必贵于专精全对。)物理成
3、绩和数学成绩是两个变量,从经验看 ,由于物理学习要用到比较多的数学知识和数学方法。数学成绩的高低对物理成绩的高低是有一定影响的。但决非唯一因素,还有其他因素 ,如是否喜欢物理,用在物理学习上的时间等等。 (总结 :不能通过一个人的数学成绩是多少就准确地断定他的物理成绩能达到多少 .但这两个变量是有一定关系的,它们之间是一种不确定性的关系.如何通过数学成绩的结果对物理成绩进行合理估计有非常重要的现实意义 .)为很好地说明上述问题,我们开始学习变量之间的相关关系和两个变量的线性相关。(教师板书课题 )推进新课新知探究提出问题(1)粮食产量与施肥量有关系吗?“名师出高徒”可以解释为教师的水平越高,学
4、生的水平也越高 .教师的水平与学生的水平有什么关系?你能举出更多的描述生活中两个变量的相关关系的成语吗?(2)两个变量间的相关关系是什么?有几种?学必求其心得,业必贵于专精(3)两个变量间的相关关系的判断。讨论结果:(1)粮食产量与施肥量有关系, 一般是在标准范围内 ,施肥越多 ,粮食产量越高 ;教师的水平与学生的水平是相关的 ,如水滴石穿,三人行必有我师等 .我们还可以举出现实生活中存在的许多相关关系的问题 .例如:商品销售收入与广告支出经费之间的关系.商品销售收入与广告支出经费有着密切的联系 ,但商品销售收入不仅与广告支出多少有关 ,还与商品质量、居民收入等因素有关。粮食产量与施肥量之间的
5、关系。在一定范围内,施肥量越大,粮食产量就越高 .但是 ,施肥量并不是决定粮食产量的唯一因素.因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素的影响。人体内的脂肪含量与年龄之间的关系.在一定年龄段内 ,随着年龄的增长,人体内的脂肪含量会增加,但人体内的脂肪含量还与饮食习惯、体育锻炼等有关,可能还与个人的先天体质有关。学必求其心得,业必贵于专精应当说,对于上述各种问题中的两个变量之间的相关关系,我们都可以根据自己的生活、学习经验作出相应的判断,因为“经验当中有规律”. 但是,不管你的经验多么丰富,如果只凭经验办事,还是很容易出错的。因此 ,在分析两个变量之间的相关关系时,我们需要一些有说
6、服力的方法.在寻找变量之间相关关系的过程中,统计同样发挥着非常重要的作用.因为上面提到的这种关系,并不像匀速直线运动中时间与路程的关系那样是完全确定的,而是带有不确定性 .这就需要通过收集大量的数据(有时通过调查,有时通过实验 ),在对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系作出判断 .(2)相关关系的概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系 .两个变量之间的关系分两类 :确定性的函数关系,例如我们以前学习过的一次函数、二次函数等;带有随机性的变量间的相关关系,例 如“身高者 ,体重也重 ,我们就说身高与体重这学必求其心得,业必
7、贵于专精两个变量具有相关关系.相关关系是一种非确定性关系。如商品销售收入与广告支出经费之间的关系.(还与商品质量、居民收入、生活环境等有关)(3)两个变量间的相关关系的判断: 散点图。根据散点图中变量的对应点的离散程度,可以准确地判断两个变量是否具有相关关系 . 正相关、负相关的概念 .教学散点图出示例题:在一次对人体脂肪含量和年龄关系的研究中 ,研究人员获得了一组样本数据:年龄23273841454950脂肪9。5 17.8 21。225.9 27.5 26.3 28。2年龄53545657586061脂肪29.6 30。231.4 30.8 33.5 35。234.6分析数据:大体上来看,
8、随着年龄的增加,人体中脂肪的百分比也在增加.我们可以作散点图来进一步分析 .学必求其心得,业必贵于专精散点图的概念:将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,如下图 .从散点图我们可以看出,年龄越大,体内脂肪含量越高.图中点的趋势表明两个变量之间确实存在一定的关系,这个图支持了我们从数据表中得出的结论.(a。如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系 b。如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系。c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)正相关与
9、负相关的概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关 .如果散点图中的点散布在从左上角到右下角的区域内 ,称为负相关 .(注:散点图的点如果几乎没有什么规则,则这两个变量学必求其心得,业必贵于专精之间不具有相关关系)应用示例例 1 下列关系中,带有随机性相关关系的是_ 。正方形的边长与面积之间的关系水稻产量与施肥量之间的关系人的身高与年龄之间的关系降雪量与交通事故的发生率之间的关系解析: 两变量之间的关系有两种:函数关系与带有随机性的相关关系。正方形的边长与面积之间的关系是函数关系。水稻产量与施肥量之间的关系不是严格的函数关系,但是具有相关性 ,因而是相关关系。人的身高与年
10、龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系。降雪量与交通事故的发生率之间具有相关关系,因此填.答案: 例 2 有关法律规定,香烟盒上必须印上“吸烟有害健康”的警示语。吸烟是否一定会引起健康问题?你认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?学必求其心得,业必贵于专精分析: 学生思考,然后讨论交流,教师及时评价.解:从已经掌握的知识来看,吸烟会损害身体的健康 ,但是除了吸烟之外,还有许多其他的随机因素影响身体健康,人体健康是很多因素共同作用的结果。我们可以找到长寿的吸烟者 ,也更容易发现由于吸烟而引发的患病
11、者 ,所以吸烟不一定引起健康问题.但吸烟引起健康问题的可能性大.因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的 .点评: 在探究研究的过程中 ,如果能够从两个变量的观察数据之间发现相关关系是极为有意义的,由此可以进一步研究二者之间是否蕴涵因果关系,从而发现引起这种相关关系的本质原因是什么。本题的意义在于引导学生重视对统计结果的解释,从中发现进一步研究的问题 .知能训练一个车间为了规定工时定额,需要确定加工零件所花费的时间 ,为此进行了10 次试验,收集数据如下 :零件12345670 80 90 10学必求其心得,业必贵于专精数 x(个)0000000加工时间 y(min)6
12、26875818995102108115122画出散点图;关于加工零件的个数与加工时间,你能得出什么结论?答案: (1)散点图如下:(2)加工零件的个数与所花费的时间呈正线性相关关系拓展提升以下是某地搜集到的新房屋的销售价格y 和房屋的面积 x 的数据:房屋面积(m2)11511080135105销售价格(万元)24.8 21。618.429.222学必求其心得,业必贵于专精(1)画出数据对应的散点图;(2)指出是正相关还是负相关;(3) 关于销售价格 y 和房屋的面积 x,你能得出什么结论 ?解:(1)数据对应的散点图如下图所示:(2)散点图中的点散分布在从左下角到右上角的区域内 ,所以是正
13、相关 .(3)关于销售价格 y 和房屋的面积 x,房屋的面积越大,价格越高,它们呈正线性相关的关系。课堂小结通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。作业习题 2。3a 组 3、4(1).第 2 课时导入新课某小卖部为了了解热茶销售量与气温之学必求其心得,业必贵于专精间的关系,随机统计并制作了某6 天卖出热茶的杯数与当天气温的对照表:气温/ 2618131041杯数202434385064如果某天的气温是-5 , 你能根据这些数据预测这天小卖部卖出热茶的杯数吗?为解决这个问题我们接着学习两个变量的线性相关-回归直线及其方程 .推进新课新知探究提出问
14、题(1)作散点图的步骤和方法?(2)正、负相关的概念?(3)什么是线性相关?(4)看人体的脂肪百分比和年龄的散点图,当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢?(5)什么叫做回归直线?(6)如何求回归直线的方程?什么是最小二乘法?它有什么样的思想?(7)利用计算机如何求回归直线的方程?(8)利用计算器如何求回归直线的方程?学必求其心得,业必贵于专精活动:学生回顾 ,再思考或讨论,教师及时提示指导 .讨论结果: (1)建立相应的平面直角坐标系,将各数据在平面直角坐标中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图 . (a。如果所有的样本点都落在某一函数曲线上
15、,就用该函数来描述变量之间的关系,即变量之间具有函数关系b.如果所有的样本点都落在某一函数曲线附近 ,变量之间就有相关关系。c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)(2)如果散点图中的点散布在从左下角到右上角的区域内 ,称为正相关 .如果散点图中的点散布在从左上角到右下角的区域内,称为负相关。(3) 如果所有的样本点都落在某一直线附近,变量之间就有线性相关的关系。(4)大体上来看 ,随着年龄的增加 ,人体中脂肪的百分比也在增加 ,呈正相关的趋势,我们可以从散点图上来进一步分析.(5)如下图:学必求其心得,业必贵于专精从散点图上可以看出,这些点大致分布在通过散点图中心的
16、一条直线附近。如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关 系,这条直 线叫 做回 归直线 (regression line) 。如果能够求出这条回归直线的方程(简称回归方程 ),那么我们就可以比较清楚地了解年龄与体内脂肪含量的相关性。就像平均数可以作为一个变量的数据的代表一样,这条直线可以作为两个变量具有线性相关关系的代表 .(6)从散点图上可以发现 ,人体的脂肪百分比和年龄的散点图,大致分布在通过散点图中心的一条直线。那么,我们应当如何具体求出这个回归方程呢 ?有的同学可能会想,我可以采用测量的方法 ,先画出一条直线,测量出各点与它的距离,然后移动
17、直线,到达一个使距离的和最小学必求其心得,业必贵于专精的位置,测量出此时的斜率和截距,就可得到回归方程了 .但是,这样做可靠吗?有的同学可能还会想,在图中选择这样的两点画直线 ,使得直线两侧的点的个数基本相同 .同样地 ,这样做能保证各点与此直线在整体上是最接近的吗 ?还有的同学会想,在散点图中多取几组点,确定出几条直线的方程,再分别求出各条直线的斜率、截距的平均数,将这两个平均数当成回归方程的斜率和截距。同学们不妨去实践一下,看看这些方法是不是真的可行?(学生讨论: 1。选择能反映直线变化的两个点.2。在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.3。多取几组点对 ,确定几条直线
18、方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距。 )教师:分别分析各方法的可靠性.如下图 :学必求其心得,业必贵于专精上面这些方法虽然有一定的道理,但总让人感到可靠性不强 .实际上,求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与此直线的距离最小”。人们经过长期的实践与研究,已经得出了计算回归方程的斜率与截距的一般公式.) 1(,)()(2121121xbyaxnxyxnyxxxyyxxbniiniiiniiniii其中, b 是回归方程的斜率, a是截距 .推导公式的计算比较复杂,这里不作推导.但是,我们可以解释一下得出它的原理。假设我们已经得到两个
19、具有线性相关关系的变量的一组数据 (x1,y1), (x2,y2), ,(xn,yn),学必求其心得,业必贵于专精且所求回归方程是y=bx+a,其中 a、 b是待定参数 .当变量 x取 xi(i=1, 2, ,n)时可以得到y=bxi+a(i=1,2, n),它 与 实 际 收 集 到 的yi之 间 的 偏 差 是yiy=yi-(bxi+a) (i=1,2, n) 。这样,用这 n 个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的。由于(yi-y)可正可负,为了避免相互抵消,可以考虑用niiiyy1|来代替,但由于它含有绝对值,运算不太方便,所以改用 q=(y1-bx1-a)2+(y2-
20、bx2-a)2+(yn-bxn-a)2来刻画 n 个点与回归直线在整体上的偏差。这样,问题就归结为:当a,b 取什么值时q最小,即总体偏差最小。经过数学上求最小值的运算, a,b 的值由公式给出。通过求式的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法(method of least square ) 。学必求其心得,业必贵于专精(7)利用计算机求回归直线的方程。根据最小二乘法的思想和公式, 利用计算器或计算机, 可以方便地求出回归方程。以 excel软件为例,用散点图来建立表示人体的脂肪含量与年龄的相关关系的线性回归方程 ,具体步骤如
21、下 :在 excel 中选定表示人体的脂肪含量与年龄的相关关系的散点图(如下图 ),在菜单中选定“图表”中的“添加趋势线”选项,弹出“添加趋势线”对话框 .单击“类型”标签, 选定“趋势预测 / 回归分析类型 中的“线性”选项,单击“确定”按钮,得到回归直线 .双击回归直线,弹出“趋势线格式”对话框。单击“选项 标签,选定“显示公式”,最后单击“确定 按钮,得到回归直线的回归方程y=0。577x-0 。448.(8)利用计算器求回归直线的方程。学必求其心得,业必贵于专精用计算器求这个回归方程的过程如下:所以回归方程为y=0.577x-0.448.正像本节开头所说的,我们从人体脂肪含量与年龄这两
22、个变量的一组随机样本数据中,找到了它们之间关系的一个规律,这个规律是由回归直线来反映的。直线回归方程的应用 :描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系。利用回归方程进行预测;把预报因子(即自变量 x)代入回归方程对预报量 (即因变量y)进行估计 ,即可得到个体 y 值的容许区间。利用回归方程进行统计控制规定y 值的变化,通过控制x 的范围来实现统计控制的目标.如已经得到了空气中no2的浓度和汽车流量间的回归方程,即可通过控制汽车流量学必求其心得,业必贵于专精来控制空气中 no2的浓度 .应用示例例 1 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的
23、影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:摄氏温度/ -504712 15 19 23273136热饮杯数15615013212813011610489937654(1)画出散点图;(2) 从散点图中发现气温与热饮销售杯数之间关系的一般规律;(3)求回归方程;(4)如果某天的气温是2 ,预测这天卖出的热饮杯数。解: (1)散点图如下图所示:学必求其心得,业必贵于专精(2)从上图看到 ,各点散布在从左上角到右下角的区域里 ,因此 ,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮杯数越少。(3)从散点图可以看出, 这些点大致分布在一条直线的附近,因此 ,可用公式求出回归方
24、程的系数 .利 用 计 算 器 容 易 求 得 回 归 方 程y=-2.352x+147.767 。(4)当 x=2 时,y=143。063。因此,某天的气温为 2 时,这天大约可以卖出143杯热饮.思考气温为 2 时, 小卖部一定能够卖出143杯左右热饮吗 ?为什么?这里的答案是小卖部不一定能够卖出143杯左右热饮,原因如下:1.线性回归方程中的截距和斜率都是通过样学必求其心得,业必贵于专精本估计出来的,存在随机误差,这种误差可以导致预测结果的偏差。2.即使截距和斜率的估计没有误差, 也不可能百分之百地保证对应于x 的预报值 ,能够与实际值 y 很接近 .我们不能保证点 (x,y) 落在回归
25、直线上,甚至不能百分之百地保证它落在回归直线的附近 ,事实上, y=bx+a+e=y+e.这里 e是随机变量,预报值y与实际值 y的接近程度由随机变量e的标准差所决定 .一些学生可能会提出问题:既然不一定能够卖出 143 杯左右热饮,那么为什么我们还以“这天大约可以卖出143杯热饮 作为结论呢?这是因为这个结论出现的可能性最大。具体地说 ,假如我们规定可以选择连续的3 个非负整数作为可能的预测结果,则我们选择 142,143和 144能够保证预测成功 (即实际卖出的杯数是这3个数之一)的概率最大。例 2 下表为某地近几年机动车辆数与交通事故数的统计资料。机动车辆数 x千台95110112120
26、129135150180交通事6.2 7.5 7.7 8。 8.7 9.8 10.13学必求其心得,业必贵于专精故数 y千件52(1)请判断机动车辆数与交通事故数之间是否有线性相关关系,如果不具有线性相关关系,说明理由 ;(2)如果具有线性相关关系,求出线性回归方程.解:(1)在直角坐标系中画出数据的散点图,如下图.直观判断散点在一条直线附近,故具有线性相关关系(2)计算相应的数据之和:81iix=1 031,81iiy=71.6,812iix=137 835,81iiiyx=9 611。7。将它们代入公式计算得b 0。077 4,a= 1.024 1,所以,所求线性回归方程为 =0.077
27、4x 1。 024 1.知能训练学必求其心得,业必贵于专精1.下列两个变量之间的关系哪个不是函数关系( )a.角度和它的余弦值b。正方形边长和面积c 。 正 边 形 的 边 数 和 它 的 内 角 和d.人的年龄和身高答案:2三点( 3,10) , (7,20) , (11,24)的线性回归方程是()a。y=5。75-1.75x b.y=1.75+5。75xc.y=1.755。75x d。y=5.75+1。75x答案: 3已知关于某设备的使用年限x 与所支出的维修费用 y(万元) ,有如下统计资料:使用年限x23456维修费用y2238556570设 y 对 x 呈线性相关关系试求:学必求其心
28、得,业必贵于专精(1)线性回归方程y=bx+a 的回归系数 a,b;(2)估计使用年限为10 年时,维修费用是多少?答案: (1)b=1.23,a=0。08;(2)12.38.4我们考虑两个表示变量x 与 y 之间的关系的模型 , 为误差项,模型如下 :模型 1:y=6+4x;模型 2:y=6+4x+e(1)如果 x=3,e=1,分别求两个模型中y 的值;(2) 分别说明以上两个模型是确定性模型还是随机模型解: (1)模型 1: y=6+4x=6+4 3=18 ;模型 2: y=6+4x+e=6+4 3+1=19.(2)模型 1 中相同的 x 值一定得到相同的y值,所以是确定性模型;模型 2
29、中相同的 x 值,因 的不同,所得 y 值不一定相同 ,且 为误差项是随机的,所以模型2是随机性模型5以下是收集到的新房屋销售价格y 与房屋大小 x 的数据:房屋大小 x (m2)80105110115135销售价格 y(万18。42221.624.829.2学必求其心得,业必贵于专精元)(1)画出数据的散点图;(2)用最小二乘法估计求线性回归方程。解: (1)散点图如下图 .(2)n=5,51iix=545,x=109,51iiy=116,y=23。2,512iix=60 952,51iiiyx=12 952,b=25456095251165451295250。 199, a=23。 20。199 109 1.509,所以,线性回归方程为 y=0.199x+1。509 拓展提升某调查者从调查中获知某公司近年来科研费用支出( xi)与公司所获得利润(yi)的统计资料如下表:科研费用支出( xi)与利润(yi)统计表单位:万元年份科研费用支出利润1998531学必求其心得,业必贵于专精199920002001200220031145324030342520合计30180要求估计利润( yi)对科研费用支出 (xi)的线性回归
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年实验室上岗试题及答案
- 2025年山西省政府采购评审专家考试真题含答案
- CN222959673U 直线型汽车座椅靠背电动锁栓 (浙江华悦汽车零部件股份有限公司)
- 2025年加氢模拟试题及答案
- 珠宝考研试题及答案
- 电厂检修培训考试题及答案
- CN120093336B 利用螺旋ct影像实现脊柱形变患者骨质疏松筛查的方法 (广东医科大学附属医院)
- CN120079912B 一种铝电机前端盖钻孔加工装置及加工方法 (山西三鼎机械制造股份有限公司)
- 2025年后置埋件题库及答案
- 国际贸易政策与经济波动
- 《心房颤动诊断和治疗中国指南2023》-抗凝解读
- DZ∕T 0033-2020 固体矿产地质勘查报告编写规范(正式版)
- 模块化箱式房屋安装及验收技术标准2
- 健康讲座:颈椎病
- NY-T 3213-2023 植保无人驾驶航空器 质量评价技术规范
- 金融数据分析 课件 欧阳资生 第1-5章 导论、金融时间序列线性模型 -极值事件
- 刀工刀法与烹饪技艺
- 桁吊操作培训课件
- 柔性电子材料的突破与发展
- 企业内部涉密测绘成果使用流程规章制度
- 低年级中秋节班会
评论
0/150
提交评论