版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2.3.1 变量间的相关关系,在学校,老师经常对学生这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题。”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系。这种说法有没有依据呢,思考,凭我们的学习经验可知,物理成绩确实与数学成绩有一定的关系,但除此以外,还存在其他影响物理成绩的因素。例如,是否喜欢物理,用在物理学习上的时间等等。当我们主要考虑数学成绩对物理成绩的影响时,就是主要考虑这两者之间的相关关系,1商品销售收入与广告支出经费之间的关系,商品销售收入与广告支出经费之间有着密切的联系,但商品收入不仅与广告支出多少有关,还与商品质量、居民收入等因素有关,我们还可以
2、举出现实生活中存在的许多相关关系的问题。例如,在一定范围内,施肥量越大,粮食产量就越高。但是,施肥量并不是决定粮食产量的唯一因素,因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素的影响,2粮食产量与施肥量之间的关系,在一定年龄段内,随着年龄的增长,人体内的脂肪含量会增加,但人体内的脂肪含量还与饮食习惯、体育锻炼等有关,可能还与个人的先天体质有关,3人体内脂肪含量与年龄之间的关系,你还能举出一些类似的例子吗,应当说,对于上述各种问题中的两个变量之间的相关关系,我们都可以根据自己的生活、学习经验作出相应的判断,因为“经验当中有规律”。但是,不管你经验多么丰富如果只凭经验办事,还是很容易出错
3、的。因此,在分析两个变量之间的关系时,我们还需要有一些有说服力的方法,自变量取值一定时,因变量的取 值带有一定随机性的两个变量之间的关系,叫做相关关系,变量间相关关系的概念,相同点:两者均是指两个变量间的关系,不同点:函数关系是一种确定的关系;相关关系是一种 非确定的关系.事实上,函数关系是两个非随机变量的关 系,而相关关系是随机变量与随机变量间的关系. 函数关系是一种因果关系,而相关关系不一定是因果关 系,也可能是伴随关系,请同学们回忆一下,我们以前是否学过变量间的关系呢,1.下列关系中,是带有随机性相关关系的是 . 正方形的边长与面积的关系;水稻产量与施肥量之间的关系;人的身高与年龄之间的
4、关系;降雪量与交通事故发生之间的关系,2. 下列两个变量之间的关系哪个不是函数关系() A角度和它的余弦值 B. 正方形边长和面积 C正边形的边数和它的内角和 D. 人的年龄和身高,D,即学即用,年龄,脂肪,23,9.5,27,17.8,39,21.2,41,25.9,45,49,27.5,26.3,50,28.2,53,29.6,54,30.2,56,31.4,57,30.8,年龄,脂肪,58,33.5,60,35.2,61,34.6,如上的一组数据,你能分析人体的脂肪含量与年龄之间有怎样的关系吗,探究,1 、散点图,将各数据在平面坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这
5、样的图形叫做散点图。 如下图,O,20,25,30,35,40,45,50,55,60,65,年龄,脂肪含量,5,10,15,20,25,30,35,40,从刚才的散点图发现:年龄越大,体内脂肪含量越高,点的位置散布在从左下角到右上角的区域。称它们成正相关。但有的两个变量的相关,如下图所示,如高原含氧量与海拔高度的相关关系,海平面以上,海拔高度越高,含氧量越少。 作出散点图发现,它们散布在从左上角到右下角的区域内。又如汽车的载重和汽车每消耗1升汽油所行使的平均路程,称它们成负相关,思考:课本P86的思考题,例1:5个学生的数学和物理成绩如下表,画出散点图,并判断它们是否有相关关系,数学成绩,解
6、,由散点图可见,两者之间具有正相关关系,例2:有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表,摄氏温度 -5 0 4 7 12 15 19 23 27 31 36,热饮杯数 156 150 132 128 130 116 104 89 93 76 54,1)画出散点图; (2)从散点图中发现气温与热饮销售杯数之间关系的一般规律,解: (1)散点图,2)气温与热饮杯数成负相关,即气温越高,卖出去的热饮杯数越少,从已经掌握的知识来看,吸烟会损害身体的健康。但是除了吸烟之外还有许多其他的随机因素影响身体健康,人体健康是由很多因素共同作用
7、的结果,我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患病者,吸烟与健康是一种相关关系,所以吸烟不一定引起健康问题,有关法律规定,香烟盒上必须印上“吸烟有害健康”的警示语。吸烟是否一定会引起健康问题?你认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗,但吸烟引起健康问题的可能性大,因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的,练习1,从已经掌握的知识来看,没有发现根据说明“天鹅能够带来孩子”,完全可能存在既能吸引天鹅又使婴儿出生率高的第三个因素(例如独特的环境因素),即天鹅与婴儿出生率之间没有直接的关系,因此 “天鹅能够带来孩子”的结论不可靠,某地区的环
8、境条件适合天鹅栖息繁衍,有人统计发现了一个有趣的现象,如果村庄附近栖息的天鹅多,那么这个村庄的婴儿出生率也高,天鹅少的地方婴儿出生率低。于是,他就得出一个结论:天鹅能够带来孩子。你认为这样得到的结论可靠吗?如何证明这个结论的可靠性,而要证实此结论是否可靠,可以通过试验来进行。相同的环境下将居民随机地分为两组,一组居民和天鹅一起生活(比如家中都饲养天鹅),而另一组居民的附近不让天鹅活动,对比两组居民的出生率是否相同,练习2,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线就叫做回归直线,这条回归直线的方程,简称为回归方程,回归直线,1.如果所有的
9、样本点都落在某一函数曲线上,变量之间具有函数关系 2.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系 3.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系 只有散点图中的点呈条状集中在某一直线周围的时候,才可以说两个变量之间具有线性关系,才有两个变量的正线性相关和负线性相关的概念,才可以用回归直线来描述两个变量之间的关系,整体上最接近,方案一:采用测量的方法:先画一条直线,测量出各点到它的距离,然后移动直线,到达一个使距离之和最小的位置,测量出此时直线的斜率和截距,就得到回归方程,如何具体的求出这个回归方程呢,方案二: 在图中选取两点画直线,使得直线两侧的点的个数基本
10、相同,方案三: 在散点图中多取几组点,确定几条直线的方程,分别求出各条直线的斜率和截距的平均数,将这两个平均数作为回归方程的斜率和截距,上述三种方案均有一定的道理,但可靠性不强,我们回到回归直线的定义,求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与直线的偏差最小,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线就叫做回归直线,二)回归直线,如何求回归直线的方程,探究,实际上,求回归直线的关键是如何用数学的方法来刻画”从整体上看,各点到此直线的距离最小,回归直线,实际上,求回归直线的关键是如何用数学的方法来刻画“从整体上看,各点到此
11、直线的距离最小,问题归结为:a,b取什么值时Q最小,即总体偏差最小.下面是计算回归方程的斜率和截距的一般公式,这种通过求总体偏差的最小值而得到回归直线的方法就是最小二乘法,以上公式的推导较复杂,故不作推导,但它的原理较为简单:即各点到该直线的距离的平方和最小,这一方法叫最小二乘法,归纳,求样本数据的线性回归方程,可按下列步骤进行,第一步,计算平均数,第二步,求和 , (列表,第三步,计算,第四步,写出回归方程,思考:利用计算器或计算机可求得年龄和人体脂肪含量的样本数据的回归方程为 ,由此我们可以根据一个人年龄预测其体内脂肪含量的百分比的回归值.若某人65岁,则其体内脂肪含量的百分比约为多少,3
12、7.1 (0.57765-0.448= 37.1,若某人65岁,可预测他体内脂肪含量在37.1(0.57765-0.448= 37.1)附近的可能性比较大。 但不能说他体内脂肪含量一定是37.1 原因:线性回归方程中的截距和斜率都是通过样本计算的,存在随机误差,这种误差可以导致预测结果的偏差,即使截距斜率没有误差,也不可能百分百地保证对应于x,预报值Y能等于实际值y,例3:有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表,1、画出散点图; 2、从散点图中发现气温与热饮销售杯数之间关系的一般规律; 3、求回归方程; 4、如果某天的气温
13、是2摄氏度,预测这天卖出的热饮杯数,1、散点图,2、从图3-1看到,各点散布在从左上角到由下角的区域里,因此,气温与热饮销售杯数之间成负相关,即气温越高,卖出去的热饮杯数越少,3、从散点图可以看出,这些点大致分布在一条直线的附近,因此利用公式求出回归方程的系数。 Y= -2.352x+147.767,4、当x=2时,Y=143.063 因此,某天的气温为2摄氏度时,这天大约可以卖出143杯热饮,例4:给出施化肥量对水稻产量影响的 试验数据,1)画出上表的散点图; (2)求出回归直线并且画出图形,从而得回归直线方程是,解:(1)散点图(略) (2)表中的数据进行具体计算,列成以下表格,图形略,故可得到,练习,1.已知变量x和变量y有下列对应数据,则y对x的回归直线方程为什么,2、下列两个变量之间的关系哪个不是函数关系( ) A角度和它的余弦值 B. 正方形边长和面积 C正边形的边数和它的内角和 D. 人的年龄和身高,D,A,当变量x增加1个单位时, 平均增加b个单位,B,D,11.69,8、已知回归方程 =4.4x+838.19,则可估计x与y的增长速度之比约为_,1/4.4,9.三点(3,10),(7,20),(11,24)的线性回归方程是(,D,小结,1.求样本数据的线性回归方程,可按下列步骤进行,第
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 放射线工程电工安全生产责任制培训
- 医疗废物管理人员及相关工作人员培训
- 空分装置安全运行管理规定培训
- 电梯安全管理与作业人员职责培训
- 工贸企业设备管理员安全生产责任制培训课件
- 追溯标识管理办法培训课件
- 2026年医疗健康代咨询合同协议
- 焊接材料验收与储存管理规范培训
- 2026年广东交通职业技术学院单招综合素质考试题库附答案详解(满分必刷)
- 20201112初一数学(人教版)解一元一次方程(二)(4)-4课后练习
- GB/T 41424.2-2025皮革沾污性能的测定第2部分:马丁代尔摩擦法
- 汽车员工代购合同范本
- 手写板输入文字课件
- 2026年湖南高速铁路职业技术学院单招职业技能测试必刷测试卷完美版
- 2021新安全生产法课件
- 绿色电厂营销方案
- T-CHSA 104-2025 咬合板治疗颞下颌关节紊乱病专家共识
- 2026年江西外语外贸职业学院单招职业技能测试必刷测试卷必考题
- DB5328∕T 25-2023 姜黄栽培技术规程
- 企业财务管理指标评估体系
- 汉服妆造基础知识培训
评论
0/150
提交评论