版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、10.4变量间的相关关系、 统计案例,-2-,知识梳理,双基自测,2,3,4,1,5,自测点评,1.变量间的相关关系 (1)定义:当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.与函数关系不同,相关关系是一种. (2)散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图,它可直观地判断两个变量的关系是否可以用线性关系表示.若这些点分布在从左下角到右上角的区域,则称两个变量;若这些点分布在从左上角到右下角的区域,则称两个变量. (3)线性相关关系、回归直线:如果散点图中的点的分布从整体上看大致在,那么就称这两个变量之间具有线性相关关系,这条直线叫做回归直线
2、.,非确定性关系,正相关,负相关,一条直线附近,-3-,知识梳理,双基自测,2,3,4,1,5,自测点评,(4)非线性相关:若散点图上所有点看上去都在 附近波动,则称这两个变量为非线性相关.此时,可以用来拟合. (5)不相关:如果所有的点在散点图中,则称这两个变量是不相关的.,某条曲线(不是一条直线),一条曲线,没有显示任何关系,-4-,知识梳理,双基自测,自测点评,2,3,4,1,5,2.回归分析 对具有相关关系的两个变量进行统计分析的方法叫做回归分析.在线性回归模型y=bx+a+e中,因变量y的值由自变量x和随机误差e共同确定,即自变量x只能解释部分y的变化,在统计中,我们把自变量x称为,
3、因变量y称为.,解释变量,预报变量,-5-,知识梳理,双基自测,自测点评,2,3,4,1,5,-6-,知识梳理,双基自测,自测点评,2,3,4,1,5,4.相关系数 ,它主要用于相关量的显著性检验,以衡量 它们之间的线性相关程度.当r0时表示两个变量正相关,当r0时表示两个变量负相关.|r|越接近1,表明两个变量的线性相关性;当|r|接近0时,表明两个变量间几乎不存在.,越强,线性相关性,-7-,知识梳理,双基自测,自测点评,2,3,4,1,5,5.独立性检验 (1)分类变量:变量的不同“值”表示个体所属的,像这类变量称为分类变量. (2)列联表:列出两个分类变量的,称为列联表.假设有两个分类
4、变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为 22列联表,不同类别,频数表,-8-,知识梳理,双基自测,自测点评,2,3,4,1,5,(3)独立性检验:利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.,a+b+c+d,2,-9-,知识梳理,双基自测,3,4,1,5,自测点评,1.下列结论正确的打“”,错误的打“”. (1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.() (2)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示.() (3)只有两个变量有相关关系,所得到的回
5、归模型才有预测价值. () (4)若事件X,Y的关系越密切,则由观测数据计算得到的K2的观测值越大.(),答案,-10-,知识梳理,双基自测,自测点评,2,3,4,1,5,答案,-11-,知识梳理,双基自测,自测点评,2,3,4,1,5,3.(2016河南焦作二模)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: A.11.4万元B.11.8万元 C.12.0万元D.12.2万元,答案,-12-,知识梳理,双基自测,自测点评,2,3,4,1,5,4.高三年级267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级中的排名情况如下图所
6、示,甲、乙、丙为该班三位学生. 从这次考试成绩看, (1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是; (2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是.,答案,-13-,知识梳理,双基自测,自测点评,2,3,4,1,5,答案,解析,-14-,知识梳理,双基自测,自测点评,1.若散点图上的点大致分布在某条直线附近,整体上呈线性分布,则这两个变量具有很强的相关关系. 2.K2越大,“X与Y有关联”的把握程度越大. 3.注意回归分析时对应的结果均是估计值,不要误认为是真实值. 4.要理解回归直线方程中的参数是用最小二乘法得出的,目的是使距离的平方和最小,不是看具体某一个距
7、离的大小,这样使用求平方和也避免了讨论绝对值和正负问题.,-15-,考点1,考点2,考点3,例1(1)对变量x,y有观测数据(xi,yi)(i=1,2,10),得散点图;对变量u,v有观测数据(ui,vi)(i=1,2,10),得散点图,由这两个散点图可以判断() 图图,-16-,考点1,考点2,考点3,A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关 C.变量x与y负相关,u与v正相关 D.变量x与y负相关,u与v负相关 (2)甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表: 则哪位同学的试验结果体现
8、A,B两个变量有更强的线性相关性() A.甲B.乙C.丙D.丁 思考如何判断两个变量有无相关关系?,答案,解析,-17-,考点1,考点2,考点3,解题心得判断两个变量有无相关关系有两个方法:一是根据散点图,具有很强的直观性,直接得出两个变量是正相关或负相关;二是计算相关系数法,这种方法能比较准确地反映相关程度,相关系数的绝对值越接近1,相关性就越强,相关系数就是描述相关性强弱的.,-18-,考点1,考点2,考点3,对点训练1(1)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是() A.r2r40r3r1B.r4r20r1r3 C.r4r20r3r1D.r2r40r1r
9、3,-19-,考点1,考点2,考点3,(2)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论: 其中一定不正确的结论的序号是() A.B.C.D.,答案,解析,-20-,考点1,考点2,考点3,例2下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图. 注:年份代码1-7分别对应年份2008-2014.,-21-,考点1,考点2,考点3,(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明; (2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注:,-22-,
10、考点1,考点2,考点3,思考对已知的两个变量的一组数据如何做回归分析?,-23-,考点1,考点2,考点3,-24-,考点1,考点2,考点3,-25-,考点1,考点2,考点3,解题心得1.在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系;若具有线性相关关系,则可通过线性回归方程来估计和预测.,-26-,考点1,考点2,考点3,对点训练2下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(单位:吨)与相应的生产能耗y(单位:吨标准煤)的几组对照数据. (1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程
11、(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:32.5+43+54+64.5=66.5),-27-,考点1,考点2,考点3,-28-,考点1,考点2,考点3,-29-,考点1,考点2,考点3,例3为了调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:,-30-,考点1,考点2,考点3,(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例; (2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人需要志愿者提供帮助与性
12、别有关? (3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由. 思考独立性检验得出的结论是什么?它对我们日常生活有什么帮助?,-31-,考点1,考点2,考点3,解 (1)调查的500位老年人中有70位需要志愿者提供帮助, 因此该地区老年人中,需要帮助的老年人的比例的估计值为 由于9.9676.635,所以在犯错误的概率不超过0.01的前提下认为该地区的老年人需要志愿者提供帮助与性别有关.,(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此,在调
13、查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样的方法取得样本.可知分层抽样的方法比采用简单随机抽样方法更好.,-32-,考点1,考点2,考点3,解题心得独立性检验就是考察两个分类变量是否有关系,利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测,并能较为准确地给出这种判断的可信度;具体做法是根据公式 计算随机变量的观测值k,k值越大,说明“两个变量有关系”的可能性越大.,-33-,考点1,考点2,考点3,对点训练3(2016湖南高考冲刺卷)某学校为了研究学情,从高三年级中抽取了20名学生三次测试的数学成绩和物理成绩,计算出了他们三次成绩的平均
14、名次如下表:,-34-,考点1,考点2,考点3,学校规定平均名次小于或等于40.0为优秀,大于40.0为不优秀. (1)在序号为1,2,3,4,5,6这6名学生中随机抽取2名,求这两名学生数学和物理都优秀的概率. (2)根据这次抽查数据,列出22列联表,能否在犯错误的概率不超过0.025的前提下认为物理成绩和数学成绩有关?(下面的临界值表和公式可供参考:,-35-,考点1,考点2,考点3,解 (1)在序号为1,2,3,4,5,6这6名学生中随机抽取2名,共有15种情况,两名学生数学和物理都优秀的有4名学生,随机抽取2名有6种情况.因此这两名学生数学和物理都优秀的概率为,-36-,考点1,考点2,考点3,(2)根据条件列出列联表如下: 因此根据这次抽查数据可知,在犯错误的概率不超过0.025的前提下认为物理成绩与数学成绩有关系.,-37-,考点1,考点2,考点3,2.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观测值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程. 3.根据K2的值可以判断两个分类变量有关的可信程度,并用来指导科研和生活实际.,-38-,考点1,考点2,考点3,1.相关关系与函数关系的区别 相关关系与函数关系不同,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 上海财经大学浙江学院《科学社会主义》2024-2025学年第二学期期末试卷
- 机关内部人事制度
- 中南财经政法大学《天气学诊断与应用》2024-2025学年第二学期期末试卷
- 机构教育内部管理制度
- 林业人内部管理制度
- 某某公司内部控制制度
- 资阳环境科技职业学院《运动项目理论与方法》2024-2025学年第二学期期末试卷
- 检测行业内部控制制度
- 民政内部财务控制制度
- 海员培训内部管理制度
- 租赁合同(2025年写字楼转租)
- 设计公司钉钉考勤制度
- 2026年江苏农林职业技术学院单招职业技能考试题库附答案解析
- 2026年上饶职业技术学院单招职业适应性测试题库及答案详解(历年真题)
- 2026石嘴山市能达建设发展有限公司招聘3人考试参考题库及答案解析
- 2026陕煤集团榆林化学有限责任公司招聘(162人)考试参考试题及答案解析
- 2026年春季人教版小学数学三年级下册教学计划(含进度表)
- 挂篮使用说明书
- 员工合规意识培训
- 2026年《必背60题》通信工程专业26届考研复试高频面试题包含详细解答
- 2026年生活会上“红脸出汗”的相互批评意见(六大类60条)
评论
0/150
提交评论