版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1010. .4 4变量间的相关关系、变量间的相关关系、 统计案例统计案例 -2- 知识梳理双基自测23415自测点评 1.变量间的相关关系 (1)定义:当自变量取值一定时,因变量的取值带有一定随机性的 两个变量之间的关系叫做相关关系.与函数关系不同,相关关系是 一种. (2)散点图:表示具有相关关系的两个变量的一组数据的图形叫做 散点图,它可直观地判断两个变量的关系是否可以用线性关系表示. 若这些点分布在从左下角到右上角的区域,则称两个变量 ;若这些点分布在从左上角到右下角的区域,则称两个变量 . (3)线性相关关系、回归直线:如果散点图中的点的分布从整体上 看大致在,那么就称这两个变量之间
2、 具有线性相关关系,这条直线叫做回归直线. 非确定性关系 正相关 负相关 一条直线附近 -3- 知识梳理双基自测23415自测点评 (4)非线性相关:若散点图上所有点看上去都在 附近波动,则称这两个变量 为非线性相关.此时,可以用来拟合. (5)不相关:如果所有的点在散点图中, 则称这两个变量是不相关的. 某条曲线(不是一条直线) 一条曲线 没有显示任何关系 -4- 知识梳理双基自测自测点评23415 2.回归分析 对具有相关关系的两个变量进行统计分析的方法叫做回归分析. 在线性回归模型y=bx+a+e中,因变量y的值由自变量x和随机误差e 共同确定,即自变量x只能解释部分y的变化,在统计中,
3、我们把自变 量x称为,因变量y称为.解释变量 预报变量 -5- 知识梳理双基自测自测点评23415 -6- 知识梳理双基自测自测点评23415 4.相关系数 ,它主要用于相关量的显著性检验,以衡量 它们之间的线性相关程度.当r0时表示两个变量正相关,当r0 时表示两个变量负相关.|r|越接近1,表明两个变量的线性相关性 ;当|r|接近0时,表明两个变量间几乎不存在 . 越强 线性相关性 -7- 知识梳理双基自测自测点评23415 5.独立性检验 (1)分类变量:变量的不同“值”表示个体所属的, 像这类变量称为分类变量. (2)列联表:列出两个分类变量的,称为列联表.假设 有两个分类变量X和Y,
4、它们的可能取值分别为x1,x2和y1,y2,其样 本频数列联表(称为22列联表)为 22列联表 不同类别 频数表 -8- 知识梳理双基自测自测点评23415 (3)独立性检验:利用随机变量K2来确定在多大程度上可以认为 “两个分类变量有关系”的方法称为两个分类变量的独立性检验. a+b+c+d 2 -9- 知识梳理双基自测3415自测点评 1.下列结论正确的打“”,错误的打“”. (1)相关关系与函数关系都是一种确定性的关系,也是一种因果关 系.() (2)利用散点图可以直观判断两个变量的关系是否可以用线性关 系表示.() (3)只有两个变量有相关关系,所得到的回归模型才有预测价值. () (
5、4)若事件X,Y的关系越密切,则由观测数据计算得到的K2的观测 值越大.() 答案 答案 关闭 (1)(2)(3)(4)(5) -10- 知识梳理双基自测自测点评23415 答案 答案 关闭 A -11- 知识梳理双基自测自测点评23415 3.(2017辽宁葫芦岛一模)广告投入对商品的销售额有较大影响. 某电商对连续5个年度的广告费和销售额进行统计,得到统计数据 如下表(单位:万元): A.101.2万元 B.108.8万元 C.111.2万元 D.118.2万元 答案解析解析 关闭 答案解析 关闭 -12- 知识梳理双基自测自测点评23415 4.高三年级267位学生参加期末考试,某班37
6、位学生的语文成绩、 数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙 为该班三位学生. 从这次考试成绩看, (1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生 是; (2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 . 答案 答案 关闭 (1)乙(2)数学 -13- 知识梳理双基自测自测点评23415 答案解析解析 关闭 答案解析 关闭 -14- 知识梳理双基自测自测点评 1.若散点图上的点大致分布在某条直线附近,整体上呈线性分布, 则这两个变量具有很强的相关关系. 2.K2越大,“X与Y有关联”的把握程度越大. 3.注意回归分析时对应的结果均是估计值,不要误认
7、为是真实值. 4.要理解回归直线方程中的参数是用最小二乘法得出的,目的是 使距离的平方和最小,不是看具体某一个距离的大小,这样使用求 平方和也避免了讨论绝对值和正负问题. -15- 考点1考点2考点3 例1(1)(2017河南洛阳模拟)为研究语文成绩和英语成绩之间是否 具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点 图(x轴、y轴的单位长度相同),用回归直线方程 近似 地刻画其相关关系,根据图形,以下结论最有可能成立的是() A.线性相关关系较强,b的值为1.25 B.线性相关关系较强,b的值为0.83 C.线性相关关系较强,b的值为-0.87 D.线性相关关系较弱,无研究价值 答
8、案解析解析 关闭 由散点图可以看出两个变量所构成的点在一条直线附近,所以线性相关关 系较强,且应为正相关,所以回归直线方程的斜率应为正数,且从散点图观 察,回归直线方程的斜率应该比y=x的斜率要小一些,综上可知应选B. 答案解析 关闭 B -16- 考点1考点2考点3 (2)甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做 试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表: 则哪位同学的试验结果体现A,B两个变量有更强的线性相关性( ) A.甲 B.乙C.丙 D.丁 思考如何判断两个变量有无相关关系? 答案解析解析 关闭 在验证两个变量之间的线性相关关系时,相关系数的绝对值
9、越接近1,相关 性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越 强,只有丁的残差平方和最小,综上可知丁的试验结果体现了A,B两个变量 有更强的线性相关性,故选D. 答案解析 关闭 D -17- 考点1考点2考点3 解题心得判断两个变量有无相关关系有两个方法:一是根据散点 图,具有很强的直观性,直接得出两个变量是正相关或负相关;二是 计算相关系数法,这种方法能比较准确地反映相关程度,相关系数 的绝对值越接近1,相关性就越强,相关系数就是描述相关性强弱的. -18- 考点1考点2考点3 对点训练对点训练1(1)对四组数据进行统计,获得如图所示的散点图,关于 其相关系数的比较,正
10、确的是() A.r2r40r3r1B.r4r20r1r3 C.r4r20r3r1D.r2r40r1r3 -19- 考点1考点2考点3 (2)四名同学根据各自的样本数据研究变量x,y之间的相关关系, 并求得回归直线方程,分别得到以下四个结论: 其中一定不正确的结论的序号是() A.B.C.D. 答案解析解析 关闭 (1)易知题中图(1)与图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2) 中的样本点集中分布在一条直线附近,故r2r40r36.635,所以在犯错误的概率不超过0.01的前提下认为 该地区的老年人需要志愿者提供帮助与性别有关. (3)由(2)的结论知,该地区老年人是否
11、需要帮助与性别有关,并且 从样本数据能看出该地区男性老年人与女性老年人中需要帮助的 比例有明显差异,因此,在调查时,先确定该地区老年人中男、女的 比例,再把老年人分成男、女两层并采用分层抽样的方法取得样本. 可知分层抽样的方法比采用简单随机抽样方法更好. -30- 考点1考点2考点3 解题心得独立性检验就是考察两个分类变量是否有关系,利用独 立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断 和预测,并能较为准确地给出这种判断的可信度;具体做法是根据 公式 计算随机变量的观测值k,k值越大,说 明“两个变量有关系”的可能性越大. -31- 考点1考点2考点3 对点训练对点训练3(201
12、7广东、江西、福建十校联考)某校卫生所成立了 调查小组,调查“按时刷牙与不患龋齿的关系”,对该校某年级800名 学生进行检查,按患龋齿和不患龋齿分类,得汇总数据:按时刷牙且 不患龋齿的学生有160名,不按时刷牙但不患龋齿的学生有100名, 按时刷牙但患龋齿的学生有240名. (1)该校4名校卫生所工作人员甲、乙、丙、丁被随机分成两组, 每组2人,一组负责数据收集,另一组负责数据处理,求工作人员甲、 乙分到同一组的概率. (2)能否在犯错误的概率不超过0.001的前提下认为该年级学生按 时刷牙与不患龋齿有关系? -32- 考点1考点2考点3 解:(1)4人分组的所有情况如下表. 因此4人分组的情
13、况共有6种,其中工作人员甲乙分到同一组有2 种,所以工作人员甲、乙分到同一组的概率是P= . -33- 考点1考点2考点3 (2)根据题意,列22联表如下. 所以在犯错误的概率不超过0.001的前提下认为该年级学生按时 刷牙与不患龋齿有关系. -34- 考点1考点2考点3 2.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确 定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学 表达式;(2)根据一组观测值,预测变量的取值及判断变量取值的变 化趋势;(3)求出线性回归方程. 3.根据K2的值可以判断两个分类变量有关的可信程度,并用来指 导科研和生活实际. -35- 考点1考点2考点3 1.相关关系与函数关系的区别 相关关系与函数关系不同,函数关系中的两个变量之间是一种确 定性关系.例如正方形面积S与边长
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 巡查高危场所工作制度
- 工会联系组工作制度
- 工作制度审核上报制度
- 市舆情中心工作制度
- 干部档案人员工作制度
- 幼儿请假销假工作制度
- 廉情信息系统工作制度
- 建筑稽查大队工作制度
- 2026年公共基础知识试题及答案
- 2026年工作落实长效机制实施方案
- 人工智能助力智慧护理的发展
- 全国职业院校技能大赛高职组(市政管线(道)数字化施工赛项)考试题库(含答案)
- 2025年江西赣州市政公用集团招聘笔试参考题库含答案解析
- 胆管癌介入治疗护理
- 鸟的天堂(说课稿)部编版语文五年级上册
- EN-ISO-5817-焊缝检验及评定缺欠-质量分级指南
- 妇产科品管圈汇报提高产房医护人员感控执行率
- SY-T 5412-2023 下套管作业规程
- DL∕T 656-2016 火力发电厂汽轮机控制及保护系统验收测试规程
- 胰腺癌的超声诊断
- (正式版)JTT 1497-2024 公路桥梁塔柱施工平台及通道安全技术要求
评论
0/150
提交评论