




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1010. .4 4变量间的相关关系变量间的相关关系、 统计统计案例案例-2-知识梳理双基自测234151.变量间的相关关系(1)定义:当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.与函数关系不同,相关关系是一种.(2)散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图,它可直观地判断两个变量的关系是否可以用线性关系表示.若这些点分布在从左下角到右上角的区域,则称两个变量;若这些点分布在从左上角到右下角的区域,则称两个变量.(3)线性相关关系、回归直线:如果散点图中的点的分布从整体上看大致在,那么就称这两个变量之间具有线性相关关系,这条直线叫做回归直
2、线.非确定性关系 正相关 负相关 一条直线附近 -3-知识梳理双基自测23415(4)非线性相关:若散点图上所有点看上去都在附近波动,则称这两个变量为非线性相关.此时,可以用来拟合.(5)不相关:如果所有的点在散点图中,那么称这两个变量是不相关的.某条曲线(不是一条直线) 一条曲线 没有显示任何关系 -4-知识梳理双基自测234152.回归分析对具有相关关系的两个变量进行统计分析的方法叫做回归分析.在线性回归模型y=bx+a+e中,因变量y的值由自变量x和随机误差e共同确定,即自变量x只能解释部分y的变化,在统计中,我们把自变量x称为,因变量y称为.解释变量 预报变量 -5-知识梳理双基自测2
3、3415-6-知识梳理双基自测234154.相关系数 ,它主要用于相关量的显著性检验,以衡量它们之间的线性相关程度.当r0时表示两个变量正相关,当r0时表示两个变量负相关.|r|越接近1,表明两个变量的线性相关性;当|r|接近0时,表明两个变量间几乎不存在.越强 线性相关性 -7-知识梳理双基自测234155.独立性检验(1)分类变量:变量的不同“值”表示个体所属的,像这类变量称为分类变量.(2)列联表:列出两个分类变量的,称为列联表.假设有两个分类变量x和y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为 22列联表不同类别 频数表 -8-知识梳理双基自测2
4、3415(3)独立性检验:利用随机变量k2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.a+b+c+d 2-9-知识梳理双基自测34151.下列结论正确的打“”,错误的打“”.(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.()(2)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示.()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.()(4)若事件x,y的关系越密切,则由观测数据计算得到的k2的观测值越大.() -10-知识梳理双基自测23415 答案解析解析关闭 答案解析关闭-11-知识梳理双基自测234153.广
5、告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费和销售额进行统计,得到统计数据如下表(单位:万元):万元时的销售额约为()a.101.2万元 b.108.8万元c.111.2万元 d.118.2万元 答案解析解析关闭 答案解析关闭-12-知识梳理双基自测234154.(2020全国,文5)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,20)得到下面的散点图:由此散点图,在10 至40 之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()a.y=a+bxb
6、.y=a+bx2c.y=a+bexd.y=a+bln xd-13-知识梳理双基自测23415解析:结合题中散点图,由图象的大致走向判断,此函数应该是对数函数模型,故应该选用的函数模型为y=a+bln x.-14-知识梳理双基自测234155.为了考察某种病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:参照附表,在犯错误的概率最多不超过(填百分比)的前提下,可认为“该种疫苗有预防这种病毒感染的效果”. 答案解析解析关闭 答案解析关闭-15-知识梳理双基自测23415自测点评1.若散点图上的点大致分布在某条直线附近,整体上呈线性分布,则这两个变量具有很强的相关关系.2.k2越大,“
7、x与y有关联”的把握程度越大.3.注意回归分析时对应的结果均是估计值,不要误认为是真实值.4.要理解回归直线方程中的参数是用最小二乘法得出的,目的是使距离的平方和最小,不是看具体某一个距离的大小,这样使用求平方和也避免了讨论绝对值和正负问题.-16-考点1考点2考点3例1(1)为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x轴、y轴的单位长度相同),用回归直线方程 近似地刻画其相关关系,根据图形,以下结论最有可能成立的是()a.线性相关关系较强,b的值为1.25b.线性相关关系较强,b的值为0.83c.线性相关关系较强,b的值为-0.87d.线性
8、相关关系较弱,无研究价值 答案解析解析关闭由散点图可以看出两个变量所构成的点在一条直线附近,所以线性相关关系较强,且应为正相关,所以回归直线方程的斜率应为正数,且从散点图观察,回归直线方程的斜率应该比y=x的斜率要小一些,综上可知应选b. 答案解析关闭b-17-考点1考点2考点3(2)甲、乙、丙、丁四位同学各自对a,b两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:则哪位同学的试验结果体现a,b两个变量有更强的线性相关性()a.甲 b.乙c.丙 d.丁思考如何判断两个变量有无相关关系? 答案解析解析关闭在验证两个变量之间的线性相关关系时,相关系数的绝对值越接
9、近1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了a,b两个变量有更强的线性相关性,故选d. 答案解析关闭d-18-考点1考点2考点3解题心得判断两个变量有无相关关系有两个方法:一是根据散点图,具有很强的直观性,直接得出两个变量是正相关或负相关;二是计算相关系数法,这种方法能比较准确地反映相关程度,相关系数的绝对值越接近1,相关性就越强,相关系数就是描述相关性强弱的.-19-考点1考点2考点3对点训练对点训练1(1)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()a.r2r40r3r1b
10、.r4r20r1r3c.r4r20r3r1d.r2r40r1r3a -20-考点1考点2考点3(2)在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,n)都在直线y=-3x+1上,则这组样本数据的样本相关系数为()a.-3b.0c.-1 d.1c 解析:(1)易知题中图(1)与图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,故r2r40r36.635,所以在犯错误的概率不超过0.01的前提下认为该地区的老年人需要志愿者提供帮助与性别有关.(3)由(
11、2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此,在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样的方法取得样本.可知分层抽样的方法比采用简单随机抽样方法更好.-33-考点1考点2考点3解题心得独立性检验的方法(1)构造22列联表;(2)计算k2的观测值k;(3)查表确定有多大的把握判定两个变量有关联.注意:查表时不是查最大允许值,而是先根据题目要求的百分比找到第一行对应的数值,再将该数值对应的k值与求得的k2的观测值k相比较.另外,表中第一行数据表示两个变量没有关联的可能性p,
12、所以其有关联的可能性为1-p.-34-考点1考点2考点3对点训练对点训练3(2020山东,19)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的pm2.5和so2浓度(单位:g/m3),得下表:(1)估计事件“该市一天空气中pm2.5浓度不超过75,且so2浓度不超过150”的概率;-35-考点1考点2考点3(2)根据所给数据,完成下面的22列联表: (3)根据(2)中的列联表,判断能否在犯错误的概率不超过0.01的前提下认为该市一天空气中pm2.5浓度与so2浓度有关?-36-考点1考点2考点3解:(1)根据抽查数据,该市100天空气中pm2.5浓
13、度不超过75,且so2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中pm2.5浓度不超过75,且so2浓度不超过150的概率的估计值为 =0.64.(2)根据抽查数据,可得22列联表:-37-考点1考点2考点3(3)根据(2)的列联表得k2的观测值 由于7.4846.635,故能在犯错误的概率不超过0.01的前提下认为该市一天空气中pm2.5浓度与so2浓度有关.-38-考点1考点2考点32.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观测值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程.3.根据k2的值可以判断两个分类变量有关的可信程度,并用来指导科研和生活实际.-39-考点1考点2考点31.相关关系与函数关系的区别相关关系与函数关系不同,函数关系中的两个变量之间是一种确定性关系.例
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工程项目可行性试题及答案
- 智能机器人研发及销售合同
- 行政管理经济法考试细则试题及答案
- 建筑学建筑材料及结构设计知识点回顾
- 行政管理公共关系学评价机制试题及答案
- 水电工程外部环境影响试题及答案
- 中级经济师职业发展方向试题及答案
- 提升创新能力的团队活动计划
- 2025年生物试题及答案
- 对视等级测试题及答案
- 急性心肌梗死的急救护理
- 2023年04月江苏南京师范大学附属中学公开招聘教科室文员1人笔试参考题库附答案详解
- 监事会成员任职决定
- 线段的垂直平分线 课件
- 桌面运维工程师能力试卷试卷题库面试版本
- 工业园区物业保洁工作作业指导手册
- 消防安全工作例会制度
- GB/T 9634.4-2007铁氧体磁心表面缺陷极限导则第4部分:环形磁心
- 2022年阜宁县(中小学、幼儿园)教师招聘考试《教育综合知识》试题及答案解析
- GB/T 15608-2006中国颜色体系
- 95598工单大数据分析及压降策略
评论
0/150
提交评论