版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、10.4变量间的相关关系、 统计案例,-2-,知识梳理,双基自测,2,3,4,1,5,1.变量间的相关关系 (1)定义:当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.与函数关系不同,相关关系是一种. (2)散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图,它可直观地判断两个变量的关系是否可以用线性关系表示.若这些点分布在从左下角到右上角的区域,则称两个变量;若这些点分布在从左上角到右下角的区域,则称两个变量. (3)线性相关关系、回归直线:如果散点图中的点的分布从整体上看大致在,那么就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.,非确定
2、性关系,正相关,负相关,一条直线附近,-3-,知识梳理,双基自测,2,3,4,1,5,(4)非线性相关:若散点图上所有点看上去都在 附近波动,则称这两个变量为非线性相关.此时,可以用来拟合. (5)不相关:如果所有的点在散点图中,那么称这两个变量是不相关的.,某条曲线(不是一条直线),一条曲线,没有显示任何关系,-4-,知识梳理,双基自测,2,3,4,1,5,2.回归分析 对具有相关关系的两个变量进行统计分析的方法叫做回归分析.在线性回归模型y=bx+a+e中,因变量y的值由自变量x和随机误差e共同确定,即自变量x只能解释部分y的变化,在统计中,我们把自变量x称为,因变量y称为.,解释变量,预
3、报变量,-5-,知识梳理,双基自测,2,3,4,1,5,-6-,知识梳理,双基自测,2,3,4,1,5,4.相关系数 ,它主要用于相关量的显著性检验,以衡量 它们之间的线性相关程度.当r0时表示两个变量正相关,当r0时表示两个变量负相关.|r|越接近1,表明两个变量的线性相关性;当|r|接近0时,表明两个变量间几乎不存在.,越强,线性相关性,-7-,知识梳理,双基自测,2,3,4,1,5,5.独立性检验 (1)分类变量:变量的不同“值”表示个体所属的,像这类变量称为分类变量. (2)列联表:列出两个分类变量的,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其
4、样本频数列联表(称为22列联表)为 22列联表,不同类别,频数表,-8-,知识梳理,双基自测,2,3,4,1,5,(3)独立性检验:利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.,a+b+c+d,2,-9-,知识梳理,双基自测,3,4,1,5,1.下列结论正确的打“”,错误的打“”. (1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.() (2)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示.() (3)只有两个变量有相关关系,所得到的回归模型才有预测价值. () (4)若事件X,Y的关系越密切,则由观测数据计算得
5、到的K2的观测值越大.(),答案,-10-,知识梳理,双基自测,2,3,4,1,5,答案,解析,-11-,知识梳理,双基自测,2,3,4,1,5,3.广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费和销售额进行统计,得到统计数据如下表(单位:万元):,万元时的销售额约为() A.101.2万元B.108.8万元 C.111.2万元D.118.2万元,答案,解析,-12-,知识梳理,双基自测,2,3,4,1,5,4.高三年级267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三名学生. 从这次考试成绩看, (1)在甲、
6、乙两人中,其语文成绩名次比其两科总成绩名次靠前的学生是; (2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是.,答案,解析,-13-,知识梳理,双基自测,2,3,4,1,5,5.为了考察某种病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表: 参照附表,在犯错误的概率最多不超过(填百分比)的前提下,可认为“该种疫苗有预防这种病毒感染的效果”.,答案,解析,-14-,考点1,考点2,考点3,例1(1)为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点 图(x轴、y轴的单位长度相同),用回归直线方程 近似地刻画其相关关系,根据图形,以下
7、结论最有可能成立的是() A.线性相关关系较强,b的值为1.25 B.线性相关关系较强,b的值为0.83 C.线性相关关系较强,b的值为-0.87 D.线性相关关系较弱,无研究价值,-15-,考点1,考点2,考点3,(2)甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表: 则哪位同学的试验结果体现A,B两个变量有更强的线性相关性?() A.甲B.乙C.丙D.丁 思考如何判断两个变量有无相关关系?,答案,解析,-16-,考点1,考点2,考点3,解题心得判断两个变量有无相关关系有两个方法:一是根据散点图,具有很强的直观性,直接得出
8、两个变量是正相关或负相关;二是计算相关系数法,这种方法能比较准确地反映相关程度,相关系数的绝对值越接近1,相关性就越强,相关系数就是描述相关性强弱的.,-17-,考点1,考点2,考点3,对点训练1(1)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是() A.r2r40r3r1B.r4r20r1r3 C.r4r20r3r1D.r2r40r1r3,A,-18-,考点1,考点2,考点3,(2)在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,n)都在直线y=-3x+1上,则这组样
9、本数据的样本相关系数为() A.-3B.0C.-1D.1,C,解析:(1)易知题中图(1)与图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,故r2r40r3r1. (2)因为所有样本点(xi,yi)(i=1,2,n)都在直线y=-3x+1上,所以回归直线方程是y=-3x+1,可得这两个变量是负相关,故这组样本数据的样本相关系数为负值,且所有样本点(xi,yi)(i=1,2,n)都在直线y=-3x+1上,则|r|=1,相关系数r=-1,故选C.,-19-,考点1,考点2,考点3,例2PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入
10、肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表:,(1)根据上表数据,用最小二乘法求出y与x的线性回归方程; (2)若周六同一时段车流量是200万辆,试根据(1)求出的线性回归方程,预测此时PM2.5的浓度为多少.,-20-,考点1,考点2,考点3,思考对已知的两个变量的一组数据如何做回归分析?,-21-,考点1,考点2,考点3,-22-,考点1,考点2,考点3,所以可以预测此时PM2.5的浓度为150.24微克/立方米.,-23-,考点1,考点2,考点3,解题心得1.求线性回归直线方程的步骤 (1)用散点图或进行相关性
11、检验判断两个变量是否具有线性相关关系;,-24-,考点1,考点2,考点3,2.对变量值的预测方法 主要是由给出的变量的值预测与其有相关关系的变量的值.一般方法如下:,-25-,考点1,考点2,考点3,对点训练2下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(单位:吨)与相应的生产能耗y(单位:吨标准煤)的几组对照数据. (1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程 (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:
12、32.5+43+54+64.5=66.5),-26-,考点1,考点2,考点3,-27-,考点1,考点2,考点3,-28-,考点1,考点2,考点3,例3为了调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500名老年人,结果如下:,-29-,考点1,考点2,考点3,(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例; (2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人需要志愿者提供帮助与性别有关? (3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.,思考独立性检验的方法是什么?,-30-
13、,考点1,考点2,考点3,解 (1)调查的500名老年人中有70名需要志愿者提供帮助, 因此该地区老年人中,需要帮助的老年人的比例的估计值为 由于9.9676.635,所以在犯错误的概率不超过0.01的前提下认为该地区的老年人需要志愿者提供帮助与性别有关.,(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此,在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样的方法取得样本.可知分层抽样的方法比采用简单随机抽样方法更好.,-31-,考点1,考点2,考点3,解题心得独立性检验的
14、方法 (1)构造22列联表; (2)计算K2的观测值k; (3)查表确定有多大的把握判定两个变量有关联. 注意:查表时不是查最大允许值,而是先根据题目要求的百分比找到第一行对应的数值,再将该数值对应的k值与求得的K2的观测值k相比较.另外,表中第一行数据表示两个变量没有关联的可能性p,所以其有关联的可能性为1-p.,-32-,考点1,考点2,考点3,对点训练3某学校为了研究学情,从高三年级中抽取了20名学生三次测试的数学成绩和物理成绩,计算出了他们三次成绩的平均名次如下表:,-33-,考点1,考点2,考点3,学校规定平均名次小于或等于40.0为优秀,大于40.0为不优秀. (1)在序号为1,2,3,4,5,6这6名学生中随机抽取2名,求这两名学生数学和物理都优秀的概率. (2)根据这次抽查数据,列出22列联表,能否在犯错误的概率不超过0.0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 教学材料旅游学概论-1
- 除颤仪应急要点试题及答案
- 2026年浙江杭州招聘事业单位真题含详细解析试题及答案
- 2026警察荣誉面试题目及答案
- 数据结构(Java语言版)课件 第六章 串
- 2026年病历书写规范试题及答案
- 2025年留置看护辅警模拟面试题及答案
- 《智慧物流概论》课件 项目1 智慧物流概述
- Levotofisopam-S-Tofisopam-生命科学试剂-MCE
- 2025年青州市网格员招聘考试真题
- 山东省青岛市即墨区2024-2025学年八年级下学期期末考试数学试卷(含部分答案)
- 超声评估胃残余量
- X片检查健康宣教
- 【TCP云运维】腾讯云运维高级工程师认证题库(附答案)
- 潍坊市益都中心医院招聘笔试真题2024
- 工伤预防知识培训课件
- 远程审方系统管理制度
- T履带吊拆卸、安装方案
- 球磨机试车方案
- 水泥皮带廊道封闭施工方案
- 宁夏水利建筑工程预算定额
评论
0/150
提交评论