版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、11.3变量间的相关关系、统计案例,第十一章统计与统计案例,基础知识自主学习,课时作业,题型分类深度剖析,内容索引,基础知识自主学习,1.两个变量的线性相关 (1)正相关 在散点图中,点散布在从 到 的区域,对于两个变量的这种相关关系,我们将它称为正相关. (2)负相关 在散点图中,点散布在从 到 的区域,两个变量的这种相关关系称为负相关. (3)线性相关关系、回归直线 如果散点图中点的分布从整体上看大致在 ,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.,知识梳理,左下角,右上角,左上角,右下角,一条直线附近,2.回归方程 (1)最小二乘法 求回归直线,使得样本数据的点到它的 的
2、方法叫做最小二乘法.,距离的平方和最小,(2)回归方程,3.回归分析 (1)定义:对具有 的两个变量进行统计分析的一种常用方法. (2)样本点的中心 对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),其中 称为样本点的中心.,相关关系,(3)相关系数 当r0时,表明两个变量 ; 当r0时,表明两个变量 . r的绝对值越接近于1,表明两个变量的线性相关性 .r的绝对值越接近于0,表明两个变量之间 .通常|r|大于 时,认为两个变量有很强的线性相关性. 4.独立性检验 (1)分类变量:变量的不同“值”表示个体所属的 ,像这样的变量称为分类变量.,正相关,负相关,越强,几
3、乎不存在线性相关关系,0.75,不同类别,(2)列联表:列出的两个分类变量的 ,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为 22列联表,abcd,频数表,(3)独立性检验 利用随机变量 来判断“两个分类变量 ”的方法称为独立性检验.,K2,有关系,题组一思考辨析 1.判断下列结论是否正确(请在括号中打“”或“”) (1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系. () (2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系. () (3)只有两个变量有相关关系,所得到的回归模型才有预测价值
4、.(),基础自测,1,2,3,4,5,6,(4)某同学研究卖出的热饮杯数y与气温x()之间的关系,得线性回归方程 2.352x147.767,则气温为2时,一定可卖出143杯热饮.() (5)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大. (),1,2,4,5,6,3,题组二教材改编 2.P97A组T2为调查中学生近视情况,测得某校男生150名中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力 A.回归分析 B.均值与方差 C.独立性检验 D.概率,答案,解析“近视”与“性别”是两类变量,其是否有关,应用独立性检验判断
5、.,解析,1,2,4,5,6,3,3.P97练习下面是22列联表:,答案,解析a2173,a52. 又a22b,b74.,解析,1,2,4,5,6,则表中a,b的值分别为 A.94,72 B.52,50C.52,74 D.74,52,3,4.P81例1某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程 0.67x54.9.,设表中的“模糊数字”为a, 则62a758189755,a68.,解析,答案,1,2,4,5,6,现发现表中有一个数据看不清,请你推断出该数据的值为_.,68,3,题组三易错自纠 5.某医疗机构通过
6、抽样调查(样本容量n1 000),利用22列联表和K2统计量研究患肺病是否与吸烟有关.计算得K24.453,经查阅临界值表知P(K23.841)0.05,现给出四个结论,其中正确的是 A.在100个吸烟的人中约有95个人患肺病 B.若某人吸烟,那么他有95%的可能性患肺病 C.有95%的把握认为“患肺病与吸烟有关” D.只有5%的把握认为“患肺病与吸烟有关”,解析,答案,1,2,4,5,6,解析由已知数据可得,有10.0595%的把握认为“患肺病与吸烟有关”.,3,6.在一次考试中,5名学生的数学和物理成绩如下表:(已知学生的数学和物理成绩具有线性相关关系),解析,答案,1,2,4,5,6,7
7、3,3,1,2,4,5,6,3,题型分类深度剖析,1.观察下列各图形,,解析,答案,题型一相关关系的判断,自主演练,其中两个变量x,y具有相关关系的图是 A. B.C. D.,解析由散点图知中的点都分布在一条直线附近. 中的点都分布在一条曲线附近,所以中的两个变量具有相关关系.,A.逐年比较,2008年减少二氧 化硫排放量的效果最显著 B.2007年我国治理二氧化硫排 放显现成效 C.2006年以来我国二氧化硫年排放量呈减少趋势 D.2006年以来我国二氧化硫年排放量与年份正相关,2.(2018广州质检)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)的柱形图.以下结论不正
8、确的是,解析,答案,解析从2006年,将每年的二氧化硫排放量与前一年作差比较,得到2008年二氧化硫排放量与2007年排放量的差最大,A选项正确; 2007年二氧化硫排放量较2006年降低了很多,B选项正确; 虽然2011年二氧化硫排放量较2010年多一些,但自2006年以来,整体呈递减趋势,C选项正确; 自2006年以来我国二氧化硫年排放量与年份负相关,D选项错误,故选D.,x,y是负相关关系;,3.x和y的散点图如图所示,则下列说法中所有正确命题的序号为_.,解析,答案,x,y之间不能建立线性回归方程.,解析在散点图中,点散布在从左上角到右下角的区域,因此x,y是负相关关系,故正确;,x,
9、y之间可以建立线性回归方程,但拟合效果不好,故错误.,判定两个变量正,负相关性的方法 (1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关. (2)相关系数:r0时,正相关;r0时,负相关.,典例 (2016全国)右图是我国 2008年至2014年生活垃圾无害化 处理量(单位:亿吨)的折线图. 注:年份代码17分别对应年份 20082014. (1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;,解答,题型二线性回归分析,师生共研,解由折线图中数据和附注中参考数据得,40.1749.322.89,,因为y与t的相关系数近似为
10、0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.,(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注:,解答,所以预测2016年我国生活垃圾无害化处理量将约为1.82亿吨.,线性回归分析问题的类型及解题方法 (1)求线性回归方程,待定系数法:利用回归直线过样本点的中心求系数. (2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.,(4)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.,跟踪训练 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:
11、千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值.,(1)根据散点图判断,yabx与yc 哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由),解答,(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;,解答,(3)已知这种产品的年利润z与x,y的关系为z0.2yx.根据(2)的结果回答下列问题: 年宣传费x49时,年销售量及年利润的预报值是多少?,解答,解由(2)知,当x49时,,年宣传费x为何值时,年利润的预报值最大?,解答,解根据(
12、2)的结果知,年利润z的预报值,故年宣传费为46.24千元时,年利润的预报值最大.,典例(2017全国)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:,题型三独立性检验,师生共研,(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;,解答,解记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”. 由题意知,P(A)P(BC)P(B)P(C). 旧养殖法的箱产量低于50 kg的
13、频率为 (0.0120.0140.0240.0340.040)50.62, 故P(B)的估计值为0.62. 新养殖法的箱产量不低于50 kg的频率为 (0.0680.0460.0100.008)50.66, 故P(C)的估计值为0.66. 因此,事件A的概率估计值为0.620.660.409 2.,(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:,解答,解根据箱产量的频率分布直方图得列联表如下:,由于15.7056.635,故有99%的把握认为箱产量与养殖方法有关.,(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01). 附:,
14、解答,解因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg的直方图面积为(0.0040.0200.044)50.340.5, 故新养殖法箱产量的中位数的估计值为,(1)比较几个分类变量有关联的可能性大小的方法 通过计算K2的大小判断:K2越大,两变量有关联的可能性越大. 通过计算|adbc|的大小判断:|adbc|越大,两变量有关联的可能性越大. (2)独立性检验的一般步骤 根据样本数据制成22列联表.,比较k与临界值的大小关系,作统计推断.,跟踪训练 (2017石家庄质检)微信是现代生活进行信息交流的重要工具,某公司200名员工中90%的人使用微信,其中每天使用微信时间在一小时以内的
15、有60人,其余的员工每天使用微信的时间在一小时以上,若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,那么使用微信的人中75%是青年人.若规定:每天使用微信时间在一小时以上为经常使用微信,那么经常使用微信的员工中有 是青年人. (1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,列出22列联表:,解答,解由已知可得,该公司员工中使用微信的有20090%180(人). 经常使用微信的有18060120(人),,使用微信的人中青年人有18075%135(人), 故22列联表如下:,由于13.33310.828,所以有99.9%的把握认为“经常使用微信与年龄有关”.,(2
16、)根据22列表中的数据利用独立性检验的方法判断是否有99.9%的把握认为“经常使用微信与年龄有关”?,解答,解将列联表中数据代入公式可得:,思想方法指导回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观测值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程.,求线性回归方程的方法技巧,思想方法,典例(12分)某地最近十年粮食需求量逐年上升,下表是部分统计数据:,(2)利用(1)中所求出的线性回归方程预测该地2018年的粮食需求量.,思想方法指导,规范解答,规范解答 解(1)由所给数据看出,
17、年需求量与年份之间近似直线上升,下面来求线性回归方程,先将数据处理如下表.,由上述计算结果,知所求线性回归方程为,(2)利用所求得的线性回归方程,可预测2018年的粮食需求量大约为6.5(20182010)260.26.58260.2312.2(万吨). 12分,课时作业,1.根据如下样本数据:,基础保分练,解析,答案,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,2.(2017江西南城一中、高安中学等九校联考)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.,1,2,
18、3,4,5,6,7,8,9,10,11,12,13,14,15,16,参照下表,,正确的结论是 A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关” B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关” C.有99%以上的把握认为“生育意愿与城市级别有关” D.有99%以上的把握认为“生育意愿与城市级别无关”,解析,答案,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,解析K29.6166.635, 有99%以上的把握认为“生育意愿与城市级别有关”,故选C.,解析,答案,1,2,3,4,5,6,7,8,9,10,11,12,
19、13,14,15,16,解析,答案,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,A.160 B.163 C.166 D.170,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,5.(2018湖南永州模拟)已知x与y之间的几组数据如下表:,解析,答案,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,解析由两组数据(1,0)和(2,2)可求得直线方程为y2x2,b2,a2.而利用线性回归方程的公式与已知表格中的数据,,6.某地2
20、009年至2015年中,每年的人口总数y(单位:万)的数据如下表:,A.(3,9) B.(9,3)C.(6,14) D.(4,11),解析,答案,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,7.(2017遵义联考)某公司为确定明年投入某产品的广告支出,对近5年的年广告支出m与年销售额t(单位:百万元)进行了初步统计,得到下列表格中的数据:,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,60,解析,答案,8.以下四个命题,其中正确的序号是_. 从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽
21、样是分层抽样; 两个随机变量相关性越强,则相关系数的绝对值越接近于1;,解析,答案,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,对分类变量X与Y的统计量K2来说,K2越小,“X与Y有关系”的把握程度越大.,解析是系统抽样; 对于,统计量K2越小,说明两个相关变量有关系的把握程度越小.,9.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如图所示22列联表:,解析,答案,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,95%,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,解析,
22、答案,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,4,11.某地区2009年至2015年农村居民家庭人均纯收入y(单位:千元)的数据如下表:,解答,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,(1)求y关于t的线性回归方程;,解由所给数据计算得,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,(2)利用(1)中的线性回归方程,分析2009年至2015年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2018年农村居民
23、家庭人均纯收入.,解答,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,故预测该地区2018年农村居民家庭人均纯收入为7.3千元.,12.(2017西安质检)某省会城市地铁将于2017年6月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下:,解答,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,(1)若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定价者”与“认为价格偏高者”的月平均收入的
24、差异是多少(结果保留2位小数);,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,解“赞成定价者”的月平均收入为,“认为价格偏高者”的月平均收入为,“赞成定价者”与“认为价格偏高者”的月平均收入的差距是x1x250.5638.7511.81(百元).,解答,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,(2)由以上统计数据填下面22列联表,分析是否有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.,没有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.,1,2,3,4,5,6,7,8,9,10,
25、11,12,13,14,15,16,解根据条件可得22列联表如下:,B.残差平方和越小的模型,拟合的效果越好 C.用相关指数R2来刻画回归效果,R2的值越小,说明模型的拟合效果越好 D.若变量y和x之间的相关系数r0.936 2,则变量y与x之间具有线性相 关关系,13.(2017通州一模)对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),(xn,yn),则下列说法中不正确的是,技能提升练,解析,答案,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,解析R2的值越大,说明残差平方和越小,也就是模型的拟合效果越好,故选C.,14.(20
26、18河北保定模拟)中央政府为了应对 因人口老龄化而造成的劳动力短缺问题, 拟定出台“延迟退休年龄政策”.为了了解 人们对“延迟退休年龄政策”的态度,责成 人社部进行调研.人社部从网上年龄在1565的人群中随机调查100人,调查数据的频率分布直方图和支持“延迟退休”的人数与年龄的统计结果如下:,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,(1)由以上统计数据填写22列联表,并判断是否有95%的把握认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异;,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,解答,解22列联表如下:,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,所以有95%的把握认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异.,(2)若以45岁为分界点,从不支持“延迟退休年龄政策”的人中按分层抽样的方法抽取8人参加某项活动.现从这8人中随机抽2人,求至少有1人是45岁及45岁以上
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 证券市场资深操盘手实战宝典
- 部队学身边典型演讲稿
- 读书让我们进步演讲稿
- 2026年体育与健康锻炼方法试题
- 爱国演讲稿开头惊艳句子
- 2026年大学生学法用法法律知识竞赛考试题库及答案(共220题)
- 我是职校人我骄傲演讲稿
- 文明校园最美宿舍演讲稿
- 自强不息提升实力演讲稿
- 2026年大学生百科知识竞赛挑战题160题及答案
- 食品营养与食品安全试题及答案
- 2025年高考政治一轮复习精练 必修4 第九课 发展中国特色社会主义文化(含答案+解析)
- 护理药物错误不良事件原因分析与整改措施
- 黄体破裂护理查房
- 新媒体运营电子教案 项目1 走进新媒体运营 任务1 认识新媒体
- 高级顾问聘用协议书范本
- 2024年中国中药行业数据报告(纯数据版)
- 《ui界面设计》课件项目4 网页UI界面设计
- GB/T 44473-2024植物照明用LED灯、LED灯具和LED模块性能规范
- GB/T 44848-2024工业通风机通风机振动测量方法
- DB52T 1686-2022 高速公路服务区智慧化建设数据规范
评论
0/150
提交评论