2026《金版教程》高考复习方案数学提升版-第3讲 成对数据的统计分析_第1页
2026《金版教程》高考复习方案数学提升版-第3讲 成对数据的统计分析_第2页
2026《金版教程》高考复习方案数学提升版-第3讲 成对数据的统计分析_第3页
2026《金版教程》高考复习方案数学提升版-第3讲 成对数据的统计分析_第4页
2026《金版教程》高考复习方案数学提升版-第3讲 成对数据的统计分析_第5页
已阅读5页,还剩105页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十章统计与成对数据的统计分析第3讲

成对数据的统计分析1.了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量夹角的关系.2.会通过相关系数比较多组成对数据的相关性.3.了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件.4.会用一元线性回归模型进行预测.5.理解2×2列联表的统计意义.6.了解2×2列联表独立性检验及其应用.基础知识整合核心考向突破课时作业目录基础知识整合1.相关关系两个变量有关系,但又没有确切到可由其中一个去精确地决定另一个的程度,这种关系称为相关关系.2.相关关系的分类(1)按变量间的增减性分为______相关和______相关.①正相关:当一个变量的值增加时,另一个变量的相应值也呈现______的趋势;②负相关:当一个变量的值增加时,另一个变量的相应值呈现_______的趋势.(2)按变量间是否有线性特征分为______相关或____________相关(曲线相关).①线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在___________附近,我们就称这两个变量线性相关;②非线性相关或曲线相关:如果两个变量具有相关性,但不是_______相关,我们就称这两个变量非线性相关或曲线相关.正负增加减小线性非线性一条直线线性[-1,1]正负10因变量响应变量自变量解释变量abYbx+a0观测值预测值观测值预测值残差残差以取值为0的横轴为对称轴的水平带状区域内大小8.列联表与独立性检验(1)2×2列联表①2×2列联表给出了成对分类变量数据的____________________;②定义一对分类变量X和Y,我们整理数据如下表所示:像这种形式的数据统计表称为2×2列联表.交叉分类频数XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d是否独立1.(2024·上海高考)已知气候温度和海水表层温度相关,且相关系数为正数,对此描述正确的是(

)A.气候温度高,海水表层温度就高B.气候温度高,海水表层温度就低C.随着气候温度由低到高,海水表层温度呈上升趋势D.随着气候温度由低到高,海水表层温度呈下降趋势解析:对于A,B,当气候温度高时,海水表层温度变高变低不确定,故A,B错误;对于C,D,因为相关系数为正,所以随着气候温度由低到高时,海水表层温度呈上升趋势,故C正确,D错误.故选C.2.(人教A选择性必修第三册习题8.1T1改编)下列四个散点图中,变量x与y之间具有负线性相关关系的是(

)解析:观察散点图可知,只有D中的散点图表示的是变量x与y之间具有负线性相关关系.故选D.3.甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做了试验,并用回归分析方法分别求得相关系数r与残差平方和m,如下表:则哪位同学的试验结果体现的A,B两变量有更强的线性相关性(

)A.甲 B.乙C.丙 D.丁解析:|r|越接近1,m越小,线性相关性越强,故选D.甲乙丙丁r0.820.780.690.85m1061151241034.(多选)(人教B选择性必修第二册4.3.2例1改编)为了解阅读量多少与幸福感强弱之间的关系,一个调查机构根据所得到的数据,绘制了如下所示的2×2列联表(个别数据暂用字母表示):计算得到χ2≈12.981,参照下表:阅读量幸福感合计强弱多m1872少36n78合计9060150α0.100.050.0250.0100.0050.001xα2.7063.8415.0246.6357.87910.828则下列结论正确的是(

)A.根据小概率值α=0.010的独立性检验,可以认为“阅读量多少与幸福感强弱无关”B.m=54C.n=52D.根据小概率值α=0.005的独立性检验,可以在犯错误的概率不超过0.5%的前提下认为“阅读量多少与幸福感强弱有关”解析:∵χ2≈12.981>7.879>6.635,∴根据小概率值α=0.010的独立性检验,可以在犯错误的概率不超过1%的前提下认为“阅读量多少与幸福感强弱有关”,根据小概率值α=0.005的独立性检验,可以在犯错误的概率不超过0.5%的前提下认为“阅读量多少与幸福感强弱有关”,∴A错误,D正确;∵m+36=90,18+n=60,∴m=54,n=42,∴B正确,C错误.65.5核心考向突破考向一

两个变量的相关性角度1相关关系的判断(1)某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:根据表中数据,下列说法正确的是(

)A.利润率与人均销售额成正相关关系B.利润率与人均销售额成负相关关系C.利润率与人均销售额成正比例函数关系D.利润率与人均销售额成反比例函数关系月份123456人均销售额658347利润率(%)12.610.418.53.08.116.3解析:由统计表可得利润率与人均销售额不是正比例关系,也不是反比例关系,排除C,D;其属于正相关关系,A正确,B错误.故选A.(2)(多选)(2025·天津武清区燕京高级中学模拟)某校地理小组在某座山测得海拔高度、气压和沸点的六组数据绘制成散点图如图所示,则下列说法正确的是(

)A.气压与海拔高度呈正相关B.沸点与气压呈正相关C.沸点与海拔高度呈负相关D.沸点与海拔高度、沸点与气压的相关性都很强解析:由题图1知气压随海拔高度的增加而减小,由题图2知沸点随气压的升高而升高,所以气压与海拔高度呈负相关,沸点与气压呈正相关,沸点与海拔高度呈负相关.由于两个散点图中的点都呈线性分布,所以沸点与海拔高度、沸点与气压的相关性都很强,故B,C,D正确,A错误.故选BCD.1.(2024·天津高考)下列图中,线性相关系数最大的是(

)解析:观察题中4幅图可知,A图散点分布比较集中,且大体分布在某一条直线附近,线性回归模型拟合效果比较好,呈现明显的正相关,|r|值相比于其他3幅图更接近1.故选A.考向二

回归分析角度1线性回归模型(2025·河南郑州模拟)按照《中华人民共和国环境保护法》的规定,每年生态环境部都会会同国家发展改革委等部门共同编制《中国生态环境状况公报》,并向社会公开发布.下表是2017~2021年五年《中国生态环境状况公报》中酸雨区面积约占国土面积的百分比(yi%):年份2017年2018年2019年2020年2021年年份代码xi12345yi6.45.55.04.83.8求经验回归方程的步骤提醒:对非线性回归分析问题,可通过适当的换元转化为线性回归分析问题求解.1.移动物联网广泛应用于生产制造、公共服务、个人消费等领域.截至2022年底,我国移动物联网连接数达18.45亿户,成为全球主要经济体中首个实现“物超人”的国家.如图是2018~2022年移动物联网连接数w与年份代码t的散点图,其中年份2018~2022对应的t分别为1~5.(1)根据散点图推断两个变量是否线性相关.计算样本相关系数(精确到0.01),并推断它们的相关程度;考向三

独立性检验某中学为调查本校学生“保护动物意识的强弱与性别是否有关”,采用简单随机抽样的方法,从该校分别抽取了男生和女生各50名作为样本,经统计,得到如图所示的等高堆积条形图.(1)根据已知条件,将下面2×2列联表补充完整:性别保护动物意识合计强弱男生50女生50合计100(2024·全国甲卷改编)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:车间检验结果合计优级品合格品不合格品甲车间2624050乙车间70282100合计96522150(1)填写如下列联表:依据小概率值α=0.05的独立性检验,能否以此推断甲、乙两车间产品的优级品率存在差异?依据小概率值α=0.01的独立性检验,能否以此推断甲、乙两车间产品的优级品率存在差异?车间检验结果合计优级品非优级品甲车间乙车间合计课时作业一、单项选择题1.(2025·江苏盐城模拟)根据分类变量Ⅰ与Ⅱ的统计数据,计算得到χ2=2.954,则(

)A.变量Ⅰ与Ⅱ相关B.变量Ⅰ与Ⅱ相关,这个结论犯错误的概率不超过0.1C.变量Ⅰ与Ⅱ不相关D.变量Ⅰ与Ⅱ不相关,这个结论犯错误的概率不超过0.1α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828解析:零假设为H0:变量Ⅰ与Ⅱ不相关.因为χ2=2.954>2.706,依据小概率值α=0.1的独立性检验可推断H0不成立,即认为变量Ⅰ与Ⅱ相关,这个结论犯错误的概率不超过0.1.故选B.2.调查某种群花萼长度和花瓣长度,所得数据如图所示.其中相关系数r=0.8245,下列说法正确的是(

)A.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈负相关C.花瓣长度和花萼长度呈正相关D.若从样本中抽取一部分,则这部分的相关系数一定是0.8245解析:因为相关系数r=0.8245,接近1,所以花瓣长度和花萼长度的相关性较强,且呈正相关,所以A,B错误,C正确;因为相关系数与样本的数据有关,所以当样本发生变化时,相关系数也可能会发生变化,所以D错误.故选C.5.(2024·上海闵行区二模)某疾病预防中心随机调查了339名50岁以上的公民,研究吸烟习惯与慢性气管炎患病的关系,调查数据如下表:零假设为H0:患慢性气管炎与吸烟没有关系,即它们相互独立.慢性气管炎患病情况吸烟习惯合计不吸烟者吸烟者不患慢性气管炎者121162283患慢性气管炎者134356合计134205339通过计算统计量χ2,得χ2≈7.469,根据χ2分布概率表:P(χ2≥7.829)≈0.005,P(χ2≥6.635)≈0.01,P(χ2≥5.024)≈0.025,P(χ2≥3.841)≈0.05,P(χ2≥2.706)≈0.1.给出下列三个结论:①“患慢性气管炎与吸烟没有关系”成立的可能性小于5%;②有99%的把握认为患慢性气管炎与吸烟有关;③在犯错误的概率不超过0.005的前提下,可以认为患慢性气管炎与吸烟有关.其中正确结论的个数是(

)A.0 B.1C.2 D.3解析:因为χ2≈7.469>6.635,所以有99%的把握认为患慢性气管炎与吸烟有关,即“患慢性气管炎与吸烟没有关系”成立的可能性小于1%,故①②正确;因为χ2≈7.469<7.829,所以在犯错误的概率不超过0.005的前提下,不能认为患慢性气管炎与吸烟有关,故③错误.故选C.性别对数学的兴趣合计感兴趣不感兴趣女生aba+b男生cdc+d合计a+cb+d10011.(2025·湖北八市模拟)某校为了解高一新生对数学是否感兴趣,从400名女生和600名男生中通过比例分配的分层随机抽样的方式随机抽取100名学生进行问卷调查,将调查的结果进行统计,得到如下等高堆积条形图和列联表,则(

)1.4由表中数据可知该老师每天一次最多答对题数y与天数x之间是________(填“正”或“负”)相关,其相关系数r≈________(结果保留两位小数).正0.99-0.30.98四、解答题15.(2025·八省联考

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论