2027届新高考数学热点精准复习成对数据的统计分析_第1页
2027届新高考数学热点精准复习成对数据的统计分析_第2页
2027届新高考数学热点精准复习成对数据的统计分析_第3页
2027届新高考数学热点精准复习成对数据的统计分析_第4页
2027届新高考数学热点精准复习成对数据的统计分析_第5页
已阅读5页,还剩98页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2027届新高考数学热点精准复习成对数据的统计分析去精确地决定点知识点一变量的相关关系1.相关关系两个变量有关系,但又没有确切到可由其中的一个______________另一个的程度,这种关系称为相关关系.2.散点图每一个序号下的成对样本数据都可用直角坐标系中的______表示出来,由这些点组成的统计图称为散点图.增加减小正相关或负相关一条直线非线性相关或曲线相关3.正相关、负相关如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现________的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现________的趋势,则称这两个变量负相关.4.变量的线性相关如果两个变量的取值呈现_______________,而且散点落在_______

______附近,我们就称这两个变量线性相关.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量______________

__________.正相关负相关越强越弱5.样本相关系数称r=____________________________为变量x和变量y的相关系数.r∈[-1,1],当r>0时,则成对样本数据__________;当r<0时,则成对样本数据__________;当|r|接近1时,成对样本数据的线性相关程度________;当|r|接近0时,成对样本数据的线性相关程度________.bx+a+e0因变量或响应变量自变量或解释变量知识点二一元线性回归模型1.一元线性回归模型我们称上式为Y关于x的一元线性回归模型.

其中,Y称为____________________,x称为____________________;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.2.经验回归方程经验回归直线最小二乘法最小二乘估计注:经验回归直线必过样本点中心.观测值预测值残差残差分析3.残差分析(2)残差的散点图残差比较均匀地集中分布在以横轴为对称轴的水平带状区域内,则满足一元线性回归模型对随机误差的假设.小好大差

y1y2总计x1ab__________x2cdc+d总计a+c_______________________a+bb+da+b+c+d知识点三列联表与独立性检验1.分类变量:用以区别不同的现象或性质的随机变量.2.2×2列联表设X,Y为两个分类变量,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)如下:P(Y=1|X=0)=P(Y=1|X=1)3.独立性检验(1)零假设(或原假设)以Ω为样本空间的古典概型.设X和Y为定义在Ω上,取值于{0,1}的成对分类变量.H0:____________________________________称为零假设.(2)临界值

2=________________________________.临界值对于任何小概率值α,可以找到相应的正实数xα,使得下面关系成立:P(

2≥xα)=α.称xα为α的__________,这个临界值就可作为判断2大小的标准.概率值α越小,临界值xα越大.不独立超过α独立(3)独立性检验基于小概率值α的检验规则是:当2≥xα时,我们就推断H0不成立,即认为X和Y__________,该推断犯错误的概率不__________;当2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y________.这种利用

2的取值推断分类变量X和Y是否独立的方法称为

2独立性检验,读作“卡方独立性检验”,简称独立性检验.4.独立性检验解决实际问题的一般步骤(1)提出零假设H0:X与Y相互独立,并给出在问题中的解释.(2)根据抽样数据整理出2×2列联表,计算

2值,并与临界值xα比较.(3)根据检验规则得出推断结论.(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.归纳拓展1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性分布时,求出的经验回归方程才有实际意义,否则,求出的经验回归方程毫无意义.根据经验回归方程进行预报,仅是一个预报值,而不是真实发生的值.3.独立性检验是对两个变量的关系的可信程度的判断,而不是对其是否有关系的判断.根据

2的值可以判断两个分类变量有关的可信程度,并用来指导科研和实际生活.双基自测题组一走出误区1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.(

)(2)两个随机变量的线性相关性越强,相关系数的绝对值越接近于0.(

)(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.(

)(5)事件x,y关系越密切,则由观测数据计算得到的

2的观测值越大.(

)(6)由独立性检验可知,在犯错误的概率不超过1%的前提下认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.(

)[答案]

(1)√

(2)×

(3)√

(4)×(5)√

(6)×题组二走进教材2.(多选题)(选择性必修3P113T5)对变量y和x的一组样本数据(x1,y1),(x2,y2),…,(xn,yn)进行回归分析,建立回归模型,则下列说法正确的有(

)A.残差平方和越大,模型的拟合效果越好C.用决定系数R2来刻画回归效果,R2越小,说明模型的拟合效果越好D.若y和x的样本相关系数r=-0.95,则y和x之间具有很强的负线性相关关系[答案]

BDα0.10.050.010.0050.001xα2.7063.8416.6357.87910.8283.(选择性必修3P132例3)某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名、治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值α=0.005的独立性检验,分析甲、乙两种疗法的效果,结论为________.附:疗法疗效合计未治愈治愈甲155267乙66369合计21115136[答案]两种疗法效果没有差异[解析]由题意得两种疗法数据的列联表题组三走向考场4.(2023·天津卷)调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数r=0.8245,下列说法正确的是(

)A.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈现负相关C.花瓣长度和花萼长度呈现正相关D.若从样本中抽取一部分,则这部分的相关系数一定是0.8245[答案]

C[解析]根据散点的集中程度可知,花瓣长度和花萼长度有相关性,A选项错误;散点的分布是从左下到右上,从而花瓣长度和花萼长度呈现正相关性,B选项错误,C选项正确;由于r=0.8245是全部数据的相关系数,取出来一部分数据,相关性可能变强,可能变弱,即取出的数据的相关系数不一定是0.8245,D选项错误.故选C.

准点班次数未准点班次数A24020B210305.(2022·全国甲卷(节选))甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?P(

2≥xα)0.1000.0500.010xα2.7063.8416.635公司准点班次数未准点班次数合计A24020260B21030240合计45050500[解析]根据已知数据得到列联表如下:相关关系的判断——自主练透1.(2026·四川成都蓉城名校联盟联考)某市环保部门研究近十年空气质量数据,得到以下结论:结论一:PM2.5浓度与机动车保有量的样本相关系数r1=0.92;结论二:绿化覆盖率与呼吸道疾病发病率的样本相关系数r2=-0.12;结论三:工业能耗与近地面臭氧浓度的样本相关系数r3=0.75.A.由结论一可知,机动车保有量增加是PM2.5浓度升高的直接原因B.由结论二可知,绿化覆盖率与呼吸道疾病发病率无关联C.结论三表明工业能耗与近地面臭氧浓度呈正相关,且线性相关性比结论一更强D.结论一中|r1|接近1,说明PM2.5浓度与机动车保有量存在极强的线性相关关系[答案]

D[解析]

r1=0.92仅表明PM2.5浓度与机动车保有量线性正相关,且相关性很强,但并不意味着机动车保有量增加是PM2.5浓度升高的直接原因,所以选项A错误;r2=-0.12表示绿化覆盖率与呼吸道疾病发病率线性负相关,且相关性极弱,但仍有轻微线性相关性,且还可能存在非线性相关关系,所以不能判断无关联,所以选项B错误;线性相关强度由|r|决定,因为|r3|=0.75<|r2|=0.92,所以工业能耗与近地面臭氧浓度比结论一的线性相关性更弱,所以选项C错误;|r2|=0.92非常接近1,表明两者存在极强的线性相关关系.所以选项D正确.故选D.2.(2025·上海实验学校月考)对四组数据进行统计,获得如下散点图,关于其相关系数的比较,说法正确的是(

)A.r4<r2<0<r1<r3 B.r2<r4<0<r3<r1C.r2<r4<0<r1<r3 D.r4<r2<0<r3<r1[答案]

B[解析]由图中散点的分布趋势知:r1,r3>0,r2,r4<0,由图散点的分布状态知:|r1|>|r3|,|r2|>|r4|,所以r1>r3>0>r4>r2.故选B.名师点拨:判断两个变量正、负相关性的方法1.画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.2.相关系数:r>0时,正相关;r<0时,负相关.【变式训练】(多选题)对两组数据进行统计后得到的散点图如图,关于其线性相关系数的结论正确的是(

)A.r1<0 B.r2>1C.r1+r2>0 D.|r1|>|r2|[答案]

AC[解析]由散点图可知,线性相关系数r1的图象表示y与x成负相关,故-1<r1<0,故A正确;线性相关系数r2的图象表示y与x正相关,故0<r2<1,故B错误;∵线性相关系数r2的点较线性相关系数r1的点密集,故|r2|>|r1|,故r1+r2>0,故C正确,D错误.故选AC.回归分析——多维探究第x年12345利润y/亿元23457角度1一元线性回归模型1.(多选题)(2026·广西柳州摸底)某人工智能公司近5年的利润情况如下表所示:B.变量y与x之间的线性相关系数r<0C.预测该人工智能公司第6年的利润约为7.8亿元D.残差绝对值的最大值为0.4[答案]

ACD累计票房y20406080100用时x47910152.(2026·安徽蚌埠调研)7月1日,电影《哪吒之魔童闹海》(以下简称《哪吒2》)在中国内地电影院线正式下映,结束了自今年1月29日以来153天的线下放映.据统计,《哪吒2》在中国内地最终斩获154.4亿元票房,总观影人次3.24亿,两项数据均创下中国影史纪录,并遥遥领先第二名,成为了又一部现象级电影.下表统计了《哪吒2》上映前15天累计票房到达y(单位:亿元)与所用时间x(单位:天)的数据:(1)利用表中的数据,计算相关系数r(结果精确到0.01),并推断两个变量的线性相关程度;(2)求y关于x的经验回归方程(系数精确到0.01),并预测153天时的累计票房,判断这种预测方法是否合理.名师点拨:一元回归模型问题的解法1.求经验回归方程(2)待定系数法:利用经验直线过样本点中心求系数.2.利用经验回归方程进行预测把经验回归直线方程看作一次函数,求函数值.3.利用经验回归直线判断正、负相关角度2一元非线性回归模型(2026·湖北部分高中协作体联考)中国茶文化博大精深,饮茶深受大众喜爱,茶水的口感与茶叶类型和水的温度有关,某数学建模小组为了获得茶水温度y(单位:℃)关于时间x(单位:min)的回归方程模型,通过实验收集在25℃室温,用同一温度的水冲泡的条件下,茶水温度随时间变化的7组数据,并对数据做初步处理得到如图所示散点图以及如表所示数据.(1)根据散点图判断:①y=a+bx与②y=d·cx+25哪一个更适宜作为该茶水温度y关于时间x的经验回归方程类型?(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表中数据,建立该茶水温度y关于时间x的经验回归方程;(3)已知该茶水温度降至60℃口感最佳,根据(2)中的经验回归方程,求在相同条件下,刚泡好的茶水,大约需要放置多长时间才能达到最佳饮用口感.[解析]

(1)由散点图知,点的分布呈现出曲线的趋势,因此更适宜的回归方程为②,即y=d·cx+25.(2)由y=d·cx+25,得y-25=d·cx,对等式两边取自然对数,得ln(y-25)=lnd+xlnc,令w=ln(y-25),则w=lnd+xlnc,(3)依题意,25℃室温下,茶水温度降至60℃口感最佳,即60=60×0.92x+25,于是xln0.92=ln7-2ln2-ln3≈-0.6,所以在相同条件下,刚泡好的茶水大约需要放置7.5min才能达到最佳饮用口感.x12345y0.50.911.11.5B.x与y的样本是负相关C.当x=8时,y的预估值为2.2D.去掉样本点(3,1)后,x与y的样本相关系数r必会改变[答案]

A 届数第27届第28届第29届第30届第31届第32届届数代码t123456地点2000年悉尼2004年雅典2008年北京2012年伦敦2016年里约热内卢2021年东京金牌数(y)2832483826382.(角度1)(2025·云南名校联考)中华人民共和国体育代表团参加夏季奥运会以来,中国健儿们不断取得好成绩,到今天成长为体育大国,从2000年以来,金牌情况统计如下(不含中国香港、中国台湾):中国体育代表团夏季奥运会获得金牌数根据以上数据,建立y关于t的线性回归方程,若不考虑其他因素,根据回归方程预测第34届(2028年洛杉矶奥运会)中国体育代表团金牌总数为(

)A.29 B.33C.38 D.45[答案]

C[答案]-0.3

0.98独立性检验——师生共研1.(多选题)(2026·河南商丘模拟)2023年10月全国多地医院出现较多的支原体肺炎感染患者,患者多以儿童为主.某研究所在某小学随机抽取了46名儿童,得到他们是否接种流感疫苗和是否感染支原体肺炎的情况的相关数据,如下表所示,则(

)

感染情况接种情况感染支原体肺炎未感染支原体肺炎合计接种流感疫苗a=12ba+b未接种流感疫苗cd=13c+d合计a+cb+d=2846α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828[答案]

ADB.χ2>2.706C.认为是否接种流感疫苗与是否感染支原体肺炎有关联,此推断犯错的概率不大于0.1D.没有充分的证据推断是否接种流感疫苗与是否感染支原体肺炎有关联

优级品合格品不合格品总计甲车间2624050乙车间70282100总计965221502.(2024·全国甲卷)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:

优级品非优级品甲车间

乙车间

(1)填写如下列联表:能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否有99%的把握认为甲,乙两车间产品的优级品率存在差异?α0.0500.0100.001xα3.8416.63510.828

优级品非优级品甲车间2624乙车间7030[解析]

(1)根据题意可得列联表:因为3.841<4.6875<6.635,所以有95%的把握认为甲、乙两车间产品的优级品率存在差异,没有99%的把握认为甲,乙两车间产品的优级品率存在差异.喝咖啡对睡眠的影响结果失眠不失眠合计每天喝咖啡120380500不每天喝咖啡80420500合计2008001000【变式训练】(2026·湖北华大新高考联盟质量测评)为研究每天喝咖啡与失眠的关系,从某社区人群中随机调查了1000人,得到如下列联表(单位:人):α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828(1)记每天喝咖啡的人中患失眠的概率为P,求P的估计值;(2)根据小概率值α=0.05的独立性检验,分析每天喝咖啡是否与失眠有关.[解析]

(1)根据列联表可知,每天喝咖啡者共500人,其中患失眠的人数为120人.1名师讲坛·素养提升编号12345学习时间x3040506070数学成绩y65788599108统计分析的综合问题(2025·四川南充高级中学测试)为了了解高中学生课后自主学习数学时间(x分钟/每天)和他们的数学成绩(y分)的关系,某实

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论