版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
(3个知识点5个拓展1个突破5种题型3个易错点)【目录】【方法一】脉络梳理法拓展2.回归系数b的含义拓展4.经验回归分析“三步曲”拓展5.样本相关系数r、决定系数R²的应用【方法四】成果评定法②知识点2.样本相关系数④拓展1.判断变量相关关系的三种方法成对数据的统计相关性6拓展2.回归系数6的含义6拓展3.最小乘法求回归方程及回归方程的逆用⑦拓展4.经验回归分析“三步曲”⑧拓展5.样本相关系数”、决定系数R²的★突破:非线性相关问题②非线性相关或曲线相关:如果两个变量具有相关性,但不是线性相关,我们称这两个变量非线性相关或曲线相关.散点图:为了直观描述成对样本数据的变化特征,把每对成对样本数据都用直角坐标系中的点表示出来,由这些点组成的统计图,叫做散点图.例1.(1)单选题(2023下·河南省直辖县级单位·高二校考期末)下列两个变量中能够具有相关关系的是C.正方体的体积与棱长D.某同学的学籍【分析】利用相关关系的定义判断.(2)单选题(2022上·新疆和田-高二校考期末)对于变量x,y有以下四个散点图,由这四个散点图可以判断变量x与y成负相关的是()A.A.【答案】B【分析】根据各图中点的分布,分析变量的相关关系即可.C:各点分布在一条抛物线附近,变量之间先呈正相关,后呈负相关,不符;D:各点分布在一条直线附近,且有正相关性,不符.C:各点分布在一条抛物线附近,变量之间先呈正相关,后呈负相关,不符;D:各点分布在一条直线附近,且有正相关性,不符.知识点2.样本相关系数r(2)样本相关系数r的数字特征:当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关;当|r越接近1时,成对样本数据的线性相关程度越强;当越接近0时,成对样本数据的线性相关程度越弱.线性相关系数是从数值上来判断变量间的线性相关程度,是定量的方法.与散点图相比较,线性相关系数要精细得多,需要注意的是线性相关系数r的绝对值小,只是说明线性相关程度低,但不一定不相关,可能是非线性相关.利用相关系数r来检验线性相关显著性水平时,通常与0.75作比较,若|r>0.75,则线性相关较为显著,否则不显著.例2.(2024上·天津·高三校联考期末)学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为块,他记录了自己连续七天每天一次最多答对的题数如下表:1234567,相关系数由表中数据可知该老师每天一次最多答对题数y与天数x之间是相关(填“正”或“负”),其相关系数r≈(3)决定系数R²;方法技巧经验回归方程的求法及应用方法技巧一元线性回归模型拟合问题的求解策略(1)求x与y的样本相关系数r(结果保留三位小数);,,,【分析】(1)根据给定数据,求出样本中心点,再代入公式计算即得.(2)由(1)的信息,结合最小二乘法公式计算即得.,所以y关于x的线性回归方程为1.解答题.(2023上·高二课时练习)《国家学生体质健康标准(2014年修订)》中,体能监测包含身高、体重、肺活量、50米跑、坐位体前屈、引体向上(女:仰卧起坐)、立定跳远、1000米跑(女:800米跑),据此得到的每项指标都可以按照相应的单项指标评分表进行测量和计分,分别得到相应的数据.(2)依据你的经验,哪两组数据的相关程度可能最高?哪两组数据的相关程度可能最低?如何通过统计方法(2)肺活量和50米跑相关程度最高,身高和肺活量相关程度最低(答案不唯一)【分析】(1)根据相关关系的定义判断即可;(2)根据经验找到合理的案例,结合统计学知识分析即可.(2)依据经验可知肺活量和50米跑相关程度最高,身高和肺活量相关程度最低,(答案不唯一),通过测量出50米成绩与肺活量的数据,作出散点图,即可判断.通过测量出身高与肺活量的数据,作出散点图,即可判断.2.单选题(2023上·天津武清·高三天津英华国际学校校考阶段练习)有人调查了某高校14名男大学生的身编号123456789利用最小二乘法计算的儿子身高Y关于父亲身高x的回归直线为=0.839x+28.957.父亲身高根据以上信息进行的如下推断中,正确的是()B.父亲身高和儿子身高是正相关,因此身高更高的父亲,其儿子的身高也更高C.从回归直线中,无法判断父亲身高和儿子身高是正相关还是负相关D.回归直线的斜率可以解释为父亲身高每增加1cm,其儿子身高平均增【分析】由回归直线中的y为估计值并不绝对,可排除A、B,0.839>0可排除C.对B选项:同上,该值为估计值,并不绝对,故错误;对C选项:由0.839>0,故可判断父亲身高和儿子身高是正相关,故错误;都D选项:回归直线的斜率可以解释为父亲身高每增加1cm,其儿子身高平均增加0.839cm,故正确.模连续六年位居世界首位.某汽车城从某天开始连续的营业天数x与新能源汽车销售总量y(单位:辆)的从某天开始连续的营业天数x(1)已知可用线性回归模型拟合y与x的关系,请用相关系数加以说明(结果精确到0.001);,5,√S≈2236.,参考公式:相关系,经验回归方程γ=â+bx中斜率与截距的最小二乘估计公式分别(2)j=0.67x+54.9,142辆.(2)由最小二乘法的计算公式求解线性回归方程,即可代入求解.,则相关系y与x的相关系数近似为0.999,说明y与x的线性相关程度相当高,从而可用线性回归模型拟合y与x的关系.所以y关于x的经验回归方程为j=0.67x+54.9.将x=130代入j=0.67x+54.9,得g=0.67×130+54.9=142,所以预测该汽车城连续营业130天的汽车销售总量为142辆.,月份123456234345单位成本(元/件)【详解】(1)设x表示每月产量(单位:千件),y表示单位成本(单位:元/件),作散点图如图.,,(2)由回归方程知,每增加1000件产量,单位成本下降1.818元.(3)当y=70时,70=-1.818x+77.363,得x≈4.050千件.∴单位成本是70元/件时,产量约为4050件.5.填空题(2021下·安徽六安·高二安徽省舒城中学校考阶段练习)甲、乙、丙、丁4位同学各自对A,B甲乙丙丁散点图BBBBBBBA残差平方和则试验结果体现拟合A,B两变量关系的模型拟合精度高的同学是.【分析】根据散点图中各样本点条状分布越均匀,同时残差平方和越小,即可判断其线性回归模型的拟合故答案为:丁.中国企业如何提升全球行业竞争力进行了研讨.数据显示,某企业近年加大了科技研发资金的投入,其科技投入x(百万元)与收益y(百万元)的数据统计如下:1234567z5log₂5≈2.3..设203+38≥100,解得:0.3x+3.8≥log₂100=2+2log₂5,解得:x≥9.3.∴科技投入的费用至少要9.3百万元,下一年的收益才能达到1亿.1.(2023·全国·模拟预测)一座城市的夜间经济不仅有助于拉动本地居民内需,还能延长外地游客、商务办公者等的留存时间,带动当地经济发展,是衡量一座城市生活质量、消费水平、投资环境力的重要指标.数据显示,近年来中国各地政府对夜间经济的扶持力度加大,夜间经济的市场发展规模保持稳定增长,下表为2017-2022年中国夜间经济的市场发展规模(单位:万亿元),其中2017-2022年对应的年份代码依次为1~6.中国夜间经济的市场发展规模y/万亿元(1)已知可用函数模型y=a·b拟合y与x的关系,请建立Y关于x的回归方程(a,b的值精确到0.01);(2)某传媒公司预测2023年中国夜间经济的市场规模将达到48.1万亿元,现用(1)中求得的回归方程预测2023年中国夜间经济的市场规模,若两个预测规模误差不超过1万亿元,则认为(1)中求得的回归方程是理想的,否则是不理想的,判断(1)中求得的回归方程是否理想.参考数据:其中v₁=Iny;.【分析】(1)通过对所给的的函数模型取对数,转换为求回归直线方程即可,再结合题中所给的直线方程(2)利用(1)中求得的函数模型进行预测,结合回归方程理想的定义判断即可.所以v=lna+xlnb.lnâ≈3.366-0.148×3.5=2.848.所以y=e²88+048=17.25×1.16.(2)2023年对应的年份代码为7,当x=7时,=17.25×1.16⁷=17.25×2.83≈48.82,48.82-48.1=0.72<1,所以(1)中求得的回归方程y=17.25×1.16*是理想的.1.多选题(2023下·高二课时练习)下列说法正确的是()A.闯红灯与交通事故发生率的关系是相关关系B.同一物体的加速度与作用力是函数关系C.产品的成本与产量之间的关系是函数关系D.广告费用与销售量之间的关系是相关关系【答案】ABD【答案】ABD【分析】利用相关关系的定义判断.【详解】闯红灯与发生交通事故之间不是因果关系,但具有相关性,是相关关系,所以A正确;2.多选题(2023上·辽宁沈阳·高二校考期末)对两个变量y和x进行回归分析,则下列结论正确的为()B.残差平方和越小的模型,拟合的效果越好C.建立两个回归模型,模型1的相关系数₁=-0.999,模型2的相关系数=0.876,则模型2的拟合度D.以y=ae**模型去拟合某组数据时,为了求出回归方程,设z=Iny,将其变换后得到线性方程z=6x+ln2,则a,b的值分别为2,6【答案】【答案】BD【分析】根据回归方程、残差、相关系数、非线性回归等知识对选项进行分析,从而确定正确答案.【详解】A选项,回归直线不一定经过样本点,A选项错误.D选项,由z=6x+ln2=Iny,得y=e²=e⁶·e¹m²=2·e*,a=2,b=6,D选项正确.23456销售额y(万元)根据上表可得到回归直线方程g=0.75x+a,据此估计,该公司7月份这种型号产品的销售额为()【分析】根据题意,由回归直线方程过样本点的中心,即可求得a,然后代入计算,即可得到结果.【详解】由表中数据可得【详解】由表中数据可得因为回归直线过样本点的中心,所以16.8=0.75×4+a,解得a=13.8,所以回归直线方程为=0.75x+13.8,则该公司7月份这种型号产品的销售额为y=0.75×7+13.8=19.05万元.,题型4.回归效果的刻画4.单选题(2023·江苏苏州·校联考模拟预测)为研究某地区疫情结束后一段时间内的复工率,用模型(1)和模型(2)模拟复工率y(%)与复工时间x(x的取值为5,10,15,20,25,30天)的回归关系:模型模型(1)的残差图模型(2)的残差图模型(1)的残差图%%%【答案】A【答案】A【分析】根据残差点图分析拟合效果,从而得到答案.题型5.非线性回归分析时间x/miny=ce²来表示,设z=Iny,然后用求回归直线的办法进行求解.【详解】根据收集的数据作散点图(图4.2-4).图4.2-4观察散点图可知,样本点并没有分布在某条直线附近,因而变量y与x之间没有明显的线性相关关系,所以不能直接利用线性回归模型来刻画这两个变量之间的关系.根据已有的数学知识,可以认为样本点分布在指数曲线y=c;e²的附近,其中c和c₂是待定参数.为估计参数G和C₂,在y=ce²*的两端取对数,得到Iny=Inq+c₂x.再令Z=Iny,a=Incj,b=c₂,则得到直线方程z=bx+a.将表4-1中的数据进行代换,得到的数据见表4-2.表4-2x图4.2-5从图4.2-5中可以看出,变换后的样本点分布可以用线性回归方程来拟合.对表4-2中的数据,用最小二乘法可得线性回归方程为≥=0.019x+0.686再利用再利用y=e²可得到转化率y关于反应时间x的非线性回归方程①为1.(2023下·宁夏固原·高二校考阶段练习)下图中的两个变量,具有相关关系的是()A.【分析】根据相关关系的概念逐项分析判断.【详解】相关关系是一种非确定性关系.对于A、C:两个变量具有函数关系,是一种确定对于D:图中的散点分布没有什么规律,故两个变量之间不具有相关关系,故D错误;对于B:图中的散点分布在从左下角区域到右上角区域,两个变量具有相2.(2023上·辽宁丹东·高三统考期中)哈尔滨冰雪大世界于2022年9月投入使用,总投资高达25亿元,12345游客人数y(万人)mn已知y关于x的线性回归直线方程为y=-11.5x+134.5.(1)求2月份,3月份的游客数m,n的值;(2)在1月至5月的游客中随机抽取2人进行调查,把满意率视为概率,求评价为满意的人数X的分布列与期望E(X).【答案】(1)m=105,n=95【分析】(1)根据题意中调查表及回归直线方程,可以分别求出m,n的值;(2)根据题意得满意率为概率,即可列出分布列,求解出期望.所以满意的人数X服从二项分布,即随机变量X的取值分别为:0,1,2,从而得:所以可得满意人数X的分布列如下表所示:X012P94连续五年的储蓄存款,如表1储蓄存款y(千亿元)5678时间代号t12345Z01235(2)通过(1)中的方程,求出y关于x的回归方程:(3)用所求回归方程预测到2021年年底,该地储蓄存款额可达多少?(3)10.8(千亿元).【分析】(1)由已知表格中的数据求得7,z,得到b与à,则线性回归方程可求;(2)将t=x-2015,z=y-5代入z=1.2t-1.4,即可得到y关于x的回归方程;(3)代入x=2021求得)值即可.(2)将1=x-2015,z=y-5代入z=1.2t-1.4,所以y关于x的回归方程为j=1.2x-2414.4.所以预测到2021年年底,该地储蓄存款额可达10.8(千亿元).【方法四】成果评定法【方法四】成果评定法1.(2021·高二课时练习)下列关于回归分析的说法中错误的是()B.残差图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适C.甲、乙两个模型的R²分别约为0.98和0.80,则模型乙的拟合效果更好D.两个模型中残差平方和越小的模型拟合的效果越好【解析】根据回归直线过样本中心点可判断A选项的正误;利用残差图与模型的拟合效果的关系可判断B选项的正误;利用相关指数与模型拟合效果的关系可判断C选项的正误;利用残差平方和与模型拟合效果对于C选项,甲、乙两个模型的R²分别约为0.98和0.80,则模型甲的拟合效果更好,C选项错误;对于D选项,两个模型中残差平方和越小的模型拟合的效果越好,D选项正确.2.某产品的广告费用x万元与销售额y万元的统计数据如表:2345A.63.6;【详解】,①设a、b、c分别表示数据15、17、14、10、15、17、17、16、14、12的平均数、中位数、众数,则a<b<c这组数据的平均数是14.7.因为此组数据中出现次数最多的数是17,则a<b<c;故④正确.【点睛】本题主要考查命题的真假判断,涉及统计的基础知识:频率分布直方图和4.(2023上·山东青岛·高三统考开学考试)已知某设备的使用年限x(年)与年维护费用y(千元)的对x24568y39A.0.75B.0.85C.0.95【答案】B【答案】B【分析】根据题意,求得样本中心,把样本中心代入回归直线方程,即可求解.【详解】由题意得.,因为回归直线过样本中心点(5,6.1),所以6.1=1.05×5+â,解得â=0.85.【答案】【答案】B【分析】根据代入求值、以及回归直线方程斜率的意义可以判断三种说法的正确性,选出正确答案.【点睛】本题考查了线性回归方程的斜率的意义,属于基础题.知某科技公司2018年至2022年云计算市场规模数据,且市场规模y(单位:千万元)与年份代码x的关系可以用模型y=ae*(其中e=2.71828…)拟合,设z=lny,得到数据统计如下表:2018年2019年2020年2021年2022年X12345ymzn34由上表可得回归方程z=0.52x+1.44,则m的值约为()【答案】B【答案】B,所以n=2,又因为z=lny,即2=Inm,所以m=e²≈7.4.7.(2023下·内蒙古兴安盟·高二乌兰浩特市第四中学校考期中)已知某公司产品的广告投入x(万元)与利润y(万元)的一组数据如表所示x23456y告投入为9万元时,利润约为()A.112万元B.114.5万元C.115万元D.115.5万元,故广告投入为9万元时,利润约为114.5万元.A.6B.7;,,9.(2023·全国·模拟预测)下列说法正确的是()A.某校高一年级学生有800人,高二年级学生有900人,高三年级学生有1000人,为了了解高中生对亚运会的关注程度,现采用分层随机抽样方法抽取样本容量为270的样本进行问卷调查,其中高一学生抽取的样本容量为80B.某人有10把钥匙,其中有3把能打开门,若不放回地依次随机抽取3把钥匙试着开门,则第三次才,L,t,L,x₂【分析】根据分层抽样、古典概型、相关系数、样本的数字特征等知识对选项进行分析案.【详解】对于选项A,因为高一年级、高二年级、高三年级学生人数之比为800:900:1000,即8:9:10,所以高一学生抽取的样本容量为,故A正确:对于选项C,对一组给定的样本数据(xy,5),(x₂,y₂),L,(x₂,y,)的统对于选项D,X,X₂,x₃,L,x,XnH,L,x₂的方差,,,不一定等于x,X₂,x₃,L,k,L,xn,X₄,L,t两者不相等,故D不正确.10.(2023下·辽宁阜新·高二校联考阶段练习)考研已成为当今大学生的热门选择.下表统计了某市2017-2022年研究生的报考人数,年份代号x123456值比实际人数多0.12万,则()A.x与y之间呈正相关关系C.年份每增加1年,研究生报考人数估计增加了1万D.预测该市2023年研究生报考人数约为4.85万【答案】ABD【详解】由表中数据知,y随x的增大而增大,所以x与y之间呈正相关关系,A项正确;因为回归直线j=bx+à必过点(x,j),所以3.5b+à=3.1,因为2021年研究生报考人数的预测值比实际人数多0.12万,因为2021年研究生报考人数的预测值比实际人数多0.12万,B项正确;因为p=0.5x+1.35,所以年份每增加1年,研究生报考人数估计增加了0.5万,C项错误;将x=7代入j=0.5x+1.35,得j=0.5×7+1.35=4.85,所以预测该市2023年研究生报考人数约为4.85万,D项正确.11.(2023下·广东韶关·高二统考期末)下列说法正确的是()A.事件A与事件B为互斥事件,则事件A与事件B为对立事件B.事件A与事件B为对立事件,则事件A与事件B为互斥事件D.一组成对样本数据线性相关程度越强,则这组数据的样本相关系数的绝对值就越接近于1【答案】【答案】BCD【分析】A.利用互斥事件和对立事件的关系判断;B.利用对立事件和互斥事件的关系判断;C.由)求解判断:D.由样本相关系数的意义判断.【详解】A.事件A与事件B为互斥事件,但事件A与事件B不一定是对立事件,故错误;B.事件A与事件B为对立事件,则事件A与事件B为互斥事件,故正确;D.如一组成对样本数据线性相关程度越强,则这组数据的样本相关系数的绝对值就越接近于1,故正确;12.(2023·湖南郴州·统考一模)下列说法正确的是()B.一组数据10,11,11,12,13,14,16,18,20,22的第60百分位数为14数m的值是一4【答案】ACD【分析】根据正态分布概率性质计算判断【分析】根据正态分布概率性质计算判断A,由百分位数定义计算判断B,根据相关系数的概念判断C,把中心点代入回归方程求解后判断D.【详解】选项A,由已知P(X≤3)=0.5,因此P(3<X<4)=P(X<4)-P(X≤3)=0.2,A正确;选项B,总共有10个数,由于10×60%=6,因此第60百分位数为,B错:选项D,由已知2.8=0.3m-m,解得m=-4,D正确.三、填空题13.(2023·高二课时练习)已知x与y之间的一组数据:x013ym37根据数据可求得y关于x的线性回归方程为p=2.1x+0.85,则m的值为【分析】根据题意求出x,y关于m的表达式,代入回归方程故答案为:0.5.14.(2022·全国·高二专题练习)2013年1月,北京经历了59年来雾霾天气最多的一个月.据气象局统计,北京市2013年从1月1日至1月30日这30天里有26天出现雾霾天气,《环境空气质量指数(AQI)技术规定(试行)》将空气质量指数分为六级,如表1:组别I优Ⅱ良Ⅲ中度污染V表2【答案】【答案】j=10.25-1.05x,故答案为:=10.25-1.05x两式相比较,∴k=0.3,两式相比较,∴k=0.3,故答案为:0.316.(2023·湖南郴州·安仁县第一中学校联考模拟预测)已知某种商品的直播平台支出x(单位:万元)与农产品销售额y(单位:万元)之间有如下对应数据:x234678ymy=x²的图象上,据此估计,可以得到m的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《GBT 3043-2017 普通磨料 棕刚玉化学分析方法》专题研究报告
- 装修污染管控师风险评估与管理知识考核试卷含答案
- 压缩机装配调试工诚信道德水平考核试卷含答案
- 玻纤织布带工复测评优考核试卷含答案
- 化学镀银工安全培训效果强化考核试卷含答案
- 《GBT 14048.12-2016 低压开关设备和控制设备 第 4-3 部分:接触器和电动机起动器 非电动机负载用交流半导体控制器和接触器》专题研究报告
- 水族造景工安全培训效果测试考核试卷含答案
- 公司家用音频产品维修工职业健康、安全、环保技术规程
- 文物修复师岗前达标考核试卷含答案
- 重冶转炉工安全行为模拟考核试卷含答案
- 《环境科学与工程导论》课件-第9章固体废物污染及其控制
- 主持词写作教学课件
- 职业教育课程思政教学资源建设方案
- IATF16949质量管理体系文件全套下载
- 涉密人员安全培训教育课件
- 贵州省黔西南布依族苗族自治州2025年-2026年小学六年级数学期末考试(上学期)试卷及答案
- 2025年度汽修厂维修工劳动保护与职业健康改善合同
- 设备基本知识培训课件
- 蒋介石人物简介
- 消防水管网系统改造方案
- 《新闻学概论》试题及参考答案
评论
0/150
提交评论