作业04统计(3大题型巩固提升练能力培优练拓展突破练仿真考场练)_第1页
作业04统计(3大题型巩固提升练能力培优练拓展突破练仿真考场练)_第2页
作业04统计(3大题型巩固提升练能力培优练拓展突破练仿真考场练)_第3页
作业04统计(3大题型巩固提升练能力培优练拓展突破练仿真考场练)_第4页
作业04统计(3大题型巩固提升练能力培优练拓展突破练仿真考场练)_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

完成时间:月日天气:作业04统计(3大题型巩固提升练+能力培优练+拓展突破练+仿真考场练)一、变量的相关性1.变量的相关关系与相关系数是学习线性回归模型的前提和基础,前者可借助散点图从直观上分析变量间的相关性,后者从数量上准确刻画了两个变量的相关程度.2.判断变量相关性的两种方法(1)散点图法:直观形象.(2)公式法:可用公式精确计算,需注意特殊情形的相关系数.如点在一条直线上,|r|=1,且当r=1时,正相关;r=-1时,负相关.二、线性回归方程1.主要考查两个变量线性相关的判定,以及利用最小二乘法求线性回归方程.2.解决回归分析问题的一般步骤(1)画散点图.根据已知数据画出散点图.(2)判断变量的相关性并求线性回归方程.通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出线性回归方程.(3)实际应用.依据求得的线性回归方程解决实际问题.三、独立性检验1.主要考查根据样本制作2×2列联表,由2×2列联表计算χ2,查表分析并判断相关性结论的可信程度.2.独立性检验的一般步骤①根据样本数据制成2×2列联表;②根据公式χ2=eq\f(nad-bc2,a+bc+da+cb+d)计算χ2的值;③查表比较χ2与临界值的大小关系,作出统计判断.一.变量间的相关关系(共2小题)1.(2023春•宿迁期末)下列图中,能反映出相应两个变量之间具有线性相关关系的是A. B. C. D.【分析】根据题意,依次分析选项中的变量关系,综合可得答案.【解答】解:根据题意,依次分析选项:对于,是确定性的函数关系,不符合题意;对于,图中的散点分布在某条直线的附近,两个变量之间具有线性相关关系,符合题意;对于,图中的散点没有向某条直线的附近集中,两个变量不具有线性相关关系,不符合题意;对于,图中的散点分布在一条曲线附近,两个变量不具有线性相关关系,不符合题意.故选:.【点评】本题考查变量间的相关关系,涉及散点图的应用,属于基础题.2.(2023春•高新区校级期中)下列说法正确的是A.将一组数据中的每个数据都乘以同一个非零常数后,方差也变为原来的倍 B.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高 C.线性相关系数的绝对值越大,两个变量的线性相关性越强;反之,线性相关性越弱 D.在回归模型中,预报变量的值不能由解释变量唯一确定【分析】根据方差性质判断;根据残差图的意义判断;根据相关系数的含义判断;根据回归模型中,预报变量的值与解释变量的关系判断.【解答】解:对于,将一组数据中的每个数据都乘以同一个非零常数后,方差也变为原来的倍,故错误;对于,在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,故正确;对于,线性相关系数的绝对值越接近于1,两个变量的线性相关性越强;反之,相关系数的绝对值越接近于0,线性相关性越弱,故错误;对于,预报变量的值由解释变量和随机误差共同确定,只能解释部分的变化,即在回归模型中,预报变量的值不能由解释变量唯一确定,故正确.故选:.【点评】本题主要考查了方差的性质,考查了变量间的相关关系,属于中档题.二.线性回归方程(共4小题)3.(2024春•南通期中)某产品的广告费用(单位:万元)与销售额(单位:万元)之间有如下关系:2456830405060已知与的线性回归方程为,则等于A.68 B.69 C.70 D.71【分析】根据线性回归方程过样本中心点,求解即可.【解答】解:由题意可知,,因为线性回归方程过样本中心点,,所以,所以,解得.故选:.【点评】本题主要考查了线性回归方程的性质,属于基础题.4.(2024春•镇江期中)已知,的取值如下表所示,从散点图分析可知与线性相关,如果线性回归方程为,则实数的值为234566.51011.518.5A.13 B.13.5 C.14 D.14.5【分析】利用线性回归方程一定过样本中心点,求解即可.【解答】解:由题意可知,,因为线性回归方程一定过样本中心点,,所以,所以,解得.故选:.【点评】本题主要考查了线性回归方程的性质,属于基础题.5.(2024春•启东市期中)稀土被誉为工业的维生素,具有无法取代的优异磁、光、电性能,对改善产品性能,增加产品品种,提高生产效率起到了巨大的作用.下表是2023年前5个月我国稀土出口均价(单位:万元吨)与月份的统计数据.123451.72.42.01.6若与的线性回归方程为,则的值为A.1.6 B.1.8 C.2.0 D.2.2【分析】根据线性回归方程为过样本中心点,求解即可.【解答】解:由题意可知,,因为线性回归方程为过样本中心点,,所以,所以,解得.故选:.【点评】本题主要考查了线性回归方程的性质,属于基础题.6.(2024•金坛区校级三模)某工厂为研究某种产品的产量(吨与所需某种原材料的质量(吨的相关性,在生产过程中收集4组对应数据,如表所示.34562.534根据表中数据,得出关于的经验回归方程为,则表中的值为4.5.【分析】根据经验回归方程过样本中心点,求解即可.【解答】解:由题意可知,,因为经验回归方程过样本中心点,,所以,所以,解得.故答案为:4.5.【点评】本题主要考查了经验回归方程的性质,属于基础题.三.独立性检验(共5小题)7.(2024春•镇江期中)某医疗研究机构为了解打鼾与患心脏病的关系,运用列联表进行独立性检验,经计算,则所得到的统计学结论是认为打鼾与患心脏病有关系的把握约为0.100.050.010.0050.0012.7063.8416.6357.87910.828A. B. C. D.【分析】根据的值与临界值比较即可得出结论.【解答】解:因为,所以有的把握认为打鼾与患心脏病有关系.故选:.【点评】本题主要考查了独立性检验的应用,属于基础题.8.(2023春•高新区校级月考)某中学为调查高一年级学生的选科倾向,随机抽取了300人,其中选考物理的有220人,选考历史的有80人,统计各选科人数如表所示:选考类别选择科目思想政治地理化学生物物理类80100145115历史类50453035参考数据:,其中.附表:0.100.050.0100.0050.0012.7063.8416.6357.87910.828则下列说法中正确的是A.选考物理类的学生中选择政治的比例比选考历史类的学生中选择政治的比例高 B.选考物理类的学生中选择地理的比例比选考历史类的学生中选择地理的比例高 C.参照附表,根据小概率值的独立性检验,我们认为选择生物与选考类别无关 D.参照附表,根据小概率值的独立性检验,我们认为选择生物与选考类别有关【分析】分别求出各个比例,即可判断、项;列出列联表,求出的值,根据独立性检验的思想,即可判断、项.【解答】解:对于项,选考物理类的学生中选择政治的比例为,选考历史类的学生中选择政治的比例为,显然,故项错误;对于项,选考物理类的学生中选择地理的比例为,选考历史类的学生中选择地理的比例,,故项错误;对于项,根据已知,可列出列联表:选择生物不选择生物合计物理类115105220历史类354580合计150150300,所以根据小概率值的独立性检验,我们认为选择生物与选考类别无关,故项正确;对于项,根据项可知,项错误.故选:.【点评】本题考查了独立性检验的应用问题,也考查了计算能力的应用问题,是基础题.9.(2023春•鼓楼区期末)为了考查某种营养液对有机蔬菜的增产效果,某研究所进行试验、获得数据、经过计算后得到,那么可以认为该营养液为有机蔬菜的增产效果的把握为附:临界值表(部分)0.050.0250.0100.0050.0013.8415.0246.6357.87910.828A.以上 B.以上 C.以上 D.以下【分析】,与6.635比较大小,即可作出判断.【解答】解:因为,所以该营养液为有机蔬菜的增产效果的把握为以上.故选:.【点评】本题主要考查了独立性检验的应用,属于基础题.10.(2023春•连云港月考)若由一个列联表中的数据计算得,则0.250.150.100.050.0250.0100.0050.0011.3232.0722.7063.8415.0246.6357.87910.828A.能有的把握认为这两个变量有关系 B.能有的把握认为这两个变量没有关系 C.能有的把握认为这两个变量有关系 D.能有的把握认为这两个变量没有关系【分析】通过所给的观测值,同临界值表中的数据进行比较,得到结论.【解答】解:因为,所以能有的把握认为这两个变量有关系.故选:.【点评】本题主要考查了独立性检验的应用,属于基础题.11.(2023春•连云港期末)为考查某种流感疫苗的效果,某实验室随机抽取100只健康小鼠进行试验,得到如下列联表:感染未感染注射1040未注射20300.050.0250.0103.8415.0246.635则在犯错误的概率最多不超过0.05的前提下,可认为“注射疫苗”与“感染流感”有关系.参考公式:.【分析】补充列联表,计算可得,即可得出答案.【解答】解:补充列联表可得,感染未感染合计注射104050未注册203050合计3070100所以.所以在犯错误的概率最多不超过0.05的前提下,可认为“注射疫苗”与“感染流感”有关系.故答案为:0.05.【点评】本题主要考查独立性检验,考查运算求解能力,属于基础题.一.选择题(共3小题)1.(2023春•灌南县校级期中)设两个相关变量和分别满足下表:12345128816若相关变量和可拟合为非线性回归方程,则当时,的估计值为(参考公式:对于一组数据,,,,,,,其回归直线的斜率和截距的最小二乘估计公式分别为:,;A.33 B.37 C.65 D.73【分析】根据题意,令,则,计算,,再根据公式计算,,最后求出,将代入求值即可.【解答】解:令,则,,,,,故,当时,.故选:.【点评】本题考查线性回归方程的应用,换元法的应用,属于中档题.2.(2023春•扬州月考)为了预防肥胖,某校对“学生性别和喜欢吃甜食”是否有关做了一次调查,其中被调查的男女生人数相同,男生喜欢吃甜食的人数占男生人数的,女生喜欢吃甜食的人数占女生人数的,若有的把握认为是否喜欢吃甜食与和性别有关,则被调查的男生人数可能是参考公式及数据:,其中.附:0.050.0103.8416.635A.7 B.11 C.15 D.20【分析】设男生的人数为:,根据题意可列出列联表,由公式求出,由,求出的取值范围,可得答案.【解答】解:由题意被调查的男女生人数相同,设男生的人数为:,由题意可列出列联表:男生女生合计喜欢吃甜食不喜欢吃甜食合计,由于有的把握认为是否喜欢吃甜食和性别有关,所以;解得:,因为,故的可能取值为:12,13,14,15,16,17,18,19,即男生的人数可以是:12,13,14,15,16,17,18,19,所以选项错误,选项正确.故选:.【点评】本题考查卡方独立性检验,属于基础题.3.(2023春•淮安月考)某工厂为研究某种产品的产量(吨与所需某种原材料的质量(吨的相关性,在生产过程中收集5组对应数据,如表所示.(残差观测值预测值)345674.02.50.5根据表中数据,得出关于的经验回归方程为.据此计算出在样本处的残差为,则表中的值为A.1.5 B.1.2 C. D.【分析】由在样本处的残差求,可得线性回归方程,再求出样本点的中心的坐标,代入线性回归方程即可求得值.【解答】解:在样本处的残差为,,解得,经验回归方程为,,,则,解得.故选:.【点评】本题考查线性回归方程的应用,明确线性回归方程恒过样本点的中心是关键,是基础题.二.多选题(共3小题)4.(2024•六合区校级二模)下列说法中,正确的是A.设有一个经验回归方程为,变量增加1个单位时,平均增加2个单位 B.已知随机变量,若,则 C.两组样本数据,,,和,,,.若已知且,2,3,,则 D.已知一系列样本点,,2,3,的经验回归方程为,若样本点与的残差相等,则【分析】根据线性回归方程的性质以及正态分布的对称性即可判断.【解答】解:若有一个经验回归方程,随着的增大,会减小,错误;曲线关于对称,因为,所以,所以,正确;因为,所以,故,正确;经验回归方程为,且样本点与的残差相等,则,所以,正确.故选:.【点评】本题考查线性回归方程,属于基础题.5.(2024春•灌云县校级期中)下列说法中,正确的是A.设有一个经验回归方程为,变量增加1个单位时,平均增加2个单位 B.已知随机变量服从超几何分布,3,,则 C.样本相关系数越大,两个变量的线性相关程度越强,反之,线性相关程度越弱 D.将4名老师分派到两个学校支教,每个学校至少派1人,则共有14种不同的分派方法【分析】根据线性回归方程即可判断;利用超几何分布的定义可以判断;利用相关系数的定义可以判断;对于选项,可以分两种情况求解即可.【解答】解:对于,由题意可得,两个变量呈负相关,当增加时,减小,故错误;对于,,故正确;对于,的绝对值越大,相关性越强,所以越接近于,相关性也较强,故选项错误;对于,若一个学校分3人,另一学校分两人,则有种,若每个学校分2人则有种,所以共有14种,故正确.故选:.【点评】本题考查相关系数,线性回归方程,超几何分布,以及分组分配问题,属于中档题.6.(2023春•常州期中)下列命题正确的是A.若甲、乙两组数据的相关系数分别为0.66和,则乙组数据的线性相关性更强 B.回归分析中常用残差平方和来刻画拟合效果好坏,残差平方和越小,拟合效果越好 C.对变量与的统计量来说,值越小,判断“与有关系”的把握性越大 D.对具有线性相关关系的变量、,有一组观测数据,,2,,,其线性回归方程是,且,则实数的值是【分析】通过比较两数据的相关系数的绝对值即可判断;根据残差平方和即可判断;根据值越小,“与有关系”的把握性越小,即可判断;根据回归方程的性质,即可判断.【解答】解:.因为乙数据的相关系数的绝对值为0.85,比甲数据的相关系数的绝对值0.66大,所以乙组数据的线性相关性更强,所以该选项正确;.回归分析中常用残差平方和来刻画拟合效果好坏,残差平方和越小,拟合效果越好,所以该选项正确;.对变量与的统计量来说,值越小,判断“与有关系”的把握性越小,所以该选项错误;.由题得,,所以样本中心点满足方程,所以,解得,所以该选项正确.故选:.【点评】本题考查回归方程的应用,属于中档题.三.填空题(共1小题)7.(2024春•建平县校级月考)为了比较甲、乙、丙、丁四组数据的线性相关性强弱,某同学分别计算了甲、乙、丙、丁四组数据的线性相关系数,求得数值依次为,,0.36,0.93,则这四组数据中线性相关性最强的是甲组数据.【分析】根据相关系数的绝对值越接近于1,数据的线性相关性越强判断即可.【解答】解:相关系数的绝对值越接近于1,则数据的线性相关性越强,,这四组数据中线性相关性最强的是甲组数据.故答案为:甲.【点评】本题主要考查了相关系数的性质,属于基础题.四.解答题(共10小题)8.(2024•南通四模)某高校统计的连续5天入校参观的人数(单位:千人)如下:样本号12345第天12345参观人数2.42.74.16.47.9并计算得,.(1)求关于的回归直线方程,并预测第10天入校参观的人数;(2)已知该校开放1号,2号门供参观者进出,参观者从这两处门进校的概率相同,且从进校处的门离校的概率为,从另一处门离校的概率为.假设甲、乙两名参观者进出该校互不影响,已知甲、乙两名参观者从1号门离校,求他们从不同门进校的概率.附:回归直线方程:,其中.【分析】(1)根据参考公式求得回归系数,即可得线性回归方程,再代入,预测第10天入校参观的人数;(2)结合相互独立事件的概率公式,条件概率的计算公式,求解即可.【解答】解:(1)由题意知,,,所以关于的回归直线方程为,当时,,故预测第10天入校参观的人数为14.99千人.(2)设事件“甲、乙两名参观者从1号门离校”,事件“甲、乙两名参观者从不同门进校”,则,(A),所以,故甲、乙两名参观者从1号门离校,他们从不同门进校的概率为.【点评】本题考查统计与概率,熟练掌握线性回归方程的求法,相互独立事件的概率公式,条件概率的计算公式是解题的关键,考查逻辑推理能力和运算能力,属于中档题.9.(2024春•镇江期中)在人体生长发育过程中,人体的各部分与身高都有一定的比例关系,根据脚长推测身高具有重要的意义.为研究根据脚长推测身高的方法,某班级数学兴趣小组对本班50名同学进行了随机抽样调查,用简单随机抽样的办法抽取10名同学,测量每个人的脚长和身高,记录相关数据并进行统计分析,现将相关数据整理如下:(单位:厘米)脚长18.920.221.121.922.823.623.925.325.826.5身高159161163165167172173177179184(1)根据上表数据,请计算脚长与身高的相关系数,并说明线性相关性的强弱;(相关系数精确到小数点后2位)(2)根据此小组研究的数据,若某同学的脚印长,试推测该同学的身高.(计算过程中结果精确到小数点后1位)(注:当,则认为与的线性相关性较弱;当,则认为与的线性相关性很强).附:本题可能涉及到数据和公式:;;;;回归方程:,其中,.相关系数:.【分析】(1)利用相关系数的定义即可判断;(2)先求出线性回归方程,再估计脚长时,该同学的身高.【解答】解:(1)由题意可得,脚长与身高相关性很强;(2),,,,线性回归方程为,当时,,当某同学的脚印长,该同学身高的估计值为.【点评】本题考查相关系数与线性回归方程,考查学生的计算能力,属于中档题.10.(2023春•涟水县校级期中)某市销售商为了解、两款的款式与购买者性别之间是否有关系,对一些购买者做了问卷调查,得到列联表如表所示:购买款购买款总计女252045男154055总计4060100(1)是否有的把握认为购买款式与性别之间有关,请说明理由;(2)用样本估计总体,从所有购买两款的人中,选出4人作为幸运顾客,求4人中购买款的人数不超过1人的概率.附:0.10.050.010.0050.0012.7063.8416.6357.87910.828参考公式:,.【分析】(1)计算的值,再与临界值比较,从而得解;(2)根据二项分布及互斥事件的并事件的概率加法公式,即可求解.【解答】解:(1)根据题意可得,有的把握认为购买款式与性别之间有关;(2)“从所有购买两款的人中,选出4人“可以看成4次独立重复试验,且每次选出的购买款的概率为,设选出的4人中购买款的人数为,则,,,,即4人中购买款的人数不超过1人的概率为.【点评】本题考查独立性检验原理的应用,二项分布的概率问题,互斥事件的并事件的概率加法公式的应用,属中档题.11.(2023春•灌南县校级期中)为推动实施健康中国战略,树立国家大卫生、大健康观念,也推出了多款健康运动软件,如“微信运动”,某运动品牌公司140名员工均在微信好友群中参与了“微信运动”,且公司每月进行一次评比,对该月内每日运动都达到10000步及以上的员工授予该月“运动达人”称号,其余员工均称为“参与者”,如表是该运动品牌公司140名员工2021年1月5月获得“运动达人”称号的统计数据:月份12345“运动达人”员工数1201051009580(1)由表中看出,可用线性回归模型拟合“运动达人”员工数与月份之间的关系,求关于的回归直线方程,并预测该运动品牌公司6月份获得“运动达人”称号的员工数;(2)为了进一步了解员工们的运动情况,选取了员工们在3月份的运动数据进行分析,统计结果如下:运动达人参与者合计男员工6080女员工2060合计10040140请补充如表中的数据(直接写出,得值),并根据如表判断是否有的把握认为获得“运动达人”称号与性别有关?参考公式:(其中.0.100.050.0250.0102.7063.8415.0246.635【分析】(1)先求出样本中心,再利用公式求出回归系数,即可得到线性回归方程;(2)由列联表中的数据,计算的值,对照临界表中的数据,比较即可得到答案.【解答】解:(1)由题意,,又,,则,故,故,所以预测该运动品牌公司6月份获得“运动达人”称号的员工数为人;(2)由题意,,,所以,故没有的把握认为获得“运动达人”称号与性别有关.【点评】本题考查了列联表的应用以及独立性检验的应用,线性回归方程的求解与应用,要掌握线性回归方程必过样本中心这一知识点,考查了逻辑推理能力与运算能力,属于中档题.12.(2023春•丹阳市校级月考)为了检测某种抗病毒疫苗的免疫效果,需要进行动物与人体试验.研究人员将疫苗注射到200只小白鼠体内,一段时间后测量小白鼠的某项指标值,按,,,,,,,,,分组,绘制频率分布直方图如图所示,实验发现小白鼠体内产生抗体的共有160只,其中该项指标值不小于60的有110只,假设小白鼠注射疫苗后是否产生抗体相互独立.(1)填写下面的列联表,能否在犯错误的概率不超过0.05前提下认为注射疫苗后小白鼠产生抗体与指标值不小于60有关?(单位:只)抗体指标值合计小于60不小于60有抗体_______________没有抗体_______________合计_______________(2)为检验疫苗二次接种的免疫抗体性,对第一次注射疫苗后没有产生抗体的40只小白鼠进行第二次注射疫苗,结果又有20只小自鼠产生抗体.用频率估计概率,求一只小白鼠注射2次疫苗后产生抗体的概率;以中确定的概率作为人体注射2次疫苗后产生抗体的概率,进行人体接种试验,记个人注射2次疫苗后产生抗体的数量为随机变量.试验后统计数据显示,当时,取最大值,求参加人体接种试验的人数.参考公式:(其中为样本容量)0.500.400.250.150.1000.0500.0250.4550.7081.3232.0722.7063.8415.024【分析】(1)根据独立性检验的方法求解即可;(2)根据条件公式和对立事件的性质计算即可;根据二项分布的概率公式列出不等式即可求解.【解答】解:(1)由频率分布直方图知,200只小白鼠按指标值分布为:在,内有只,在,内有只,在,内有只,在,内有只,在,内有只,由题意,有抗体且指标值小于60的有50只,而指标值小于60的小白鼠共有只,所以指标值小于60且没有抗体的小白鼠有20只,同理,指标值不小于60且没有抗体的小白鼠有20只,故列联表如下:指标值抗体小于60不小于60合计有抗体50110160没有抗体202040合计70130200,所以在犯错误的概率不超过0.05前提下认为注射疫苗后小白鼠产生抗体与指标值不小于60有关.(2)令事件“小白鼠第一次注射疫苗产生抗体”,事件“小白鼠第二次注射疫苗产生抗体”,事件“小白鼠注射2次疫苗后产生抗体”,则,,,所以一只小白鼠注射2次疫苗后产生抗体的概率.由题意,知随机变量,,因为最大,所以,解得,是整数,所以或,接受接种试验的人数为109或110.【点评】本题考查了独立性检验的应用问题,也考查了计算能力的应用问题,是基础题.13.(2023春•丹徒区校级期末)小家电指除大功率、大体积家用电器(如冰箱、洗衣机、空调等)以外的家用电器,运用场景广泛,近年来随着科技发展,智能小家电市场规模呈持续发展趋势,下表为连续5年中国智能小家电市场规模(单位:千亿元),其中年份对应的代码依次为.年份代码12345市场规模0.91.21.51.41.6(1)由上表数据可知,可用线性回归模型拟合与的关系,求关于的经验回归方程(系数精确到;(2)某传媒公司为了了解中国智能小家电消费者年龄分布,随机调查了200名消费者,统计这200名消费者年龄,按照青少年与中老年分为两组,得到如下列联表,请将列联表补充完整,并回答:依据的独立性检验,能否认为是否喜欢够买智能小家电与年龄有关?青少年中老年合计喜欢购买智能小家电80__________不喜欢购买智能小家电_____60_____合计110_____200参考数据及公式:,,中,,附:临界值表0.100.0100.0012.7066.63510.828【分析】(1)利用已知数据计算相关系数,从而可判断与的线性相关程度,再利用公式计算相关量即可得回归方程;(2)完成列联表,根据给定数据判断得出结论.【解答】解:(1)由已知得,,,,,所以,因为与的相关系数近似为0.92,说明与的线性相关程度较高,所以可以用线性回归模型拟合与的关系.由题可得,,,,故与的经验回归方程为.(2)由题意可得如下列联表:青少年中老年合计喜欢购买智能小家电8030110不喜欢购买智能小家电306090合计11090200所以,所以能认为是否喜欢购买智能小家电与年龄有关.【点评】本题主要考查线性回归方程,独立性检验,考查运算求解能力,属于中档题.14.(2023春•高新区校级月考)一企业生产某种产品,通过加大技术创新投入降低了每件产品成本,为了调查年技术创新投入(单位:千万元)对每件产品成本(单位:元)的影响,对近10年的年技术创新投入,和每件产品成本,2,3,,的数据进行分析,得到如图散点图,并计算得:,,,,.(1)根据散点图可知,可用函数模型拟合与的关系,试建立关于的回归方程;(2)已知该产品的年销售额(单位:千万元)与每件产品成本的关系为.该企业的年投入成本除了年技术创新投入,还要投入其他成本10千万元,根据(1)的结果回答:当年技术创新投入出为何值时,年利润的预报值最大?(注:年利润年销售额年投入成本)参考公式:附:对于一组数据,,,,,,,其回归直线方程的斜率和截距的最小二乘法估计公式分别为:,.【分析】(1)令,可得出关于的线性回归方程为,利用最小二乘法可求出、的值,即可得出关于的回归方程;(2)由可得,可计算出年利润关于的函数关系式,结合二次函数的基本性质可求得的最小值及其对应的值.【解答】解:(1)令,则关于的线性回归方程为,由题意可得,,则,所以关于的回归方程为.(2)由可得,年利润,当且仅当,即时,年利润取得最大值,此时,所以当年技术创新投入为20千万元时,年利润的预报值取最大值.【点评】本题主要考查线性回归方程,考查运算求解能力,属于中档题.15.(2023春•海门市校级月考)某创业者计划在某旅游景区附近租赁一套农房发展成特色“农家乐”,为了确定未来发展方向,此创业者对该景区附近五家“农家乐”跟踪调查了100天,这五家“农家乐”的收费标准互不相同,得到的统计数据如表,为收费标准(单位:元日),为入住天数(单位:天),以频率作为各自的“入住率”,收费标准与“入住率”的散点图如图.1001502003004509065453020(1)令,由散点图判断与,哪个更合适于此模型(给出判断即可,不必说明理由)?并根据你的判断结果求回归方程;的结果精确到(2)根据第(1)问所求的回归方程,试估计收费标准为多少时,100天销售额最大?天销售额入住率收费标准参考数据:,,,,,【分析】(1)由散点图判断出更适合的回归方程,分别求和,求出回归方程;(2)写出100天销售额的表达式,再根据导数求出最大值,即可得出收费标准.【解答】解:(1)由散点图可知,散点并非均匀分布在一条直线的两侧,而是大致分布在一条曲线的两侧,不符合线性回归模型要求,更合适于此模型,,,,,回归方程:,(2)由题意得,,在中,,当时,解得:,当即时,函数单调递减,当即时,函数单调递增,函数在处取最大值,收费标准为150元天时,100天销售额最大.【点评】本题考查回归直线方程相关知识,属于中档题.16.(2023春•扬州期末)某电影平台为了解观众对某影片的感受,已知所有参评的观众中男、女之比为,现从中随机抽取120名男性和60名女性进行调查,抽取的男观众中有80人给了“点赞”的评价,女观众中有45人给了“一般”的评价.(1)把下面列联表补充完整,并判断是否有的把握认为对该影片的评价与性别有关?性别评价结果合计点赞一般男80女45合计180(2)用频率估计概率,在所有参评的观众中按“男”和“女”进行分层抽样,随机抽取6名参评观众.①若再从这6名参评观众中随机抽取1人进行访谈,求这名观众给出“点赞”评价的概率;②若再从这6名参评观众中随机抽取2人进行访谈,求在抽取的2人均给出“点赞”的条件下,这2人是1名男性和1名女性的概率.参考公式:,其中.参考数据:0.100.050.0250.0100.0050.0012.7063.8415.0246.6357.87910.828【分析】(1)由卡方的计算即可求解,(2)由分层抽样确定人数,即可由全概率公式以及贝叶斯公式进行求解.【解答】解:(1)填写列联表如下:性别评价结果合计点赞一般男8040120女154560合计9585180假设:对该影片的评价与性别无关,根据列联表中的数据可以求得,由于,且当成立时,,所以有的把握认为对该影片的评价与性别有关.(2)①由分层抽样知,随机抽取的6名参评观众中,男性有4人,女性有2人.根据频率估计概率知,男性观众给出“点赞”评价的概率为,给出“一般”评价的概率为;女性观众给出“点赞”评价的概率为,给出“一般”评价的概率为.从这6名参评观众中随机抽取1人进行访谈,记“这名学生给出“点赞”评价”为事件,“这名观众是男性观众”为事件,“这名观众是女性观众”为事件.则,所以(B).②从这6名参评观众中随机抽取2人进行访谈,记“抽取的2人均给出“点赞”的评价”为事件,“这两名观众均是男性”为事件,“这两名观众均是女性”为事件,“这两名观众是1名男性和1名女性”为事件.则,,所以(D),所以,即在抽取的2人均给出“点赞”的条件下,这2人是1名男性和1名女性的概率为.【点评】本题考查了独立性检验以及条件概率的应用,属于中档题.17.(2023春•淮安期末)某乡政府为提高当地农民收入,指导农民种植药材,取得较好的效果.以下是某农户近5年种植药材的平均收入的统计数据:年份20182019202020212022年份代码12345平均收入(千元)5961646873(1)根据表中数据,现有与两种模型可以拟合与之间的关系,请分别求出两种模型的回归方程;(结果保留一位小数)(2)统计学中常通过比较残差的平方和来比较两个模型的拟合效果,请根据残差平方和说明上述两个方程哪一个拟合效果更好,并据此预测2023年该农户种植药材的平均收入.参考数据及公式:,,其中.,.【分析】(1)根据最小二乘法结合条件可得回归方程;(2)根据回归方程分别计算残差平方和,进而可得拟合效果更好,然后根据回归方程结合条件即得.【解答】解:(1)根据农户近5年种植药材的平均收入情况的统计数据可得:,,所以,,则,.设,则,所以,则,,所以两种模型的回归方程分别为,.(2)回归方程为时,将值代入可得估计值分别为58,61.5,65,68.5,72,则残差平方和为.回归方程为时,将值代入可得估计值分别为59,60.8,63.8,68,73.4,则残差平方和为.因为,所以回归方程拟合效果更好,应选择该方程进行拟合.当时,,故预测2023年该农户种植药材的平均收入为80千元,即8万元.【点评】本题主要考查线性回归方程,考查运算求解能力,属于中档题.一.选择题(共2小题)1.(2024•天津)下列图中,相关性系数最大的是A. B. C. D.【分析】利用散点图,直接判断相关性系数的大小即可.【解答】解:由题意可知选项的散点图可知,相关关系强,越接近于1,相关程度越大;所以的相关性系数最大.故选:.【点评】本题考查散点图的应用,相关性系数的判断,是基础题.2.(2023•天津)鸢是鹰科的一种鸟,《诗经大雅旱麓》曰“鸢飞戾天,鱼跃于渊”.鸢尾花因花瓣形如鸢尾而得名(图,寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:,绘制对应散点图(图如下:计算得样本相关系数为0.8642,利用最小二乘法求得相应的经验回归方程为.根据以上信息,如下判断正确的为A.花萼长度和花瓣长度不存在相关关系 B.花萼长度和花瓣长度负相关 C.花萼长度为的该品种鸢尾花的花瓣长度的平均值约为 D.若选取其他品种鸢尾花进行抽样,所得花萼长度与花瓣长度的样本相关系数一定为0.8642【分析】根据散点图及线性相关的知识,即可求解.【解答】解:相关系数,且散点图呈左下角到右上角的带状分布,花瓣长度和花萼长度呈正相关,且相关性较强,,选项错误;当时,代入经验回归方程为,可得,花萼长度为的该品种鸢尾花的花瓣长度的平均值约为,选项正确;若选取其他品种鸢尾花进行抽样,所得花萼长度与花瓣长度的样本相关系数不一定是0.8642,选项错误.故选:.【点评】本题考查线性相关问题,属基础题.二.解答题(共5小题)3.(2024•甲卷)某工厂进行生产线智能化升级改造.升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:优级品合格品不合格品总计甲车间2624050乙车间70282100总计96522150(1)填写如下列联表:优级品非优级品甲车间乙车间能否有的把握认为甲、乙两车间产品的优级品率存在差异?能否有的把握认为甲、乙两车间产品的估级品率存在差异?(2)已知升级改造前该工厂产品的优级品率.设为升级改造后抽取的件产品的优级品率.如果,则认为该工厂产品的优级品率提高了.根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?附:,0.0500.0100.0013.8416.63510.828【分析】(1)根据题目所给的数据填写列联表,计算,对照题目中的表格,得出统计结论;(2)由题意求得,比较和,即可得出结论.【解答】解:(1)根据题目所给数据得到如下的列联表:优级品非优级品甲车间2624乙车间7030零假设:根据的独立性检验,认为甲、乙两车间产品的优级品率不存在差异,,有的把握认为甲、乙两车间产品的优级品率存在差异;零假设:根据的独立性检验,认为甲、乙两车间产品的优级品率不存在差异,,没有的把握认为甲、乙两车间产品的优级品率存在差异.(2)由题意得,,所以,故有优化提升.【点评】本题考查独立性检验的应用,也考查了计算能力的应用问题,是基础题.4.(2023•甲卷)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:.试验结果如下:对照组的小白鼠体重的增加量从小到大排序为15.218.820.221.322.523.225.826.527.530.132.634.334.835.635.635.836.237.340.543.2试验组的小白鼠体重的增加量从小到大排序为7.89.211.412.413.215.516.518.018.819.219.820.221.622.823.623.925.128.232.336.5(1)计算试验组的样本平均数;(2)(ⅰ)求40只小白鼠体重的增加量的中位数,再分别统计两样本中小于与不小于的数据的个数,完成如下列联表;对照组试验组(ⅱ)根据中的列联表,能否有的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?附:,0.1000.0500.0102.7063.8416.635【分析】(1)根据平均数的定义计算即可.(2)把两组数据合在一起,按从小到大排列后求中位数,填写列联表即可;根据列联表中数据计算,对照临界值得出结论.【解答】解:(1)根据题意,计算试验组样本平均数为.(2)由题意知,这40只小鼠体重的中位数是将两组数据合在一起,从小到大排列后第20位与第21位数据的平均数,因为原数据的第11位数据是18.8,后续依次为19.2,19.8,20.2,20.2,21.3,21.6,22.5,22.8,23.2,23.6,,所以第20位为23.2,第21位数据为23.6,所以这组数据的中位数是;填

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论