(课标Ⅰ卷)2020届高考数学一轮复习第十二章概率与统计12.4统计与统计案例课件.pptx_第1页
(课标Ⅰ卷)2020届高考数学一轮复习第十二章概率与统计12.4统计与统计案例课件.pptx_第2页
(课标Ⅰ卷)2020届高考数学一轮复习第十二章概率与统计12.4统计与统计案例课件.pptx_第3页
(课标Ⅰ卷)2020届高考数学一轮复习第十二章概率与统计12.4统计与统计案例课件.pptx_第4页
(课标Ⅰ卷)2020届高考数学一轮复习第十二章概率与统计12.4统计与统计案例课件.pptx_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

12.4 统计与统计案例,高考理数 (课标专用),考点一 抽样方法与总体分布的估计,五年高考,A组 统一命题课标卷题组,1.(2019课标,3,5分)西游记三国演义水浒传和红楼梦是中国古典文学瑰 宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了 100位学生,其中阅读过西游记或红楼梦的学生共有90位,阅读过红楼梦的学生共 有80位,阅读过西游记且阅读过红楼梦的学生共有60位,则该校阅读过西游记的 学生人数与该校学生总数比值的估计值为 ( ) A.0.5 B.0.6 C.0.7 D.0.8,答案 C 本题主要考查用样本估计总体;考查学生对实际问题的处理能力和数据分析能力; 考查了数据分析的核心素养. 在样本中,仅阅读过西游记的学生人数为90-80=10,又由既阅读过西游记又阅读过 红楼梦的学生人数为60,得阅读过西游记的学生人数为10+60=70,所以在样本中,阅 读过西游记的学生人数所占的比例为 =0.7,即为该校阅读过西游记的学生人数与 该校学生总数比值的估计值. 解题关键 在样本中,由阅读过西游记或阅读过红楼梦的学生人数为90,阅读过红 楼梦的学生有80位,可得仅阅读过西游记的学生有10位是解决本题的关键.,2.(2019课标,5,5分)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩 时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评 分相比,不变的数字特征是 ( ) A.中位数 B.平均数 C.方差 D.极差,答案 A 本题考查样本数字特征的基本概念;以演讲比赛的评分为背景考查学生的数据处 理能力;充分考查了数据分析的核心素养. 根据中位数特征可知,去掉最高分和最低分后,只有中位数一定不会变化.故选A. 易错警示 学生对中位数、平均数、方差、极差的概念理解不清,从而导致出错.,3.(2018课标,3,5分)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为 更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入 构成比例,得到如下饼图:,则下面结论中不正确的是 ( ) A.新农村建设后,种植收入减少 B.新农村建设后,其他收入增加了一倍以上 C.新农村建设后,养殖收入增加了一倍 D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半,答案 A 本题主要考查统计图. 设建设前经济收入为a,则建设后经济收入为2a,由题图可知:,根据上表可知B、C、D结论均正确,结论A不正确,故选A.,4.(2017课标,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了 2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图. 根据该折线图,下列结论错误的是 ( ) A.月接待游客量逐月增加 B.年接待游客量逐年增加 C.各年的月接待游客量高峰期大致在7,8月 D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳,答案 A 本题考查统计,数据分析. 观察2014年的折线图,发现从8月至9月,以及10月开始的三个月接待游客量都是减少的,故A选 项中的结论是错误的.,5.(2015课标,3,5分)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱 形图,以下结论中不正确的是( ) A.逐年比较,2008年减少二氧化硫排放量的效果最显著 B.2007年我国治理二氧化硫排放显现成效 C.2006年以来我国二氧化硫年排放量呈减少趋势 D.2006年以来我国二氧化硫年排放量与年份正相关,答案 D 由柱形图可知:A、B、C中的结论均正确,2006年以来我国二氧化硫年排放量呈减 少趋势,所以排放量与年份负相关,D中的结论不正确. 方法指导 从柱形图中获取信息,结合选项来判断.,6.(2019课标,17,12分)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200 只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液. 每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留 在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:,记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70. (1)求乙离子残留百分比直方图中a,b的值; (2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).,解析 本题主要考查频率分布直方图的含义,以及用频率分布直方图估计样本的数字特征,通 过实际问题的应用考查学生的运算求解能力,考查了数学运算的核心素养,体现了应用意识. (1)由已知得0.70=a+0.20+0.15,故a=0.35. b=1-0.05-0.15-0.70=0.10. (2)甲离子残留百分比的平均值的估计值为 20.15+30.20+40.30+50.20+60.10+70.05=4.05. 乙离子残留百分比的平均值的估计值为 30.05+40.10+50.15+60.35+70.20+80.15=6.00. 方法总结 由频率分布直方图估计样本的数字特征: (xi表示第i个小矩形底边中点的横坐标,Si表示第i个小矩形的面积) 平均数 =x1S1+x2S2+xiSi+xnSn; 方差s2=(x1- )2S1+(x2- )2S2+(xn- )2Sn; 中位数:从左到右(或从右到左)小矩形面积之和等于0.5时的横坐标; 众数:最高小矩形底边中点的横坐标.,7.(2015课标,18,12分)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20 个用户,得到用户对产品的满意度评分如下: A地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89 B地区: 73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79 (1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分 的平均值及分散程度(不要求计算出具体值,给出结论即可);,(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:,记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”.假设两地区用户的评价 结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.,解析 (1)两地区用户满意度评分的茎叶图如下:,通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A 地区用户满意度评分比较集中,B地区用户满意度评分比较分散. (2)记CA1表示事件:“A地区用户的满意度等级为满意或非常满意”; CA2表示事件:“A地区用户的满意度等级为非常满意”; CB1表示事件:“B地区用户的满意度等级为不满意”; CB2表示事件:“B地区用户的满意度等级为满意”,则CA1与CB1独立,CA2与CB2独立,CB1与CB2互斥,C=CB1CA1CB2CA2. P(C)=P(CB1CA1CB2CA2) =P(CB1CA1)+P(CB2CA2) =P(CB1)P(CA1)+P(CB2)P(CA2). 由所给数据得CA1,CA2,CB1,CB2发生的频率分别为 , , , ,故P(CA1)= ,P(CA2)= ,P(CB1)= ,P(CB2)= ,P(C)= + =0.48. 思路分析 (1)将A、B地区数据逐一填入茎叶图,然后通过茎叶图进行比较.(2)设出事件且指 明事件间的关系,利用相应概率公式得结论.,考点二 变量间的相关关系、统计案例 1.(2018课标,18,12分)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折 线图. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.,解析 (1)利用模型,该地区2018年的环境基础设施投资额的预测值为 =-30.4+13.519= 226.1(亿元). 利用模型,该地区2018年的环境基础设施投资额的预测值为 =99+17.59=256.5(亿元). (2)利用模型得到的预测值更可靠. 理由如下: (i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上 下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资 额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据 对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性 增长趋势,利用2010年至2016年的数据建立的线性模型 =99+17.5t可以较好地描述2010年以 后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠. (ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1 亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预 测值更可靠.,以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分. 方法总结 利用直线方程进行预测是对总体的估计,此估计值不是准确值;利用回归方程进行 预测(把自变量值代入回归直线方程)是对因变量的估计,此时,需要注意自变量的取值范围.,2.(2018课标,18,12分)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务 的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组 20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的 工作时间(单位:min)绘制了如下茎叶图: (1)根据茎叶图判断哪种生产方式的效率更高,并说明理由; (2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过 m的工人数填入下面的列联表:,(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K2= , .,解析 本题考查统计图表的含义及应用、独立性检验的基本思想及其应用. (1)第二种生产方式的效率更高. 理由如下: (i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分 钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种 生产方式的效率更高. (ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第 二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效 率更高. (iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二 种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高. (iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于 茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关 于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故,可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所 需的时间更少.因此第二种生产方式的效率更高. 以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分. (2)由茎叶图知m= =80. 列联表如下:,(3)由于 K2= =106.635,所以有99%的把握认为两种生产方式的效率有差异. 思路分析 (1)根据茎叶图中的数据大致集中在哪个茎,作出判断; (2)通过茎叶图确定数据的中位数,按要求完成22列联表; (3)根据(2)中的列联表,将有关数据代入公式计算得K2的值,查表作出统计推断. 易错警示 数据分析容易出错. (1)审清题意:弄清题意,理顺条件和结论; (2)找数量关系:把图形语言转化为数字,找关键数量关系; (3)建立解决方案:找准公式,将22列联表中的数值代入公式计算; (4)作出结论:依据数据,查表作出正确判断. 解后反思 独立性检验问题的常见类型及解题策略 (1)已知分类变量的数据,判断两个分类变量的相关性,可依据数据及公式计算K2,然后作出判 断; (2)独立性检验与概率统计的综合问题,关键是根据独立性检验的一般步骤作出判断,再根据概 率统计的相关知识求解.,3.(2017课标,18,12分)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时 各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:,(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法 的箱产量不低于50 kg”,估计A的概率; (2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;,(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01). 附: , K2= .,解析 本题考查了频率分布直方图,独立性检验. (1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”. 由题意知P(A)=P(BC)=P(B)P(C). 旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)5=0.62, 故P(B)的估计值为0.62. 新养殖法的箱产量不低于50 kg的频率为(0.068+0.046+0.010+0.008)5=0.66, 故P(C)的估计值为0.66. 因此,事件A的概率估计值为0.620.66=0.409 2. (2)根据箱产量的频率分布直方图得列联表,K2= 15.705. 由于15.7056.635,故有99%的把握认为箱产量与养殖方法有关. (3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg的直方图面积为(0.004+0.020+ 0.044)5=0.340.5, 故新养殖法箱产量的中位数的估计值为50+ 52.35(kg). 解后反思 解独立性检验问题的关注点: (1)两个明确:明确两类主体;明确研究的两个问题. (2)两个关键:准确画出22列联表;准确理解K2.,4.(2015课标,19,12分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单 位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi (i=1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值.,(1)根据散点图判断,y=a+bx与y=c+d 哪一个适宜作为年销售量y关于年宣传费x的回归方程 类型?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立y关于x的回归方程; (3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题: (i)年宣传费x=49时,年销售量及年利润的预报值是多少? (ii)年宣传费x为何值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线v=+u的斜率和截距的最小二乘估计分别 为 = , = - .,解析 (1)由散点图可以判断,y=c+d 适宜作为年销售量y关于年宣传费x的回归方程类型. (2分) (2)令w= ,先建立y关于w的线性回归方程.由于 = = =68, = - =563-686.8=100.6, 所以y关于w的线性回归方程为 =100.6+68w,因此y关于x的回归方程为 =100.6+68 . (6 分) (3)(i)由(2)知,当x=49时,年销售量y的预报值 =100.6+68 =576.6, 年利润z的预报值 =576.60.2-49=66.32. (9分) (ii)根据(2)的结果知,年利润z的预报值 =0.2(100.6+68 )-x=-x+13.6 +20.12. 所以当 = =6.8,即x=46.24时, 取得最大值. 故年宣传费为46.24千元时,年利润的预报值最大. (12分) 思路分析 (1)根据散点图中点的分布趋势进行判断.(2)先设中间量w= ,建立y关于w的线性 回归方程,进而得y关于x的回归方程.(3)(i)将x=49代入回归方程求出y的预报值,进而得z的预报 值,(ii)求出z关于x的回归方程,进而利用函数方法求最大值.,B组 自主命题省(区、市)卷题组 考点一 抽样方法与总体分布的估计 1.(2015湖北,2,5分)我国古代数学名著数书九章有“米谷粒分”题:粮仓开仓收粮,有人送 来米1 534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为 ( ) A.134石 B.169石 C.338石 D.1 365石,答案 B 1 534169,这批米内夹谷约为169石.,2.(2018江苏,3,5分)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打 出的分数的平均数为 .,答案 90,解析 本题考查茎叶图、平均数. 5位裁判打出的分数分别为89,89,90,91,91, 则这5位裁判打出的分数的平均数为 (89+89+90+91+91)=90. 方法总结 要明确“茎”处数字是十位数字,“叶”处数字是个位数字,正确写出所有数据,再 根据平均数的概念进行计算.,3.(2017江苏,3,5分)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300, 100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应 从丙种型号的产品中抽取 件.,答案 18,解析 本题考查分层抽样方法及用样本估计总体. 从丙种型号的产品中抽取的件数为60 =18.,4.(2015广东,17,12分)某工厂36名工人的年龄数据如下表.,(1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年 龄数据为44,列出样本的年龄数据; (2)计算(1)中样本的均值 和方差s2;,(3)36名工人中年龄在 -s与 +s之间有多少人?所占的百分比是多少(精确到0.01%)?,解析 (1)由系统抽样,将36名工人分为9组(4人一组),每组抽取一名工人. 因为在第一分段里抽到的是年龄为44的工人,即编号为2的工人,故所抽样本的年龄数据为44, 40,36,43,36,37,44,43,37. (2)均值 = =40; 方差s2= (44-40)2+(40-40)2+(36-40)2+(43-40)2+(36-40)2+(37-40)2+(44-40)2+(43-40)2+(37-40)2= . (3)由(2)可知s= .由题意知,年龄在 内的工人共有23人,所占的百分比为 10 0%63.89%.,考点二 变量间的相关关系、统计案例 1.(2017山东,5,5分)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班 随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线 方程为 = x+ .已知 xi=225, yi=1 600, =4.该班某学生的脚长为24,据此估计其身高为 ( ) A.160 B.163 C.166 D.170,答案 C 本题主要考查回归直线方程. 由题意可知 =22.5, =160, 160=422.5+ ,解得 =70, =4x+70, x=24时, =424+70=166.故选C.,2.(2015福建,4,5分)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家 庭,得到如下统计数据表:,根据上表可得回归直线方程 = x+ ,其中 =0.76, = - . 据此估计,该社区一户年收入为15万元家庭的年支出为 ( ) A.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元,答案 B 由统计数据表可得 = =10.0, = =8.0, 则 =8.0-0.7610.0=0.4,所以回归直线方程为 =0.76x+0.4,当x=15时, =0.7615+0.4=11.8,故 估计年收入为15万元家庭的年支出为11.8万元.故选B.,C组 教师专用题组 考点一 抽样方法与总体分布的估计,1.(2013课标,3,5分)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部 分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差 异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是 ( ) A.简单随机抽样 B.按性别分层抽样 C.按学段分层抽样 D.系统抽样,答案 C 该地区不同学段学生视力情况有较大差异,不适合采用简单随机抽样和系统抽样, 又男、女生视力差别不大,故不适合按性别分层抽样. 解题关键 掌握不同抽样方法的适用情况是解题的关键.,2.(2016四川,16,12分)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调 整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过 x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年 100位居民每人的月均用水量(单位:吨),将数据按照0,0.5),0.5,1),4,4.5分成9组,制成了如图 所示的频率分布直方图. (1)求直方图中a的值; (2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.,解析 (1)由频率分布直方图知,月均用水量在0,0.5)中的频率为0.080.5=0.04, 同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02. 由0.04+0.08+0.5a+0.20+0.26+0.5a+0.06+0.04+0.02=1, 解得a=0.30. (2)由(1)知,100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12. 由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000 0.12=36 000. (3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.880.85, 而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.730.85,所以2.5x3. 由0.3(x-2.5)=0.85-0.73,解得x=2.9. 所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.,3.(2011课标,19,12分)某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且 质量指标值大于或等于102的产品为优质品.现用两种新配方(分别称为A配方和B配方)做试 验,各生产了100件这种产品,并测量了每件产品的质量指标值,得到下面试验结果: A配方的频数分布表,B配方的频数分布表,(1)分别估计用A配方,B配方生产的产品的优质品率; (2)已知用B配方生产的一件产品的利润y(单位:元)与其质量指标值t的关系式为y= 从用B配方生产的产品中任取一件,其利润记为X(单位:元),求X的分布列及数 学期望.(以试验结果中质量指标值落入各组的频率作为一件产品的质量指标值落入相应组的 概率),解析 (1)由试验结果知,用A配方生产的产品中优质品的频率为 =0.3,所以用A配方生产 的产品的优质品率的估计值为0.3. 由试验结果知,用B配方生产的产品中优质品的频率为 =0.42,所以用B配方生产的产品 的优质品率的估计值为0.42. (2)用B配方生产的100件产品中,其质量指标值落入区间90,94),94,102),102,110的频率分别 为0.04,0.54,0.42,因此P(X=-2)=0.04,P(X=2)=0.54,P(X=4)=0.42, 即X的分布列为,X的数学期望EX=-20.04+20.54+40.42=2.68. 失分警示 列分布列时各利润值对应的概率由于粗心而出现对应或计算错误. 评析 本题考查频率分布表及随机变量的分布列和数学期望,属于容易题.,考点二 变量间的相关关系、统计案例 (2014课标,19,12分)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据 如下表:,(1)求y关于t的线性回归方程; (2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况, 并预测该地区2015年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为: = , = - .,解析 (1)由所给数据计算得 = (1+2+3+4+5+6+7)=4, = (2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3, (ti- )2=9+4+1+0+1+4+9=28, (ti- )(yi- )=(-3)(-1.4)+(-2)(-1)+(-1)(-0.7)+00.1+10.5+20.9+31.6=14, = = =0.5, = - =4.3-0.54=2.3, 所求回归方程为 =0.5t+2.3. (2)由(1)知, =0.50,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增 加0.5千元. 将2015年的年份代号t=9代入(1)中的回归方程,得 =0.59+2.3=6.8, 故预测该地区2015年农村居民家庭人均纯收入为6.8千元.,易错警示 解题时容易出现计算错误,计算时一定要仔细.,考点一 抽样方法与总体分布的估计 1.(2018安徽淮北模拟,7)某单位员工按年龄分为A,B,C三组,其人数之比为541,现用分层抽 样的方法从总体中抽取一个容量为20的样本,已知C组中甲、乙二人均被抽到的概率是 ,则 该单位员工总数为 ( ) A.110 B.100 C.900 D.800,三年模拟,A组 20172019年高考模拟考点基础题组,答案 B 员工按年龄分为A,B,C三组,其人数之比为541,从中抽取一个容量为20的 样本,则抽取的C组人数为 20= 20=2,设C组员工总数为m,则甲、乙二人均被抽到的 概率为 = = ,即m(m-1)=90,解得m=10.设员工总数为x,则由 = = ,可得x= 100,故选B.,2.(2019江西吉安一模,4)总体由编号为00,01,02,48,49的50个个体组成,利用下面的随机数表 选取6个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个 数字,则选出的第3个个体的编号为 ( ) 附:第6行至第9行的随机数表如下: 2635 7900 3370 9160 1620 3882 7757 4950 3211 4919 7306 4916 7677 8733 9974 6732 2748 6198 7164 4148 7086 2888 8519 1620 7477 0111 1630 2404 2979 7991 9683 5125 A.3 B.16 C.38 D.20,答案 D 按随机数表法,从随机数表第6行的第9列和第10列数字开始从左到右依次选取两 个数字,超出0049及重复的不选,则编号依次为33,16,20,38,49,32,则选出的第3个个体的编 号为20,故选D.,3.(2019湖南郴州二模,5)已知我市某居民小区户主人数和户主对户型结构的满意率分别如图1 和图2所示,为了解该小区户主对户型结构的满意程度,用分层抽样的方法抽取30%的户主进 行调查,则样本容量和抽取的户主对四居室满意的人数分别为 ( ) A.240,18 B.200,20 C.240,20 D.200,18,答案 A 样本容量n=(250+150+400)30%=240,抽取的户主对四居室满意的人数为15030% 40%=18.故选A.,4.(2019江西上饶二模,4)某学校为响应“平安出行号召”,拟从2 019名学生中选取50名学生加 入“交通志愿者”,若采用以下方法选取:先用简单随机抽样方法剔除19名学生,剩下的2 000 名再按照系统抽样的方法抽取,则每名学生入选的概率 ( ) A.不全相等 B.均不相等 C.都相等,且为 D.都相等,且为,答案 D 先用简单随机抽样方法剔除19名学生,剩下的2 000名再按照系统抽样的方法抽取, 则每名学生入选的概率相等,且为P= .故选D.,5.(2019河南新乡模拟,4)某机构对青年观众是否喜欢跨年晚会进行了调查,人数如下表所示:,现要在所有参与调查的人中用分层抽样的方法抽取n人做进一步的调研,若在“不喜欢”的男 性青年观众中抽取了6人,则n= ( ) A.12 B.16 C.24 D.32,答案 C 由分层抽样的性质得 = ,解得n=24.故选C.,6.(2019安徽合肥二模,5)下表是某电器销售公司2018年度各类电器营业收入占比和净利润占 比统计表:,则下列判断中不正确的是 ( ) A.该公司2018年度冰箱类电器销售亏损 B.该公司2018年度小家电类电器营业收入和净利润相同 C.该公司2018年度净利润主要由空调类电器销售提供 D.剔除冰箱类电器销售数据后,该公司2018年度空调类电器销售净利润占比将会降低,答案 B 对于选项A,由统计表知冰箱类净利润占比为-0.48%,所以冰箱类电器销售亏损,所 以A中判断正确; 对于选项B,由统计表知,小家电类电器营业收入占比和净利润占比均为3.82%,但在总的营业 收入和总的净利润未知的情况下,无法得到营业收入和净利润相同,所以选项B中判断不正确; 对于选项C,由统计表知,空调类的净利润占比为95.80%,所以该电器销售公司的净利润主要由 空调类电器销售提供,所以选项C中判断正确; 对于选项D,剔除冰箱类销售数据后,总的净利润增加了,而空调类销售总利润没变,所以空调类 电器销售净利润占比将会降低,选项D中判断正确. 故选B.,7.(2018安徽淮北一模,19)为了解某知名品牌两个不同型号手机M9,M10的待机时间(单位:小 时),淮北某手机卖场从仓库中随机抽取M9,M10两种型号的手机各6台,在相同的条件下进行 测试,统计结果如图: (1)根据茎叶图计算M9,M10两种型号手机的平均待机时间; (2)根据茎叶图判断M9,M10两种型号被测试手机待机时间方差的大小,并说明理由; (3)从待机时间在75小时以上的6台被测试手机中随机抽取2台,求至少有一台手机是M9的概率.,解析 (1)根据茎叶图中的数据,计算M9型号手机的平均待机时间为 = (56+69+65+70+76 +84)=70(小时), M10型号手机的平均待机时间为 = (79+72+70+80+81+80)=77(小时). (2)M9手机待机时间方差大于M10手机待机时间方差. 理由:M9的数据分布比较分散,波动较大;M10的数据分布比较集中,波动较小. (3)记M9待机时间在75小时以上的被测手机为A1,A2, M10待机时间在75小时以上的被测手机为B1,B2,B3,B4, 从6台被测手机中任取2台有 =15种取法,其中不符合题意的取法有(B1,B2),(B1,B3),(B1,B4),(B2,B 3),(B2,B4),(B3,B4),共6种, 所以所求的概率P= = .,1.(2018广东肇庆二模,5)已知x与y之间的一组数据:,若y关于x的线性回归方程为 = x+ ,则 的值为 ( ) A.1.25 B.-1.25 C.1.65 D.-1.65,考点二 变量间的相关关系、统计案例,答案 D 由表中数据得 =2.5, =4, =12+22+32+42=30, xiyi=51.3, = = =2.26, = - =4-2.262.5=-1.65,故选D.,2.(2019河南濮阳一模)根据下表中的数据,得到的回归方程为 = x+9,则 = ( ),A.2 B.1 C.0 D.-1,答案 D 由题意可得 = (4+5+6+7+8)=6, = (5+4+3+2+1)=3,回归方程为 = x+9且 回归直线过点(6,3),3=6 +9,解得 =-1,故选D.,3.(2019广东深圳一模,6)已知某产品的销售额y(万元)与广告费用x(万元)之间的关系如表:,若求得其线性回归方程为 =6.5x+ ,则预计当广告费用为6万元时的销售额为 ( ) A.42万元 B.45万元 C.48万元 D.51万元,答案 C = =2, = =22, =6.5x+ , =22-6.52=9.则 = 6.5x+9,令x=6,得 =6.56+9=48.故选C.,4.(2017豫南九校2月联考,13)已知下表所示数据的回归直线方程为 =4x+242,则实数a= .,答案 262,解析 回归直线 =4x+242必过样本点的中心( , ),而 = =4, = = , =44+242,解得a=262.,5.(2019安徽马鞍山二模,19)某班的健康调查小组从所在学校共选取15名男同学,其年龄、身 高和体重数据如下表所示(本题中身高单位:cm,体重单位:kg).,(1)如果某同学“身高-体重100”,则认为该同学超重,从上述15名同学中任选两名同学,其中 超重的同学人数为X,求X的分布列和数学期望; (2)根据表中数据,设计了两种方案预测学生身高.方案:建立平均体重与年龄的线性回归模 型,表中各年龄的体重按三名同学的平均体重计算,数据整理如表.,方案:建立平均体重与平均身高的线性回归模型,将所有数据按身高重新分成6组:153,158), 158,163),163,168),168,173),173,178),178,183,并将每组的平均身高依次折算为155,160, 165,170,175,180,各组的体重按平均体重计算,数据整理如表.,(i)用方案预测20岁男同学的平均体重和用方案预测身高168 cm的男同学的平均体重,你 认为哪个更合理?请给出理由; (ii)请根据方案建立平均体重y与平均身高x的线性回归方程y= x+ (数据精确到0.001). 附: = .,解析 (1)根据表中数据,15人中,有4人超重,故随机变量X的所有可能取值为0,1,2, P(X=0)= = ,P(X=1)= = ,P(X=2)= = = . 所以X的分布列为,所以E(X)=1 +2 = = . (2)(i)对比两种方案,用方案预测身高168 cm的男同学的平均体重更合理. 因为身高和体重的相关关系强于年龄与体重的相关关系. (ii) = 1.291, 又因为( , )在回归直线上, 所以 = - = -1.291 -150.909. 故平均体重y与平均身高x的线性回归方程为 =1.291x-150.909.,6.(2019河南洛阳二模,19)某共享单车经营企业欲向甲市投放单车,为制订适宜的经营策略,该 企业首先在已投放单车的乙市进行单车使用情况调查.调查过程分随机问卷调查、整理分析 及开座谈会三个阶段.在随机问卷调查阶段,A,B两个调查小组分赴全市不同区域发放问卷并 及时收回,在整理分析阶段,两个调查小组从所获取的有效问卷中,针对15至45岁的人群,按比 例随机抽取了300份,进行了数据统计,具体情况如表:,(1)先用分层抽样的方法从上述300人中按“年龄是否达到35岁”抽出一个容量为60的样本, 再用分层抽样的方法将“年龄达到35岁”的被抽个体数分配到“经常使用单车”和“偶尔 使用单车”中去. 求这60人中“年龄达到35岁且偶尔使用单车”的人数; 为听取对发展共享单车的建议,调查组专门组织所抽取的“年龄达到35岁且偶尔使用单 车”的人员召开座谈会,会后共有3份礼品赠送给其中3人,每人1份(其余人员仅赠送骑行优惠 券).已知参加座谈会的人员中有且只有4人来自A组,求A组这4人中得到礼品的人数X的分布列 和数学期望; (2)从统计数据可直观得出“是否经常使用共享单车与年龄(记作m岁)有关”的结论.在用独立 性检验的方法说明该结论成立时,为使犯错误的概率尽可能小,年龄m应取25还是35?请通过比 较K2的观测值的大小加以说明. 参考公式:K2= ,其中n=a+b+c+d.,解析 (1)由分层抽样性质得从300人中抽取60人,其中“年龄达到35岁”的人数为100 =20, “年龄达到35岁”中偶尔使用单车的人数为20 =9. A组这4人中得到礼品的人数X的可能取值为0,1,2,3, P(X=0)= = ,P(X=1)= = ,P(X=2)= = ,P(X=3)= = , X的分布列为,E(X)=0 +1 +2 +3 = . (2)m=35时,按“年龄是否达到35岁”对数据进行整理,得到如下列联表:,K2的观测值k1= = . m=25时,按“年龄是否达到25岁”对数据进行整理,得到如下列联表:,K2的观测值k2= = ,因为k2k1, 所以欲使犯错误的概率尽量小,需取m=25.,1.(2018湖北孝感二模,5)某校高三年级10个班参加合唱比赛得分的茎叶图如图所示,若这组数 据的平均数是20,则 + 的最小值为 ( ),A.1 B. C.2 D.,B组 20172019年高考模拟专题综合题组 时间:30分钟 分值:40分 一、选择题(每题5分,共10分),答案 C 根据茎叶图知,这组数据的平均数是 12+13+15+19+17+23+(20+a)+25+28+(20+ b)=20,a+b=8, + = (a+b)= 10+2 =2,当且仅当b=3a =6时取“=”, + 的最小值为2.故选C. 思路分析 根据题中所给数据的平均数得出a+b=8,再利用基本不等式求出 + 的最小值. 评析 本题考查了平均数与基本不等式的应用问题,是基础题.,2.(2019广东中山二模,5)调查机构对某高科技行业进行调查统计,得到该行业从业者学历分布 饼状图、从事该行业岗位分布条形图,如图所示. 给出下列三种说法:该高科技行业从业人员中学历为博士的占一半以上,该高科技行业中 从事技术岗位的人数超过总人数的30%,该高科技行业中从事运营岗位的人员主要是本科 生.其中正确的个数为 ( ) A.0个 B.1个 C.2个 D.3个,答案 C 在中,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论