




已阅读5页,还剩9页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二讲统计与统计案例考情分析统计部分在选择、填空题中的命题热点有随机抽样、用样本估计总体以及变量的相关性,难度较低.年份卷别考查角度及命题位置2017卷样本的数字特征T2样本的数字特征的综合应用T19卷频率分布直方图与独立性检验T19卷折线图的应用T32016卷统计图表的应用T4回归分析及应用T182015卷回归分析及应用T19卷条形图、两变量间的相关性T3真题自检1(2017高考全国卷)为评估一种农作物的种植效果,选了n块地作试验田这n块地的亩产量(单位:kg)分别为x1,x2,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()Ax1,x2,xn的平均数Bx1,x2,xn的标准差Cx1,x2,xn的最大值Dx1,x2,xn的中位数解析:标准差能反映一组数据的稳定程度故选B.答案:B2(2017高考全国卷)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图,根据该折线图,下列结论错误的是()A月接待游客量逐月增加B年接待游客量逐年增加C各年的月接待游客量高峰期大致在7,8月D各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳解析:由折线图可知,各年的月接待游客量从8月份后存在下降趋势,故选A.答案:A3(2016高考全国卷)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图图中A点表示十月的平均最高气温约为15 ,B点表示四月的平均最低气温约为5 .下面叙述不正确的是()A各月的平均最低气温都在0 以上B七月的平均温差比一月的平均温差大C三月和十一月的平均最高气温基本相同D平均最高气温高于20 的月份有5个解析:由图形可得各月的平均最低气温都在0以上,A正确;七月的平均温差约为10,而一月的平均温差约为5,故B正确;三月和十一月的平均最高气温都在10左右,基本相同,C正确,故D错误答案:D4(2016高考全国卷)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量参考数据:yi9.32,tiyi40.17, 0.55,2.646.参考公式:相关系数r,回归方程t中斜率和截距的最小二乘估计公式分别为,.解析:(1)由折线图中的数据和附注中的参考数据得4, (ti)228, 0.55, (ti)(yi)tiyiyi40.1749.322.89,r0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当大,从而可以用线性回归模型拟合y与t的关系(2)由1.331及(1)得0.103.1.3310.10340.92.所以y关于t的回归方程为y0.10t0.92将2016对应的t9代入回归方程得0.920.1091.82.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨抽样方法方法结论三种抽样方法的共同点都是等概率抽样,即抽样过程中每个个体被抽到的概率相等,体现了这三种抽样方法的客观性和公平性若样本容量为n,总体的个体数为N,则用这三种方法抽样时,每个个体被抽到的概率都是.题组突破1(2017荆门调研)将参加数学竞赛决赛的500名学生编号为001,002,500,采用系统抽样的方法抽取一个容量为50的样本,且随机抽得的号码为003,这500名学生分别在三个考点考试,从001到200在第一考点,从201到355在第二考点,从356到500在第三考点,则第三考点被抽中的人数为()A14B15C16 D21解析:系统抽样的样本间隔为10,第一个号码为003,按照系统抽样的规则,抽到的号码依次为003,013,023,033,043,053,493,第三考点抽到的第一个号码为363,最后一个号码为493,由等差数列的通项公式得493363(n1)10,解得n14,故选A.答案:A2(2017云南二检)工厂生产的A、B、C三种不同型号的产品数量之比依次为235,为研究这三种产品的质量,现用分层抽样的方法从该工厂生产的A、B、C三种产品中抽出样本容量为n的样本,若样本中A型产品有16件,则n的值为_解析:由已知得n16,解得n80.答案:80误区警示利用系统抽样分段时,若分段间隔不为整数,应先随机剔除部分元素,再分组,但每个个体被抽到的概率仍为.此问题易忽视用样本估计总体方法结论1在频率分布直方图中,纵轴表示,数据落在各小组内的频率用各小矩形的面积表示,各小矩形的面积总和为1,因为在频率分布直方图中组距是一个固定值,所以各小矩形高的比也就是频率比2当样本数据较少时,用茎叶图表示数据效果较好,要分清何为茎,何为叶,并明确其特征数字的含义3特征数字(1)众数:在一组数据中,出现次数最多的数据叫作这组数据的众数在频率分布直方图中,众数的估计值是最高的矩形的中点的横坐标(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数在频率分布直方图中,把使左边和右边的直方图的面积相等的直线所对应的横坐标的估计值作为中位数的值(3)平均数:样本数据的算术平均数,即(x1x2xn)在频率分布直方图中,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和(4)方差:s2(x1)2(x2)2(xn)2,其中s为标准差方差与标准差都反映了样本数据的稳定与波动、集中与离散的程度s2越小,样本数据的稳定性越高,波动越小典例(1)如图所示,茎叶图记录了甲、乙两组各4名学生完成某道数学题的得分情况,该题满分为12分已知甲、乙两组学生的平均成绩相同,乙组某个数据的个位数字模糊,记为x.则下列命题正确的是()A甲组学生的成绩比乙组稳定B乙组学生的成绩比甲组稳定C两组学生的成绩有相同的稳定性D无法判断甲、乙两组学生的成绩的稳定性解析:甲(991111)10,乙(8910x12)10,解得x1.又s(910)2(910)2(1110)2(1110)21,s(810)2(910)2(1110)2(1210)2,ss,甲组学生的成绩比乙组稳定选A.答案:A(2)海尔公司的n名员工参加“我是销售家”活动,他们的年龄在25岁至50岁之间按年龄分组:第1组25,30),第2组30,35),第3组35,40),第4组40,45),第5组45,50,由统计的数据得到的频率分布直方图如图所示下表是年龄的频数分布表:区间25,30)30,35)35,40)40,45)45,50人数x100求实数n,x的值;现要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,则年龄在第1,2,3组中抽取的人数分别是多少?在的条件下,从这6人中随机抽取2人参加“我是销售家”的彩排活动,求恰有1人的年龄在第3组的概率解析:由频率分布直方图可知年龄在35,40)的频率为0.0850.4,又其人数为100,所以0.4,解得n250.所以x0.02525025.因为第1,2,3组共有2525100150(人),利用分层抽样在150人中抽取6人,则第1组抽取的人数为61,第2组抽取的人数为61,第3组抽取的人数为64,所以年龄在第1,2,3组中分别抽取的人数为1,1,4.由可设第1组的1人为A,第2组的1人为B,第3组的4人分别为C1,C2,C3,C4,则从这6人中抽取2人的所有情况为A,B,A,C1,A,C2,A,C3,A,C4,B,C1,B,C2,B,C3,B,C4,C1,C2,C1,C3,C1,C4,C2,C3,C2,C4,C3,C4,共有15种情况其中恰有1人的年龄在第3组的所有情况为A,C1,A,C2,A,C3,A,C4,B,C1,B,C2,B,C3,B,C4,共有8种情况所以恰有1人的年龄在第3组的概率为.类题通法1用样本估计总体充分体现了数形结合思想的运用,主要考查利用茎叶图或频率分布直方图来估计总体2利用频率分布直方图求众数、中位数与平均数的估计值利用频率分布直方图求众数、中位数和平均数时,易出错,应注意区分这三者,在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和演练冲关1空气质量指数(Air Quality Index,简称AQI)是定量描述空气质量状况的无量纲指数空气质量按照AQI大小分为六级:050为优;51100为良;101150为轻度污染;151200为中度污染;201300为重度污染;大于300为严重污染一环保人士记录去年某地某月10天的AQI的茎叶图如图利用该样本估计该地本月空气质量优良(AQI100)的天数(按这个月总共30天计算)为() A15B18C20D24解析:从茎叶图中可以发现该样本中空气质量优的天数为2,空气质量良的天数为4,故该样本中空气质量优良的频率为,估计该地本月空气质量优良的频率为,从而估计该地本月空气质量优良的天数为3018.选B.答案:B2(2017高考全国卷)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm)下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得 xi9.97,s 0.212, 18.439,(xi)(i8.5)2.78,其中xi为抽取的第i个零件的尺寸,i1,2,16.(1)求(xi,i)(i1,2,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小)(2)一天内抽检零件中,如果出现了尺寸在(3s,3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查从这一天抽检的结果看,是否需对当天的生产过程进行检查?在(3s,3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差(精确到0.01)附:样本(xi,yi)(i1,2,n)的相关系数r,0.09.解析:(1)由样本数据得(xi,i)(i1,2,16)的相关系数为r0.18.由于|r|0表示两个变量正相关,r0表示两个变量负相关;|r|1,且|r|越接近于1,线性相关程度越强,|r|越接近于0,线性相关程度越弱典例某家具厂对每日的原材料费支出与销售额之间的关系进行分析研究,12月1日5日的原材料费支出x(单位:万元)与销售额y(单位:万元)之间有如下数据:日期12月1日12月2日12月3日12月4日12月5日x(单位:万元)101113128y(单位:万元)2325302616该家具厂所确定的研究方案是:先从这5组数据中选取2组,用剩下的3组数据求线性回归方程,再用被选取的2组数据进行检验(1)求选取的2组数据恰好是不相邻2天的数据的概率;(2)若选取的是12月1日与12月5日的2组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程x,并判断该线性回归方程是否可靠(若由线性回归方程得到的估计数据与所选取的检验数据的误差不超过2万元,则认为得到的线性回归方程是可靠的)解析:(1)设选取的2组数据恰好是不相邻2天的数据为事件A,5组数据分别记为a,b,c,d,e,从5组数据中任选2组,总的基本事件有ab,ac,ad,ae,bc,bd,be,cd,ce,de,共10种,事件A包含的基本事件有ac,ad,ae,bd,be,ce,共6种,所以P(A).(2)12,27,xiyi112513301226977,x112132122434,271227303,所以y关于x的线性回归方程为2.5x3,当x10时,10325322;当x8时,8320317;|2322|12,|1716|12,经检验估计数据与所选取的检验数据的误差均不超过2万元,所以该线性回归方程可靠类题通法化归思想在回归分析的应用主要体现在以下两个方面(1)如果两个变量呈非线性相关关系,则可通过恰当的变换,将其转化成线性关系,再求线性回归方程(2)利用回归直线方程可以进行预测与估计,但要注意回归直线方程表明的是两组数据之间的相关关系,而不是函数关系,所以利用该方程求出的数值都是估计值,而不是一个确定的数值演练冲关1(2017豫东、豫北十所名校联考)根据如下样本数据:x34567y4.0a5.40.50.5b0.6得到的回归方程为bxa.若样本点的中心为(5,0.9),则当x每增加1个单位时,y就()A增加1.4个单位B减少1.4个单位C增加7.9个单位D减少7.9个单位解析:依题意得,0.9,故ab6.5;又样本点的中心为(5,0.9),故0.95ba,联立,解得b1.4,a7.9,则1.4x7.9,可知当x每增加1个单位时,y就减少1.4个单位答案:B2某火锅店为了了解气温对营业额的影响,随机记录了该店1月份其中5天的日营业额y(单位:万元)与该地当日最低气温x(单位:)的数据,如下表:x258911y1.210.80.80.7(1)求y关于x的回归方程x;(2)判断y与x之间是正相关还是负相关,若该地1月份某天的最低气温为6,用所求回归方程预测该店当日的营业额附:回归方程x中,.解析:(1)(258911)7,(1.210.80.80.7)0.9.x4256481121295,xiyi2.456.47.27.728.7,0.056,0.9(0.056)71.292.回归方程为0.056x1.292.(2)0.0560,y与x之间是负相关当x6时,0.05661.2920.956.该店当日的营业额约为9 560元典例(2017贵阳模拟)2016年3月31日贵州省第十二届人民代表大会常务委员会第二十一次会议通过的贵州省人口与计划生育条例修正案全面开放二孩政策为了解人们对于贵州省新颁布的“生育二孩放开”政策的热度,现在某市进行调查,对5,65岁的人群随机抽取了n人,得到如下统计表和各年龄段抽取人数的频率分布直方图:分组支持“生育二孩放开” 政策的人数占本组的频率5,15)40.815,25)5p25,35)120.835,45)80.845,55)20.455,6510.2(1)求n,p的值;(2)根据以上统计数据填下面22列联表,并根据列联表的独立性检验,判断能否有99%的把握认为以45岁为分界点的不同人群对“生育二孩放开”政策的支持度有关系?年龄不低于45岁的人数年龄低于45岁的人数合计支持不支持合计参考数据:P(K2k)0.0500.0100.001k3.8416.63510.828K2,nabcd解析:(1)从5,15)岁这一年龄段中抽取的人数为5,频率为0.010100.1,n50.由题可知,第二组的频率为0.2,第二组的人数为500.210,则p0.5.(2)22列联表如下:年龄不低于45岁的人数年龄低于4岁的人数5合计支持32932不支持71118合计104050K26.276.635,没有99%的把握认为以45岁为分界点的不同人群对“生育二孩放开”政策的支持度有关系类题通法求解独立性检验应用交汇问题的模型(1)读懂列联表:明确列联表中的数据(2)计算K2:根据提供的公式计算K2值(3)作出判断:依据临界值与犯错误的概率得出结论(4)计算随机变量的分布列、期望:利用给定数据分析变量取值,计算概率,得分布列后求期望演练冲关1(2017石家庄模拟)为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到22列联表:理科文科总计男131023女7202
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 第12课 战后科学技术革命说课稿-2025-2026学年高中历史华东师大版上海第六分册-华东师大版上海2007
- 西安科大版·2017教学设计-2025-2026学年中职中职专业课统计类73 财经商贸大类
- 第一单元 主题案例二 学习家庭园艺技巧-高中劳动与综合实践单元教学设计
- 2024年七年级生物下册 4.7.1 分析人类活动对生态环境的影响说课稿 (新版)新人教版
- 曲靖市中小学生科技素养科学课程 第10课.《螺旋桨飞机》教学设计
- 2025年中考化学试题分类汇编:常见的酸和碱(第1期)解析版
- 2025年城市绿化考试题库及答案
- 22.2.5 一元二次方程根与系数的关系 说课稿+说课稿 2024-2025学年华东师大版九年级数学上册
- 22.1 一元二次方程说课稿2024-2025学年华东师大版数学九年级上册
- 2025年全国中级养老护理员职业技能A证考试题库(含答案)
- 室外栏杆底座施工方案
- 《人力资源管理》全套教学课件
- 人教版六年级数学上册教案全册
- 新人教版一年级数学上册全册教学课件(2024年秋季新教材)
- 老年高血压指南解读
- 基础烫发知识课件
- 纯电动汽车制动能量回收控制策略研究及仿真分析
- 化工公司bluesign认证资料准备清单20201201
- 骨科患者的疼痛管理
- 【公司财务风险管理问题分析国内外文献综述3000字】
- 仁爱版英语九年级(上)全册课文翻译(互译版)
评论
0/150
提交评论