优化方案高中数学 第二章 统计 2.2.1用样本的频率分布估计总体分布学案 新人教A版必修3.doc_第1页
优化方案高中数学 第二章 统计 2.2.1用样本的频率分布估计总体分布学案 新人教A版必修3.doc_第2页
优化方案高中数学 第二章 统计 2.2.1用样本的频率分布估计总体分布学案 新人教A版必修3.doc_第3页
优化方案高中数学 第二章 统计 2.2.1用样本的频率分布估计总体分布学案 新人教A版必修3.doc_第4页
优化方案高中数学 第二章 统计 2.2.1用样本的频率分布估计总体分布学案 新人教A版必修3.doc_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

22用样本估计总体22.1用样本的频率分布估计总体分布1问题导航(1)画频率分布直方图有哪些步骤?频率分布直方图的特征是什么?(2)什么是频率分布折线图?(3)什么是总体密度曲线?(4)画茎叶图的步骤有哪些?茎叶图有什么特征?2例题导读对“p68探究”内容的导读:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断对“p68思考”内容的导读:由于约有88%的居民月均用水量都在3吨以下,因此,只要将月用水量标准制定为3吨时,就可以满足85%以上的居民每月的用水量不超过标准对“p69思考”内容的导读:不同的样本得到的频率分布折线图不同;即使对于同一样本,不同的分组情况得到的频率分布折线图也不同,因此不能由样本的频率分布折线图得到准确的总体密度曲线1频率分布表与频率分布直方图(1)频数与频率将一批数据按要求分成若干个组,数据分布在各个小组的个数,叫做该组的频数,每组频数除以全体数据总数的商,叫做该组的频率,频率反映数据在每组中所占比例的大小(2)样本的频率分布与频率分布表相关概念根据随机所抽样本的大小,分别计算数据分布在各个小组的频率,这些频率的分布规律(取值情况),就叫做样本的频率分布为了能直观地显示样本的频率分布情况,通常我们会将样本的分组情况、数据分布在各个小组的频数以及计算所得的相应频率列在一张表中,叫做样本频率分布表求一组数据的频率分布表的步骤:a求极差b决定组距与组数c将数据分组d列频率分布表(3)用样本的频率分布估计总体的分布从一个总体得到一个包含大量数据的样本时,很难从一个个的数字中直接看出样本所包含的信息如果把这些数据形成频率分布表或频率分布直方图,就可以比较清楚地看出样本数据的特征,从而估计总体的分布情况(4)频率分布直方图在频率分布直方图中,纵轴表示频率/组距,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积的总和等于1频率分布直方图的绘制方法与步骤:a先制作频率分布表,然后作直角坐标系,横轴表示总体,纵轴表示.b把横轴分成若干段,每一段对应一个组以每个组距为底,以各频率除以组距的商为高,分别画成矩形这样得到的直方图就是频率分布直方图2频率分布折线图与总体密度曲线(1)频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图(2)总体密度曲线一般地,当总体中的个体数较多时,抽样时样本容量就不能太小可以想象,随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线,如图所示3茎叶图茎叶图也是用来表示数据的一种图,其画法如下:(1)将一个或两个样本的数据分为“茎”(高位)和“叶”(低位)两部分(2)将最小茎和最大茎之间的数按大小次序排成一列(3)将各个数据的“叶”按大小次序写在其茎一侧或两侧1判断下列各题(对的打“”,错的打“”)(1)频率分布折线图与总体密度曲线无关;()(2)频率分布折线图就是总体密度曲线;()(3)样本容量很大的频率分布折线图就是总体密度曲线;()(4)如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于总体密度曲线;()(5)频率分布直方图不能保留原始数据,而茎叶图可以保留原始数据,而且可以随时记录()解析:总体密度曲线通常都是用样本频率分布估计出来的如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于一条光滑曲线,这条光滑曲线就是总体密度曲线答案:(1)(2)(3)(4)(5)2一个容量为32的样本,分成5组,已知第三组的频率为0.375,则另外四组的频数之和为_解析:由题意,得第三组的频数为320.37512.另外四组的频数之和为321220.答案:203在频率分布直方图中,各小长方形的面积表示什么?它们的总和是多少?解:各小长方形的面积表示样本中落在该组内的数据的频率;总和等于1.1茎叶图的优缺点优点:用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示缺点:茎叶图在样本数据较多时,显得不太方便,而且茎叶图只方便记录两组的数据,两组以上的数据虽然能够记录,但是没有表示两组记录那么直观、清晰 2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录(这对于教练员发现运动员现场状态特别有用);而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作 3.频率分布表和频率分布直方图之间的密切关系是显然的,它们只不过是相同的数据的两种不同的表达方式,茎叶图和频率分布表极为类似,事实上,茎相当于频率分布表中的分组;茎上叶的数目相当于频率分布表中指定区间组的频数作频率分布表、绘制频率分布直方图学生用书p37调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:171163163166166168168160168165171169167169151168170168160174165168174159167156157164169180176157162161158164163163167161(1)作出频率分布表;(2)画出频率分布直方图解(1)最低身高151 cm,最高身高180 cm,它们的差是18015129,即极差为29;确定组距为4,组数为8,列表如下:分组频数频率149.5,153.5)10.025153.5,157.5)30.075157.5,161.5)60.15161.5,165.5)90.225165.5,169.5)140.35169.5,173.5)30.075173.5,177.5)30.075177.5,181.510.025合计401(2)频率分布直方图如图所示互动探究本例中,画出相应的频率分布折线图解:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图如下:方法归纳(1)在列频率分布表时,极差、组距、组数有如下关系:若为整数,则组数;若不为整数,则的整数部分1组数(2)组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为512组,一般样本容量越大,所分组数越多1美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图;(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况解:(1)以4为组距,列表如下:分组频数累计频数频率41.5,45.5) 45.5,49.5)49.5,53.5)53.5,57.5)57.5,61.5)61.5,65.5)65.5,69.5正正正正正正278165420.045 50.159 10.181 80.363 60.113 60.090 90.045 5合计441.00画频率分布直方图及频率分布折线图如下:(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小茎叶图及其应用某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其质量,分别记下抽查记录如下(单位:千克):甲:52514948534849乙:60654035256560画出茎叶图,并说明哪个车间的产品质量比较稳定解茎叶图如图所示(茎为十位上的数字):由图可以看出甲车间的产品质量较集中,而乙车间的产品质量较分散,所以甲车间的产品质量比较稳定方法归纳画茎叶图时,用中间的数表示数据的十位和百位数,两边的数分别表示两组数据的个位数要先确定中间的数取数据的哪几位,填写数据时边读边填比较数据时从数据分布的对称性、中位数、稳定性等几方面来比较绘制茎叶图的关键是分清茎和叶,一般地说数据是两位数时,十位数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要根据数据的特点合理选择茎和叶2从两个班中各随机抽取10名学生,他们的数学成绩如下:甲班:76,74,82,96,66,76,78,72,52,68乙班:86,84,62,76,78,92,82,74,88,85画出茎叶图并分析两个班学生的数学学习情况解:茎叶图如下:由茎叶图可知,乙班的数学成绩较好,而且较稳定频率分布直方图的综合应用为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组情况与频数如下:10.75,10.85),3;10.85,10.95),9;10.95,11.05),13;11.05,11.15),16;11.15,11.25),26;11.25,11.35),20;11.35,11.45),7;11.45,11.55),4;11.55,11.65,2(1)列出频率分布表;(2)画出频率分布直方图以及频率分布折线图;(3)据上述图表,估计数据落在10.95,11.35)范围内的可能性是百分之几;(4)数据小于11.20的可能性是百分之几解(1)频率分布表如下:分组频数频率10.75,10.85)30.0310.85,10.95)90.0910.95,11.05)130.1311.05,11.15)160.1611.15,11.25)260.2611.25,11.35)200.2011.35,11.45)70.0711.45,11.55)40.0411.55,11.6520.02合计1001.00(2)频率分布直方图及频率分布折线图,如图(3)由上述图表可知数据落在10.95,11.35)范围内的频率为1(0.030.09)(0.070.040.02)0.7575%,即数据落在10.95,11.35)范围内的可能性是75%.(4)数据小于11.20的可能性即数据小于11.20的频率,设为x,则(x0.41)(11.2011.15)(0.670.41)(11.2511.15),所以x0.410.13,即x0.54,从而估计数据小于11.20的可能性是54%.方法归纳(1)用样本的频率分布估计总体的分布,是列频率分布表和画频率分布直方图的主要目的,频率分布表比较准确地反映样本的频率分布,而频率分布直方图则能直观地反映样本的频率分布(2)频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性3(1)随机抽取100名学生,测得他们的身高(单位:cm),按照区间160,165),165,170),170,175),175,180),180,185分组,得到样本身高的频率分布直方图如图求频率分布直方图中x的值及身高在170 cm以上的学生人数;将身高在170,175),175,180),180,185区间内的学生依次记为a,b,c三个组,用分层抽样的方法从三个组中抽取6人,求从这三个组分别抽取的学生人数解:由频率分布直方图可知5x15(0.070.040.020.01),所以x(150.14)0.06.即身高在170 cm以上的学生人数为100(0.0650.0450.025)60人a,b,c三组的人数分别为30人,20人,10人因此应该从a,b,c三组中每组各抽取303人,202人,101人(2)从高一学生中抽取50名参加调研考试,成绩的分组及各组的频数如下(单位:分):40,50),2;50,60),3;60,70),10;70,80),15;80,90),12;90,100,8.列出样本的频率分布表;画出频率分布直方图;估计成绩在70,80)分的学生所占总体的百分比;估计成绩在70,100分的学生所占总体的百分比解:频率分布表如下:成绩分组频数频率40,50)20.0450,60)30.0660,70)100.270,80)150.380,90)120.2490,10080.16合计501.00由题意知组距为10,取小矩形的高为,计算得到如下的数据表:成绩分组频率小矩形高40,50)0.040.00450,60)0.060.00660,70)0.20.0270,80)0.30.0380,90)0.240.02490,1000.160.016合计1.00根据表格画出频率分布直方图如图:由频率分布表可知成绩在70,80)分的学生所占总体的百分比约是0.330%.估计成绩在70,100分的学生所占总体的百分比是0.30.240.160.770%.数学思想统计问题中的数形结合思想某良种培育基地正在培育一种小麦新品种a.将其与原有的一个优良品种b进行对照试验两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种a:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454品种b:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430(1)完成数据的茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种a与b的亩产量及其稳定性进行比较,写出统计结论解(1)(2)由于每个品种的数据都只有25个,样本不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据(3)通过观察茎叶图可以看出:品种a的亩产量比品种b高;品种a的亩产量比较分散,故品种a的亩产稳定性较差感悟提高数形结合思想是中学数学很重要的方法之一,是高考的重要内容之一,是根据数的结构特征,构造出与之相应的几何图形,并利用图形的特性和规律,解决数的问题1没有信息的损失,所有的原始数据都可以从图中得到的统计图是()a总体密度曲线 b茎叶图c频率分布折线图 d频率分布直方图解析:选b.所有的统计图中,仅有茎叶统计图完好无损地保存着所有的数据信息2(2015湖南师大附中月考)某厂对一批元件的长度(单位:mm)进行抽样检测,得到如图所示的频率分布直方图若长度在区间90,96)内的元件为合格品,则估计这批元件中合格产品所占的百分比是()a70% b75% c80% d85%解析:选c.易知在区间90,96)内的直方图的面积s1(0.027 50.027 50.045 0)20.8,故合格品所占的百分比是80%.3(2014高考江苏卷)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间80,130上,其频率分布直方图如图所示,则在抽测的60株树木中,有_株树木的底部周长小于100 cm.解析:底部周长在80,90)的频率为0.015100.15,底部周长在90,100)的频率为0.025100.25,样本容量为60,所以树木的底部周长小于100 cm的株数为(0.150.25)6024.答案:24 a.基础达标1在抽查某产品尺寸的过程中,将其尺寸分成若干组,a,b)是其中一组,抽查出的个体数在该组内的频率为m,该组直方图的高为h,则|ab|的值等于()ahm b.c. d与m,h无关解析:选b.小长方形的高,|ab|.2.某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”,并将受到处罚,如图是某路段的一个检测点对300辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可得出将被处罚的汽车数为()a30辆 b40辆c60辆 d80辆解析:选c.车速大于或等于70 km/h的汽车数为0.021030060(辆)故选c.3.某超市连锁店统计了城市甲、乙的各16台自动售货机在12:00至13:00间的销售金额,并用茎叶图表示如图则可估计有()a甲城市销售额多,乙城市销售额不够稳定b甲城市销售额多,乙城市销售额稳定c乙城市销售额多,甲城市销售额稳定d乙城市销售额多,甲城市销售额不够稳定解析:选d.十位数字是3、4、5时乙城市的销售额明显多于甲,估计乙城市销售额多,甲的数字过于分散,不够稳定故选d.4(2013高考辽宁卷)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:20,40),40,60),60,80),80,100若低于60分的人数是15,则该班的学生人数是()a45 b50c55 d60解析:选b.根据频率分布直方图的特点可知,低于60分的频率是(0.0050.01)200.3,所以该班的学生人数是50.5(2015宿迁质检)某校100名学生的数学测试成绩频率分布直方图如图所示,分数不低于a即为优秀,如果优秀的人数为20,则a的估计值是()a130 b140c133 d137解析:选c.由已知可以判断a(130,140),所以(140a)0.0150.011010020.解得a133.6(2015辽宁名校联考)为了解一片经济林的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出样本的频率分布直方图(如图),那么这100株树木中,底部周长小于110 cm的树有_株解析:(0.01100.02100.0410)10070.答案:707.(2015丹东质检)茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,若乙的总成绩是445,则污损的数字是_解析:设污损的叶对应的成绩是x,由茎叶图可得445838387x99,解得x93,故污损的数字是3.答案:38(2015江西宜春质检)为了帮助班上的两名贫困生解决经济困难,班上的20名同学捐出了自己的零花钱,他们的捐款数(单位:元)如下:19,20,25,30,24,23,25,29,27,27,28,28,26,27,21,30,20,19,22,20.班主任老师准备将这组数据制成频率分布直方图,以表彰他们的爱心制图时先计算最大值与最小值的差是_若取组距为2,则应分成_组;若第一组的起点定为18.5,则在26.5,28.5)内的频数为_解析:由题意知,极差为301911;由于组距为2,则5.5不是整数,所以取6组;捐款数落在26.5,28.5)内的有27,27,28,28,27共5个,因此频数为5.答案:11659某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:甲:95,81,75,91,86,89,71,65,76,88,94,110,107;乙:83,86,93,99,88,103,98,114,98,79,78,106,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较解:甲、乙两人数学成绩的茎叶图如图所示从这个茎叶图上可以看出,乙同学的得分情况是大致对称的;甲同学的得分情况也大致对称,相对乙来说有些分散乙同学的成绩比较稳定,总体情况比甲同学好10某市高三数学抽测考试中,对90分以上(含90分)的成绩进行统计,其频率分布直方图如图所示,若130,140)分数段的人数为900,求90,100)分数段的人数解:由频率分布直方图可得130,140)分数段的人数所占的百分比为0.005100.05,所以参加考试的总人数为18 000.因此90,100)分数段的人数为18 000(0.04510)8 100.b.能力提升1.(2013高考四川卷)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示以组距为5将数据分组成0,5),5,10),30,35),35,40时,所作的频率分布直方图是()解析:选a.法一:由题意知样本容量为20,组距为5.列表如下:分组频数频率0,5)10.015,10)10.0110,15)40.0415,20)20.0220,25)40.0425,30)30.0330,35)30.0335,4020.02合计201观察各选择项的频率分布直方图知选a.法二:由茎叶图知落在区间0,5)与5,10)上的频数相等,故频率、也分别相等比较四个选项知a正确,故选a.2某工厂对一批产品进行了抽样检测如图是根据抽样检测后的产品净重(单元:克)数据绘制的频率分布直方图,其中产品净重的范围是96,106,样本数据分组为96,98),98,100),100,102),102,104),104,106,已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()a90 b75c60 d45解析:选a.产品净重小于100克的频率为(0.0500.100)20.300,已知样本中产品净重小于100克的个数是36,设样本容量为n,则0.300,所以n120,净重大于或等于98克并且小于104克的产品的频率为(0.1000.1500.125)20.75,所以样本

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论