




已阅读5页,还剩21页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2.2.1 用样本的频率分布估计总体分布(第一课时 频率分布表)【课标定向】学习目标频率分布及频率分布表提示与建议1.了解频率分布的意义2.了解什么是频率分布表,掌握编制频率分布表的方法【互动探究】自主探究用样本频率分布(表)估计总体频率分布,其制作步骤是:第一步,按确定的组距对一批数据分组后,数出落在各组内数据的(即频数),填入表中;第二步,各小组的频数与数据总数的叫做这一小组的频率,算出各小组的频率,填入表中;第三步,小于某一数值的频率为,算出后填入累积频率表中剖例探法讲解点一制作频率分布表当总体很大或不便获得总体的频率时,可以用样本的频率分布估计总体的频率分布,我们把反映总体频率分布的表格称为频率分布表下面我们通过一个具体的实例来阐述这一处理样本数据的方法为了估计全市居民用水量的分布情况,假设通过抽样,我们获得了100位居民某年的月均用水量3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.43.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.33.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 100位居民的月均用水量(单位:t)1.编制频率分布表的方法步骤:求极差(也称全距,即一组数据中最大值与最小值的差)计算极差时,需要找出这组数据的最大值和最小值,当数据很多时,可借助如下算法(最大值):第一步,把这100个数据命名为;第二步,设变量;第三步,把逐个与比较,如果则运用上面的算法得出这组样本数据的最大值是4.3,用类似的方法可以得出最小值0.2,它们的差为4.3-0.2=4.1,说明样本数据的变化范围是4.1t决定组距与组数样本数据有100个,由上面算得极差为4.1,取组距为0.5,那么组数=极差/组距=4.1/0.5=8.2,于是应将样本数据分成9组注意:为方便起见,组距的选择应力求“取整”,如果极差不利于分组(如不能被组数整除),可适当增大极差,如在左、右两端各增加适当范围(尽量使两端增加的量相同)决定分点,将数据分组以组距为0.5,将数据分组时,可以分成以下9组:分组时,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间,当然也可以采用其他分组方法登记频数,计算频率,列出频率分布表如表:频率=频数/样本容量,如第一小组的频率为4/100=0.04100位居民的月均用水量的频率分布表2.小结组距和组数的确定没有固定的标准,将数据分组时,组数应力求合适,以使数据的分布规律能清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,数据分组的组数与样本容量有关一般样本容量越大,所分组数越多,当样本容量不超过100 时,按照数据的多少,常分成5至12组频率分布表排除了抽样造成的误差,精确地反映了总体取值的概率分布规律!总体分布例题为了估计某人的射击技术状况,在他的训练记录中抽取了50次进行检验,他命中环数如下:7 8 6 8 6 5 9 10 7 95 6 5 6 7 8 7 9 10 98 5 7 8 7 6 8 6 7 79 6 5 8 6 9 6 8 10 78 7 8 6 9 8 7 10 8 9作出频率分布表【解析】频率分布表如下:环数频数频率550.106100.207110.228120.24980.161040.08【规律技巧总结】作频率分布表时要注意给出的数据,怎样分组,以及频数与频率之间的关系精彩反思1.一般地,编制频率分布表的步骤如下:求全距,决定组数和组距,组距=全距/组数如果取全距时不利于分组(如不能被组数整除),可适当增大全距,如在左、右两端各增加适当范围,(尽量使两端增加的量相同),同时还要注意,分的组数过少或过多都不好,过少或过多,都不能反映数据的分布规律分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间登记频数,计算频率,列出频率分布表2.当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布,反映总体频率分布的表格叫频率分布表3.频率分布表各组中的频数之和为样本容量,各组中的频率之和等于1【自我测评】1.一个容量为20的样本,已知某组的频率为0.25,则该组的频数为( )5 15 2 802.从某一总体中抽出一个体数为200的样本后,得到组距与频数如下:,则样本在上的频率是( )0.69 0.46 1 不存在3.一个容量为20的数据样本,分组与频数为,则样本数据在区间上的可能性为( )5% 25% 50% 70%【拓展迁移】思维提升4.下面是不同厂家生产的手提式电脑的重量(单位:),试列出其频率分布表:1.9 2.0 2.1 2.4 2.4 2.8 3.2 2.3 1.5 2.6 2.6 1.9 2.4 2.2 1.6 1.7 1.7 1.8 1.8 3.0视野拓展“国际数学界”的最高奖项数学领域中有一种世界性的奖励,这就是每四年颁发一次的菲尔兹奖在各国数学家的眼里,菲尔兹奖所带来的荣誉可与诺贝尔奖相媲美菲尔兹奖是由国际数学联盟(简称IMU) 主持评定的,并且只在每四年召开一次的国际数学家大会(简称ICM)上颁发,菲尔兹奖的权威性,部分地来自于此第一次国际数学家大会在苏黎世召开,紧接着,1900年又在巴黎召开了第二次会议,自1900年以后,大会一般每四年召开一次菲尔兹奖是以已故的加拿大数学家约翰查尔斯菲尔兹命名的2.2.1 用样本的频率分布估计总体分布(第二课时 频率分布直方图)【课标定向】学习目标频率分布直方图;频率分布折线图;总体密度曲线提示与建议1.了解频率分布直方图的意义;2.了解折线图和密度曲线的意义;3.掌握作频率分布直方图的方法【互动探究】自主探究1.在频率分布直方图中,纵轴表示,数据落在各小组内的频率用表示,各小长方形的面积总和2.下列关于频率分布直方图的说法正确的是( )直方图的高表示取某数的频率直方图的高表示该组上的个体在样本中出现的频率直方图的高表示取某组上的个体在样本中出现的频数与组距的比值直方图的高表示取该组上的个体在样本中出现的频率与组距的比值3.在频率分布直方图中,各个长方形的面积表示( )落在相应各组的数据的频数 相应各组的频率该样本所分成的组数该样本的样本容量4.连结频率分布直方图中各小长方形上端的中点,就得到频率分布折线图,随着的增加,作图时所分的的增加,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称之为总体密度曲线,它能够更加精细的反映出剖例探法讲解点一制作频率分布图1.频率分布直方图的绘制方法与步骤:(下面用上节居民用水量中的数据加以说明)先制作频率分布表,然后作直角坐标系,以横轴表示月均用水量,纵轴表示频率/组距;把横轴分成若干段,每一线段对应一个组的组距,即在横轴上标上0.5,1,1.5 ,4.5表示的点;在上面标出的各点中,分别以相邻两点为端点的线段为底作矩形,它的高等于该组的频率/组距,每个矩形的面积恰好是该组上的频率这些矩形就构成了频率分布直方图2.有关问题的理解因为小矩形的面积=组距频率/组距=频率,所以各小矩形的面积表示相应各组的频率,这样,频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小在频率分布直方图中,各小矩形的面积的总和等于1同样一组数据,如果组距不同,横轴、纵轴单位不同,得到的图的形状也会不同,不同的形状给人的印象也不同,这种印象有时会影响我们对总体的判断,下面分别以0.1和1为组矩重新作图,观察图的特点可见,分组越细越接近样本的原始数据,更能真实反映样本数据的原始状态,但如果样本容量不增加,只一味减小组距,有时反而影响频率分布观察讲解点一制作频率折线图1.频率分布折线图如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起来,就得到一条折线,我们称这条折线为本组数据的频率分布折线图,简称频率分布折线图如上例中,可得如下频率折线图注意:取值区间两端点须分别向外延伸半个组距,并取此组距上在轴上的点与折线的首尾分别相连2. 总体密度曲线一般地,当总体中的个体数较多时,抽样时样本容量就不能太小例如,如果要抽样调查一个省乃至全国的居民的月均用水量,那么样本容量就应比调查一个城市的时候要大如果将样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图会趋于一条光滑曲线,统计中称这条光滑的曲线为总体密度曲线3.频率分布与总体分布总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,总体在某一区间取值的百分比就是该区间与该曲线所夹的曲边梯形的面积,例如上图中阴影部分的面积就是总体在区间内取值的百分比总体密度曲线通常都是利用样本的频率分布估计出来的,这是因为:并非所有的总体都存在密度曲线,如一些离散型总体;尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样被准确地画出来,我们只能用样本的频率分布对它进行估计,一般说来,样本容量越大,这种估计就越精确例题在一小时内统计一传呼台接收到用户的呼唤次数,按每分钟统计如下:0 0 1 2 1 2 2 3 4 10 1 2 5 3 1 2 2 2 42 4 3 1 1 3 2 3 4 61 2 0 2 3 1 3 1 4 11 2 0 2 3 4 2 5 0 21 1 0 3 2 1 3 1 2 0写出一分钟内传呼呼唤次数的频率分布表,并画出频率分布图【解析】 一分钟传呼呼唤次数的频率分布表及频率分布直方图如下图所示:一分钟内呼唤次数频数频率080.1331160.2672170.2833100.167460.100520.033610.017总计601.000【规律技巧总结】在画频率分布直方图的过程中,一定要合理分组,确定恰当的组距严格按步骤画出频率分布直方图精彩反思1.频率分布直方图和折线图的优缺点:优点:直方图直观,能以面积的形式反映数据落在各小组的频率的大小;折线图能直观地反映数据的变化趋势缺点:不精确,没有保留原始数据2.在频率分布直方图中,各小长方形的面积表示相应各组的频率,所有小矩形的面积和为1【自我测评】1.对于样本频率分布直方图与总体密度曲线的关系,下列说法中正确的是( )频率分布直方图与总体密度曲线无关频率分布直方图就是总体密度曲线样本容量很大的频率直方图就是总体密度曲线如果样本容量无限增大,分组的组距无限减小,那么相应的频率折线图会越来越接近一条光滑曲线,则这条光滑曲线为总体密度密线2.在频率分布直方图中,中位数两侧的面积的比为( )13 21 11 不确定3.下列是容量为100的样本的频率分布直方图,试根据图形中的数据填空:样本数据落在范围内的频率为;样本数据落在范围内的频率为;总体在范围内的概率为【拓展迁移】思维提升4.某班50名学生在一次百米测试中,成绩介于13秒与19秒之间,将测试结果按下列方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;第六组,成绩大于等于18秒且小于19秒右图是按上述方法分组得到的频率分布直方图设成绩小于17秒的学生人数占全班总人数的百分比为,成绩大于等于15秒且小于17秒的学生人数为,则从右图的频率分布直方图中可分析出和分别为( )0.9,35 0.9,45 0.1,35 0.1,455.从某小学随机抽取100名同学,将他们的身高(单位:厘米),数据绘制成频率分布直方图(如图)由图中数据可知若要从身高在三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在内的学生中选取的人数为6.从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频率如下(单位:分):列出样本的频率分布表(含累积频率);画出频率分布直方图;估计成绩在的学生比例;估计成绩在85分以下的学生比例视野拓展纪塔娜女神的智慧在非洲流传一个古老的神话:一个酋长要分给纪塔娜女神一块土地,这块土地可以用一张灰鼠皮围起来,酋长十分得意,他认为一张灰鼠皮本来就很小,用它能围出多大一块土地?纪塔娜女神接过鼠皮后,把它剪成很细的皮条连成一条长皮绳,她用皮绳靠海岸线围成一块很大的半圆形土地,结果分得一块很大的土地,酋长连呼吃亏2.2.1 用样本的频率分布估计总体分布(第三课时 茎叶图)1 2 52 4 53 1 1 6 7 94 4 95 0茎:表示十位数叶:表示个位数分界线【课标定向】学习目标茎叶图提示与建议了解茎叶图的意义,掌握制作茎叶图的方法【互动探究】自主探究1 .下列命题正确的是( )频率分布直方图中每个小矩形的面积等于相应组的频数频率分布直方图的面积为对应数据的频数频率分布直方图中各小矩形高(平行于纵轴的边)表示频率与组距的比用茎叶图统计某运动员得分:13,51,23,8,26,38,16,33,14,28,39时,茎是指中位数262.当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以;而且,给数据的和都带来了方便3. 茎叶图表示数据时,茎表示的数据在叶表示的数据,并且叶分布在剖例探法讲解点一茎叶图及其应用除了上面几种图表能帮助我们理解样本数据外,统计中还有一种用来表示数据的图叫做茎叶图,它是一种将样本数据有条理地列出来,从而观察样本分布情况的图下面以具体的实例阐述茎叶图的制作方法及其特点:上班时间 下班时间8 1 6 7 98 7 6 1 0 2 2 5 7 9 95 3 2 0 3 0 0 2 60 4例如:某篮球运动员在2002赛季各场比赛的得分情况如下:12,15,24,31,31,36,37,39,44,49,50制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共同一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从小到大(或从大到小的顺序同行列出)上述运动员得分茎叶图如图:图中第一行分界线的左边的“1”表示十位数,,右边的“2” 和“5”表示个位数字,这一行说明该运动员的得分为12分和15分,同理可说明其它各行的意思从这张图中可以看出,茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况,如上图中该运动员平均得分及中位数、众数都在20到40之间,且分布较对称,集中程度高,说明其发挥比较稳定例题某市对上、下班交通情况做抽样调查,上、下班时间各抽取了12辆机动车行驶时速如下:(单位:km/h)上班时间:30 33 18 27 32 40 26 28 21 28 35 20下班时间:27 19 32 29 36 29 30 22 25 16 17 30用茎叶图表示上面的样本数据,并求出样本数据的中位数写出一分钟内传呼呼唤次数的频率分布表,并画出频率分布图【思维切入】以十位数为茎,个位数为叶,可以作出相应的茎叶图,从而可据图分析数据的特征【解析】根据题意给出该市上、下班交通情况的茎叶图如图所示:由此可见,上班时间行驶时速的中位数是28,下班时间行驶时速的中位数是29【规律技巧总结】茎叶图保留了原始数据,所有的数据信息都可以很容易的从表中获得精彩反思1.用茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,但茎叶图表示三位数以上的数据时不够方便2.茎叶图既可以分析单组数据,也可以对两组数据进行比较对于例题,左侧的叶按从大到小的顺序写右侧的叶按从小到大的顺序写,相同的数据要重复记录,不能遗漏【自我测评】1.下面是甲 乙两名运动员某赛季一些场得分的茎叶图:甲 乙 0 85 0 1 2 4 73 2 2 1 9 98 7 5 4 2 1 3 3 69 4 4 41 5 2作品A8 8 9 99 2 3 2 1 4甲、乙两名队员的最高得分各是多少?哪名运动员的成绩好一些?2.在射击队的某次训练课上 甲 乙两名射击运动员的射击环数原始记录如下;甲运动员在;甲运动员:7.5 8.6 7.7 9.1 10.2 8.3 6.5 9.3 8.6乙运动员:8.3 9.1 7.6 9.3 10.5 6.4 8.7 9.2 9.5 8.9 9.2 试画出对应的茎叶图;利用茎叶图 分析两名运动员的射击水平【拓展迁移】思维提升3.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为和4.某校开展“爱我海西,爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示记分员在去掉一个最高分和一个最低分后,算得平均分为91复核员在复核时,发现有一个数字(茎叶图中的)无法看清若记分员计算无误,则数字应该是5.某篮球运动员在2005赛季各场比赛的得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50制作茎叶图,并分析这个运动员的整体水平及发挥的稳定程度视野拓展优秀是一种习惯这句话是古希腊哲学家亚里士多德说的如果说优秀是一种习惯,那么懒惰也是一种习惯人出生的时候,除了脾气会因为天性而有所不同,其他的东西基本都是后天形成的,是家庭影响和教育的结果所以,我们的一言一行都是日积月累养成的习惯,有的人形成了很好的习惯,有的人形成了很坏的习惯所以我们从现在起就要把优秀变成一种习惯,使我们的优秀行为习以为常,变成我们的第二天性让我们习惯性地去创造性思考,习惯性地去认真做事情,习惯性地对别人友好,习惯性的欣赏大自然注解:要会“装”,要持续地、不间断地“装”,装久了就成了真的了,就成了习惯了比如准时到会,每次都按时到会,你装装看,你装30年看看,装的时间长了就形成了习惯2.2.1 用样本的频率分布估计总体分布(小结)【课标定向】学习目标1.频率分布表;2.频率分布直方图;3.频率分布折线图;4.频率分布茎叶图提示与建议了解用频率分布表、直方图、折线图、茎叶图估计总体分布的方法,优缺点【互动探究】自主探究1.将容量为100的样本数据,从小到大的顺序分成8个组,如下表:组号12345678频数9141413121310则第9组的频率为( )0.14 14 0.15 152.一个容量为80的样本最大值是140,最小值是51,组距为10,则可以分成( )10组 9组 8组 7组剖例探法讲解点一绘制统计图表结合各种图表的特点分析题目条件选择合理的图表分析样本数据例题连续抛掷一个骰子120次,得到1,2,3,4,5,6点的次数为18,19,21,22,20,20列出样本的频率分布表;列出频率分布条形图;估计抛掷不足4点的机率【思维切入】由于取值可按一定次序一一列出,可以用频率分布表或频率分布条形图分析样本【解析】频率分布表如下表:点数频数频率累计频率1234561819212220200.150.1580.1750.1830.1670.1670.150.3080.4830.6660.8331.000合计1201.000频率分布条形如图:据累积频率,抛掷点数不足4点的机率约为0.483【规律技巧总结】频率分布由所取样本的不同数值及相应的频数、频率组成,其中累积频率一栏可以去掉,那样的话,抛掷一次所得点数不足4的频率可如下计算:0.15+0.158+0.175=0.483点数4相应的累积频率0.666,是点数不大于4的频率,不是点数小于4的频率频率分布条形图是用条形高度表示各个值的频率的图形本例中总体的不同取值很少,可一一列举通常称离散型总体例题2 有一容量为200的样本,数据的分组以及各组的频数如下:列出样本的频率分布表;列出频率分布直方图;估计抛掷不足0的频率【思维切入】由于分组已确定,可由频数分别求出各组的频率,列表,作图【解析】频率分布表如下表:分组频数频率累计频率70.0350.035110.0550.090150.0750.165400.2000.365490.2450.610410.2050.815200.1000.915170.0851.000合计2001.000频率分布直方图如图:据累积频率,抛掷点数不足0的频率约为0.365【规律技巧总结】频率直方图用各小矩形的面积表示相应各组的频率;不足0的频率即符合条件的个体频数占样本容量的比例讲解点二用样本分布估计总体分布例题3为了解一大片经济林的生长情况,随机测量其中的100株的底部周长,得到如下数据:(长度单位:)绘制频率分布表;绘制频率分布直方图、折线图;估计该片经济林中底部周长小于100的树木约占多少?周长不小于120的树木约占多少?【解析】从数据中可以看出,这组数据的最大值为135,最小值为80,故全距为55,可将其分为11组,组距为5从第1组开始,将各组的频数和频率/组距甜如表中:分组频数频率累计频率10.010.00220.020.00440.040.008140.140.028240.240.048150.150.030120120.02490.090.018110.110.02260.060.01220.020.004合计10010.2这组数据的频率直方图如图所示:从频率分布表可以看出,该样本中小于100的频率为0.01+0.02+0.04+0.14=0.21,不小于120的频率为0.11+0.06+0.02=0.19,故可估计该片经济树林中底部周长小于100的树木约 占21%,周长不小于120的树木约占19%【规律技巧总结】频率分布表从数值上直观地体现各组的频率;频率分布直方图则更形象地反映各组数据的频率与样本分布趋势,所以往往通过两者综合考查样本精彩反思几种表示频率分布的方法的优点与不足1.频率分布表的优缺点:优点是简单易行,对数据的整理有明确的方向,是其他方法的基础;缺点是反映数据的分布规律不是很直观2.频率分布直方图的优缺点:优点是直观,能直观地反映数据分布的状况;缺点是不很精确3.频率分布折线图的优缺点:优点是它能反映数据的变化趋势;缺点是不很精确4.而由直方图和折线图而来的总体密度曲线则具有二者的所有优点却避免了二者的不精确的缺点,只是密度曲线不容易得出,且只有当总体是连续型总体时才有密度曲线,对于离散型总体它没有密度曲线5.茎叶图的优缺点:优点是当样本数据较少时,所有的原始信息都可以从图中得到,且茎叶图便录和表示;缺点是,当样本数据较多时或数据是三位数以上时,用茎叶图表示就不方便了【自我测评】1.观察新生婴儿的体重,其频率分布直方图如图,则新生婴儿的体重在的频率为 0.001 0.01 0.003 0.32.已知样本:12,7,11,12,11,12,10,10,9,8,13,12,10,9,6,11,8,9,8,10,那么频率为0.25的样本的范围是( ) 3.一个样本容量为32的样本,已知某组样本的频率为0.125,则该组样本的频数为( )2 4 6 84.某班学生在一次数学考试中成绩分布如下表:分数段人数2568分数段人数12642那么,分数在中的频数为,频率为(精确到0.01)【拓展迁移】思维提升5.为了了解某学校学生的身体发育情况,抽查了该校名100高中男生的体重情况,根据所得数据画出样本的频率分布直方图如图所示,根据此图,估计该校2000名高中男生中体重大于70.5公斤的人数为300 360 400 4506.根据某水文观测点的历史统计数据,得到某条河流水位的频率分布直方图,从图中可以看出,该水文观测点平均至少一百年才遇到一次的洪水的最低水位是( )48米 49米 50米 51米视野拓展数学皇冠的明珠哥德巴赫猜想大约在250年前,德国数学家哥德巴赫发现了这样一个现象:任何大于4的偶数都可以表示为2个质数的和他验证了许多数字,这个结论都是正确的但他却找不到任何办法从理论上彻底证明它1966年陈景润的证明距离最后的结果就差一步了,而这一步却无比艰难,30多年过去了,还没有能迈出这一步许多科学家认为,要证明(1+1)以往的路走不通了,必须要创造新方法当“陈氏定理”公之于众的时候,许多业余数学爱好者也跃跃欲试,想要摘取“皇冠上的明珠”然而科学不是儿戏,不存在任何捷径只有那些具有深厚的科学功底的人,才有希望达到光辉的顶点2.2.2 用样本的数字特征估计总体数字特征(第一课时 众数 中位数 平均数)【课标定向】学习目标1.众数、中位数、平均数概念;2.频率分布直方图中众数、中位数、平均数的确定提示与建议1.理解可用样本的数据对总体的数字特征进行研究;2.会求样本中众数、中位数、平均数【互动探究】自主探究1 .在频率分布直方图中,中位数左边和右边的直方图的面积应该2.课本中调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数应是对应的数据,而月均用水量的平均数处于频率分布直方图的位置3.在频率分布直方图中下列描述正确的是( )众数是在样本数据中频率最大的值所对应的样本数据中位数是样本数据中积累频率为0.5时所对应的样本数据值平均数是样本数据中的算术平均数在样本数据中,任何一个样本数据的改变都会引起众数、中位数、平均数的改变4.一个容量为80的样本最大值是140,最小值是51,组距为10,则可以分成( )频率分布直方图中的中位数和实际中位数是一样的 平均数左边和右边的矩形的面积相等 众数是最高矩形中点的横坐标中位数是频率分布直方图中的重心剖例探法讲解点一求众数、中位数、平均数1.众数:在样本数据中,频率分布最大值所对应的样本数据;2.中位数:样本数据中,累积频率为0.05时所对应的样本数据值(累积频率,样本数据小于某一数值的频率叫做该数值点的累积频)3.平均数:样本数据的算术平均数,即例题某工厂人员及工资构成如下表:人员经理管理人员高级技工工人学徒合计工资2200250220200100人数16510123合计22001500110020001006900指出这个问题中的众数、中位数、平均数;这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么?【思维切入】本题着眼于众数、各自的特点,以及其适应对象【解析】由表格可知,众数=200,中位数=220,平均数=2200+1500+1100+2000+100)23=690023=300虽然平均数为300元/周,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平【规律技巧总结】平均数受数据中的极端值的影响较大,妨碍了对总体估计的可靠性, 这时平均数反而不如众数、中位数更客观例题2 为了发展,某公司新开发了10个项目,其中一个项目投资为200万,另外9个项目均在2万与20万之间,经分析中位数是18万,平均数是35万,众数是4万你会选择哪个数字特征表示每一项目的投资?为什么?【解析】选择众数较合适,定量地反映了数据的集中趋势所处的水平,从而对总投资金更有代表性,更有说服力【规律技巧总结】众数、中位数、平均数三者比较,众数更能体现每个数据的特征,它是各数据出现频率最大的数据讲解点二频率分布直方图与样本数字特征1.众数:一组数据中,出现次数最多的数据,在频率分布直方图中是最高矩形的中点对应的值;2.中位数:一组数据按大小排序,处在中间位置的一个(或最中间两个数据的平均数),频率分布直方图中中位数的左右两侧直方图面积相等3.平均数显然是频率分布直方图的“重心”,我们知道,个样本数据的平均数也就是把每个都用取代后,数据总和保持不变,所以平均数对数据有“取齐”的作用,代表了一组数据的数值平均水平在频率分布直方图中,平均数是直方图的平衡点,假设横轴是一块放置直方图的跷跷板,则支点取在平均数处时跷跷板达到平衡例题3 由上节课本调查100位居民的月均用水量的问题中,从其频率分布直方图求众数、中位数【解析】由图可得月均用水量的众数为2.25t由图可得月均用水量的中位数为2.03t【规律技巧总结】我们知道,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值图中虚线代表居民月均用水量的中位数的估计值,此数据值为2.03t(如图所示) 2.03t这个中位数的估计值,与样本的中位数数值2.0不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原始的数据内容,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致精彩反思三种数字特征的缺点1.众数体现了样本数据的最大集中点,但它显然对其他数据信息的忽视使得无法客观地反映总体特征,如上例中众数是2.25t,它告诉我们,月均用水量为2.25t的居民数比月均用水量为其他数值的居民数多,但它没有告诉我们多多少;2.中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点如上例中假设有某一用户月均用水量为 10t,那么它所占频率为0.01,几乎不影响中位数,但显然这一极端值是不能忽视的;3.由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质,也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低【自我测评】1.已知一组数据为20,30,40,50,50,60,70,80其中平均数、中位数、众数的大小关系是( )平均数中位数众数 平均数中位数众数中位数众数平均数平均数=中位数=众数2.已知一组数据为-1,0,4,6,15,且这组数据的中位数为5,那么数据的众数为( )5 6 4 5.53.为了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高1.60m,从南方抽取了200个男孩,平均身高为1.50m,由此可推断我国13岁男孩的平均身高为( )1.54 m 1.55 m 1.56 m 1.57 m4.分别求下列一组数据的众数&中位数与平均数:10,20,80,40,30,90,50,40,50,40【拓展迁移】甲 乙3 1 277 5 5 0 28 45 4 2 29 2 5 8 7 3 3 1 30 4 6 79 4 0 31 2 3 5 5 6 8 88 5 5 3 32 0 2 2 4 7 97 4 1 33 1 3 6 734 32 35 6思维提升5.在一次体操比赛中,8名裁判给运动员打分,规定将8个分数的中位数作为运动员的得分已知名裁判员打出的分数如下:9.55,9.34,9.45,8.75,9.20,9.85,9.12,9.47求该运动员得分6.随机抽取某产品件,测得其长度分别为,则下图所示的程序框图输出,表示的样本的数字特征是(注:框图中的赋值符号“=”也可以写成“”或“:=”)7. 从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:)结果如下:甲品种271273280285285287292294295301303303307308310314319323325325328331334337352乙品种284292295304306307312313315315316318318320322322324327329331333336337343356由以上数据设计了如下茎叶图:根据以上茎叶图,对甲乙两品种棉花的纤维长度作比较,写出两个统计结论:;视野拓展托尔斯泰最欣赏的一道数学题一些割草人在两块草地上割草,大草地的面积比小草地大一倍上午全体割草人都在大草地上割草,下午他们对半分工,一半人留在大草地上,到傍晚时把剩下的草割完,另一半人到小草地上割草,到傍晚还剩下一小块没有割完,这一小块第二天由一个割草人割完,假定每半天劳动时间相等,每个割草人工作效率相等,问共有多少割草人?托尔斯泰年轻时发现的算术解法:大草地上,因为全体割了一上午,一半人又割了一下午才割完,所以把大草地面积看作1,一半人半天时间割草面积为1/3,在小草地上另一半人曾工作了一个下午,这样他们在半天时间的割草面积也是1/3,则第一天割草总面积为4/3,剩下面积应为小草地面积的1/2 减去1/3,剩1/6,这一小块第二天由人割完,说明每人每天割草1/6,则(4/3)(1/6)=8人2.2.2 用样本的数字特征估计总体数字特征(第二课时 方差与标准差)【课标定向】学习目标方差和标准差的计算方法(&%用样本方差估计总体方差提示与建议1.掌握个数据标准差及方差的计算方法;2.会用样本数据的平均数&方差来分析样本,并由此对总体进行估计【互动探究】自主探究1.平均数&众数&中位数描述数据,方差、极差和标准差描述数据,也可以说方差、标准差和极差反映2.标准差其中是,是,是3.是反映总体波动大小的特征数,样本方差是通常用样本方差估计总体方差,当时,样本方差很接近总体方差4.甲乙两名射击运动员在相同条件下各射击- 次,命中环数如下:甲78795491074乙9578768677则两人的平均成绩都是,甲的环数极差是,乙的环数极差是,这说明发挥的更稳定5.标准差、方差的取值范围是,标准差、方差为0时,样本数据,表明数据没有,数据没有剖例探法讲解点一样本数字特征及其应用平均数向我们提供了样本数据的重要信息,但是,平均数有时也会使我们作出对总体的片面判断,某地区的年平均家庭收入是10万元,给人的印象是这个地区的家庭收入普遍较高,但是,如果这个平均数是从200户贫困家庭和20户极富有的家庭收入计算出来的,那么,它就既不能代表贫困户家庭的年收入,也不能代表极富有家庭的年收入在这里众数、中位数可能更为客观,在日常生活中存在着很多混用这些描述平均位置的统计术语进行误导的现象,这是因为平均数掩盖了一些极端情况,在很多的比赛中,采取的“去掉一个最高分,去掉一个最低分”的统计策略就是为了避免极端情况对平均分的影响,但事实上,这些极端情况显然是不能忽视的,因此,要较准确地概括样本数据的实际状态,只有平均数是很难做到的又如,对两名射击运动员进行射击测试,两人在相同条件下,各射击10次,命中环数如下:甲78795491074乙9578768677两人的平均成绩相同,都是7环,这是不是代表两人水平没什么差异呢?直观上看是有差异的,甲成绩比较分散,乙的成绩相对集中,因此,我们还需要从另外的角度来考试数据,如在作统计图表时提到过的极差:甲的环数极差10-4=6,乙的环数极差9-5=4显然最大值与最小值的波动情况来看,乙波动较小,说明乙发挥更稳定,但从极差上去考查数据的波动,更多地体现了数据的波动幅度,波动范围,且它对极端值非常敏感;各个数据的波动情形无法更好更全面的体现,注意到这一点,我们要考查样本数据的分散程度大小,可以看各样本数据到平均数的一种平均距离方差与标准差反映了样本数据的分散程度,即反映了样本数据相对于平均值的波动程度,也即反映了样本数据的稳定性,当涉及到与单位有关的问题时,用标准差更合理,方差越大,数据就越分散,波动程度就越大例题某从某灯泡厂生产的一批灯泡中随机抽取10只进行寿命测试,得数据如下:(单位:h)1458 1395 1562 1614 13511490 1478 1382 1536 1496使用科学计算器,求样本平均数和样本标准差【思维切入】在一般科学计算器中,均设有计算标准差的按键,在求一组数据的标准差时,只要让计算器处于统计状态,并将数据逐个输入,然后按标准差键,即可立即显示所求的标准差【解析】按键:MODE 2(进入统计计算模式)SHIFT CLE 1 = 1562 DT(清除统计存储器)1458 DT 1395 DT 1562 DT 1614 DT 1351 DT 1490 DT 1478 DT 1382 DT 1536 DT 1496 DT(键入数据)SHIFT 2 1 =1476.2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 青年面临的主要挑战分析试题及答案
- 消防监控系统应用试题及答案
- 年度新颖中级审计师试题及答案
- 财务透明度与信任试题及答案
- 消防机电设备试题及答案
- 高级会计职业素养试题及答案
- 结合案例学习审计2024年高级审计师考试试题及答案
- 系统复习二级消防工程师试题及答案
- 2025年全民健身设施社区体育社会互动补短板工程研究报告
- 工程项目风险识别方法试题及答案
- 新技术、新工艺、对提高工程质量、缩短工期、降低造价的可行性
- 金属矿床地下开采复习题及答案
- GB 5009.34-2022食品安全国家标准食品中二氧化硫的测定
- 教学课件《断裂力学》
- 慢阻肺的管理课件
- 电工基本知识培训资料课件
- 北师大版《相遇问题》公开课课件
- 邻补角、对顶角、同位角、内错角、同旁内角经典习题-一对一专用
- HP系列培训手册
- 毕业论文-原油电脱水方法与机理的研究
- 陕西省2022年普通高中学业水平考试(真题)
评论
0/150
提交评论