




免费预览已结束,剩余6页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
总体分布的估计上节我们学习了几种常见的抽样方法,这些方法都保证了每个个体从总体中都能以等可能性抽取,从而保证了样本的客观公平,能更好的反映总体的实际状态.当样本从总体中抽取出来后,如何根据样本的情况对总体的分布情况作出一种推断呢?这就是本节将要学习的总体分布的估计的内容.学法建议 通过本节的学习要能体会分布的意义和作用,并且在表示样本数据的过程中,学会列频率分布表,画频率直方图、频率折线图和茎叶图,体会它们各自的特点,感受它们能揭示表面上杂乱无章的数据中所蕴涵的规律的作用,从而学会用样本估计总体的思想解决一些实际问题,认识统计的作用,体会统计思维与确定性思维的差异.此外要通过初步经历从收集数据到处理数据的全过程,掌握利用已有数据对一般分布作出估计,为科学决策提供依据的方法,形成对数据处理过程进行评价的意识.理解图表的意义是本节的关键.数据处理频率分布表频率分布直方图表频率折线图茎叶图一、知识网络易错点提示 1用样本估计总体,是研究统计问题的一个基本思想方法,由于总体分布通常不易知道,我们往往是用样本的频率分布去估计总体分布,因此不能认为样本的分布状态就是总体的分布状态,这里可能会有误差.一般地,样本容量越大,这种估计就越精确. 2在绘制茎叶图时,对重复出现的数据要重复记录,不能遗漏.二、知识归纳1频率分布表 编制频率分布表的步骤如下:(1)求全距,决定组数和组距,组距=;(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表.2频率分布直方图和折线图 .绘制频率分布直方图的步骤如下: (1)先制作频率分布表,然后作直角坐标系,以横轴表示数据,纵轴表示;(2)在横轴上标上数据(为方便起见,起始点的数据可适当前移); (3)在上面标出的各点中,分别以连结相邻两点的线段为底作矩形,高等于该组的,至此就可以得到频率分布直方图. 这里需要注意的是每个矩形的面积恰好是该组上的频率,这些矩形就构成了频率分布直方图.在反映样本的频率分布方面,频率分布表比较确切,频率分布直方图比较直观,它们相互补充.折线图如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为本数据的频率折线图.下面是甲乙两个商场的营业额数据和折线图:季度甲商场营业额乙商场营业额第一季度96.1万元116万元第二季度90.2万元73万元第三季度77万元87.2万元第四季度88.1万元61.4万元由于用频率分布直方图去估计相应的总体分布时,如果样本容量越来越大,那么分组就越来越细,即:频率分布直方图中的各个小矩形就会越来越细.当样本容量充分大时,图中的组距充分缩短,从而阶梯折线就变成光滑的曲线,这就是总体分布曲线,它精确地反映了总体的分布规律. 3茎叶图初中统计部分曾学过用平均数、众数和中位数反映总体的水平,用方差考察稳定程度.其实还有一种简易的方法,就是将这些数据有条理的列出来,从中观察数据的分布情况,这种方法就是画出数据的茎叶图.制作茎叶图的思路是将数组的数按位数进行比较,将数大小基本不变或变化不大的位作为一个主杆(茎),将变化大的位的数作为分枝(叶),列在主杆的后面,这样就可以清楚地看到每个主杆后面的几个数,每个数具体是多少.茎叶图中的茎是“叶”十进制的上一级单位,右边的是数距中的变化位,它是按照一定的间隔将数组中的每个变化的数一一列出来,象一条枝上抽出的叶子一样,所以人们形象地叫它茎叶图. 茎叶图既可以分析单组数据,也可以对两组数据进行比较. 茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到,二是茎叶图便于记录与表示.但茎叶图表示三位数以上的数据时不够方便,一般要通过专业的软件来帮助处理. 三、图解重点样本数据整理计算极差、决定组距和组数,决定分点列频率分布表频率分布表制作的基本程序潜能开发 例1 考查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:171163163166166168168160168165171169167169151168170160168174165168174159167156157164169180176157162161158164163163167161(1)作出频率分布表;(2)画出频率分布直方图。思路分析 确定组距与组数是解决“总体中的个体取不同值较多”这类问题的出发点.解答 (1)最低身高为151,最高身高180,它们的差为180-151=29.确定组距为3,组数为10,列表如下:身高(cm)频数频率()150.5 153.512.5153.5 156.512.5156.5 159.5410.0159.5 162.5512.5162.5 165.5820.0165.5 168.51127.5168.5 171.5615.0171.5 174.525.0174.5 177.512.5177.5 180.512.5(2)频率分布直方图如下:150.5156.5162.5174.5168.5频率/组距180.5身高27.520.010.015.05.02.512.5例2 对某电子元件进行寿命追踪调查,情况如下:寿命(h)100200200300300400400500500600个数2030804030(1)列出频率分布表;(2)画出频率分布直方图;(3)估计元件寿命在100h400h以内的频率;(4)估计电子元件寿命在400h以上的频率;思路分析 由于样本的取得具有代表性,因此,可以利用样本近似地估计总体.因此按照前面所述的步骤进行解题.解答 (1)样本频率分布表如下:寿命(h)频数频率100200200.1020030030040400500400.20500600300.15合计2001(2)频率分布直方图如下:100200300400500600寿命频率/组距0.400.200.100.15(3)从频率分布表可知,寿命在100h400h的元件出现的频率为0.65;例3一个容量为100的样本,数据的分组和各组的一些相关信息如下:分组频数频率累积频率12,15)615,18)0.0818,21)0.30(4)由频率分布表可知,寿命在400h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400h以上的频率为0.35.分组频数频率累积频率21,24)2124,27)0.6927,30)1630,33)0.1033,36)1.00合计1001.00(1)完成上表中每一行的两个空格;(2)画出频率分布直方图和累积频率分布图;(3)根据累积频率分布图估计,总体中小于22的样本数据大约占多大的百分比?思路分析 某数值对应的累积频率=小于该数值的所有区间对应的频率的和.每一行的频数=100频率,该行的累积频率=该行频率和前面一行(如果有的话)的累积频率之和,依照这个原则可以补全表格.在画出累积频率分布图之后,根据样本的累积频率分布图近似总体的累积分布折线图可以来估计小于22的样本数据的累积频率:寻找累积频率分布图上横轴坐标为22的点对应的纵轴值,就是我们要寻找的近似值.解答 (1)补全后的表格和频率分布图如下:分组频数频率累积频率12,15)60.060.0615,18)80.080.1418,21)160.160.3021,24)210.210.5124,27)180.180.6927,30)160.160.8530,33)100.100.9533,36)50.051.00合计1001.00(2)频率分布图和累积频率折线图如下:0.021215182124273033360.040.060.080.100.120.140.160.180.200.220.24频率/组距数值0.10.20.30.40.50.60.70.80.91.010152025303540累积频率样本数据(3)在这个折线图上,横坐标为22落在2124的区间内,折线图在这段区间上的线段所在的直线方程是:,也即,当时,因此总体中小于22的样本数据大约占37.xy123/21/2例4 甲、乙两篮球运动员上赛季每场比赛的得分如下,试比较这两位运动员的得分水平。甲 12,15,24,25,31,31,36,36,37,39,44,49,50乙 8,13,14,16,23,26,28,33,38,39,51思路分析按照茎叶图的作法,可将茎放在中间共用,叶分列两侧即可.解答两人得分的茎叶图如下:甲乙52 1 34654 2 368976611 3 38994 4 0 5 1 0 8从这个茎叶图可以看出,甲运动员的得分大致对称,平均得分、众数及中位数都是30多分;乙运动员的得分除一个51分外,也大致对称,平均得分、众数及中位数都是20多分,因此甲运动员发挥得比乙运动员稳定,总体得分情况比乙好.解题规律 合理、科学地确定组距和组数,才能准确地制表及绘图,这是用样本的频率分布估计总体分布的基本功. 列出频率分布表,就可以从“频数”栏目知道数据落在各个小组的个数,也可以从每一组的频率,就可以知道数据落在各个小组的比例大小.例如身高在165.5168.5之间的男生比较多,从分布图上也可以看出这一点.思维诊断频率分布表列出的是在各个不同区间内取各值的频率,相应的直方图是用图形面积的大小来表示在各个区间取值的频率.频率分布将随着样本容量的增大而更接近总体分布,当样本容量无限增大且分组距无限缩小时,频率分布直方图就会演变成一条光滑曲线总体分布的密度曲线.正是基于样本的频率分布与相应的总体分布的关系,我们往往从总体中抽取一个样本,用样本的频率分布来估计相应的总体分布.解题规律 本题的解题步骤同上题,不同的是添加了一个识表识图的问题,应该说数据的处理与图表的表示之间要形成一种对应关系.知识拓展 统计图是对数据的一种非常直观的描述.常见的统计图有条形图、频数分布图、频数直方图等.直方图的特点是两个统计对象对比突出,稍有差异都能显示出来,因而便于对两个统计对象进行比较.而折线图则便于分析比较统计对象的波动情况.如果要展示的是一个整体内部各部分之间的比例或者各部分在整体中所占的百分数,那么你可以选择采用圆形图或称饼图.此外还有柱形图等.这些图形的制作可以用Excel软件来进行制作,有兴趣的读者可尝试操作一下!通过这些工作,那许多的数字就不再杂乱无章了!解题规律 解决概念题一定要在理解的基础上加以处理.本题考查了频数、频率和累积频率三者之间的关系的应用;还体现了根据累积频率分布图来估计总体信息的思想方法.在本题中涉及到一个概念,就是累积频率的概念,教材中没有出现,但这个概念并不难理解,而且累积频率折线图的作法与频率折线图的作法是一样的. 另外,由于折线图是由一系列的线段首尾相连而成,每一段都是相应的直线的一部分,因此在处理本题的第(3)问时就用到了直线方程的有关知识,这也充分体现了数形结合的思想,所以在学习时既要掌握理解当前所学知识,也要注意与前面所学知识之间的联系. 此外对本题还应该对这几种表示方法进行思考,并能通过此题感受到:频率分布表数据翔实、具体,频率直方图形象直观,对比效果强烈,频率折线图能反映发展变化的趋势.思维诊断假如是由两个不同的研究小组分别抽样,那么是否能得到相同的样本?对总体的估计是否一定相同?是否有很大的差异?能否进行说明呢?另外图形语言与文字语言以及数学语言三者之间的转化你认识得又怎么样呢?知识拓展 已知某随机变量x的频率率密度曲线如图,则总体在上的概率为_.解题规律 从茎叶图可以看出所有的数据信息都可以从图中看出来,便于记录和处理.但在画图时茎要按照从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.它是另一种处理数据的方法. 教材中还列举了一个对象的数据处理茎叶图.其实茎叶图不仅可以处理一个或两个对象的数据统计,还可以处理多个对象的数据统计.体验探究 一、 科海拾贝近代统计学 近代统计学指的是18世纪末到19世纪末的描述统计学,其发展过程与概率论的广泛研究和应用密切相关.目前在统计分析中经常使用的一些基本方法和术语都始于这一个时期,比如:最小平方法、正态分布曲线、误差计算等等.在近代统计发展的一百年中,也形成了许多学派,其中以数理统计学派和社会统计学派最为著名.数理统计学派的原创始人是比利时的A凯特靳,其最大的贡献就是将法国的古典概率引入统计学,用纯数学的方法对社会现象进行研究;社会统计学派的首倡者是德国的K克尼斯,他认为统计研究的对象是社会现象,研究方法为大量观察法.在近代统计学的发展过程中,这两学派的矛盾是比较大的.例5 杭州五丰速冻食品消费者研究(2001年3月杭州实施)这是一次入户访问,在询问消费者“通常情况下,你购买速冻食品时会选择大、中、小什么包装?”并给出大、中、小的规格标准,在此基础上追问“每包的价格一般是多少?” 下面是统计中的茎叶图,它表示出“消费者购买每包速冻食品的价格分布状况”。其中茎部数字表示人民币“元”,叶部数字表示人民币“角”。图中茎部2表示2元,相应的叶部表示0、5、8分别表示为2.0元、2.5元、2.8元。 1 . 2 . 000000558 3 . 000000000000000055 4 . 000000000000000000000000055558 5 . 0000000000000000000000000000000000 6 . 00000000055 7 . 00000 8 . 000000 9 . 00 10 . 00000000000000000 11 . 0 从上图中你可以得到什么信息?二、合作探究解答:这是一个实际问题,购买每包速冻食品价格的茎叶图可以很直观地说明,消费者购买每包速冻食品的花费主要集中在5元和4元上,最为集中的是5元,其次是4元左右.通过调查有助于生产厂家科学合理的制定商品价格、生产计划,从而追求最大的生产利润. 三、智慧列车例6 教材中有这么一句话:“茎叶图表示三位数以上的数据时不够方便”.果真如此吗?请看下例:342342346344343339336342347340340350340336341339346338342346340346346345344350348342340356339348338342347347344343339341348341340340342337344340344346342344345338341348345339343345346344344344343345345350353345352350345343347343350343350344343348342344345349332343340346342335349343344347341346341362现在能否用茎叶图来表示上述数据呢?思路分析 从上述数据可以看到它们的百位数字都是3,所不同的仅仅是十位和个位,而两位数据的茎叶图是可以作的,那么这时只需在茎的位置写上百位和十位,叶的位置上写上个位即可. 解答 上述数据的茎叶图如下:33 2 33 5 33 667 33 88899999 34 000000000111111 34 2222222222333333333334 444444444444555555555 34 6666666667777734 8888899 35 000000236 36 2 评注本题的数据有一定的特殊性.一般地茎叶图可用专业的MINITAB软件绘制.另外本图中茎“34”有四行,这主要是为了美观的需要,不然写在一行太长了,不好看.例7 某电信部门执行的新的电话
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年煤气安全操作面试题及参考答案
- 2025年智慧仓储技术应用专家考试题库及答案全解
- 2025年人力资源管理师初级面试题集锦
- 2025年旅游行业营销策划师招聘笔试模拟题集
- 2025年财务会计实操模拟题集及账务处理技巧含答案
- 2025年物联网技术中级工程师面试题详解及答题技巧
- 2025年护士执业资格中级考试模拟试题及参考答案详解
- 2025年特岗教师招聘考试初中政治面试高分突破策略
- 2025年物资供应链管理与运营实务手册及模拟题集
- 人物描写课件教学设计
- 2025年公安局招聘警务辅助人员考试笔试试题(含答案)
- 工厂车间设备维修维护管理手册
- 奶茶店安全知识培训课件
- 高中英语定语从句超全解析
- 肥胖儿童的运动干预 4
- 中国淘宝村研究报告
- 纺织行业主要工艺流程和用水环节
- DB62∕T 3083-2017 HF永久性复合保温模板现浇混凝土建筑保温体系技术规程
- 现浇梁劳务分包合同
- 人教版八年级下册英语单词表默写版(直接打印)
- Q∕GDW 12070-2020 配电网工程标准化设计图元规范
评论
0/150
提交评论