




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2.2 2.2 总体分布的估计总体分布的估计统计的基本思想方法: 用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本从总体中抽取一个样本,根据样本的根据样本的情况去估计总体的相应情况情况去估计总体的相应情况. .统计的核心问题: 如何根据样本的情况对总体的情况作出一种推断. 这里包括两类问题:一类是如何从总体中抽取样本? 另一类是如何根据对样本的整理、计算、另一类是如何根据对样本的整理、计算、分析分析, ,对总体的情况作出推断对总体的情况作出推断.问题某班40名同学在一次测验中的成绩如下: 73 69 77 66 84 78 48 78 73 85 98 81 52 96 7
2、3 65 85 79 100 63 88 57 99 71 79 83 67 78 75 74 71 89 76 74 50 62 92 87 77 64现在我想弄清这些同学的成绩分布情况,该怎么办? 各分点比所给数据多取一位小数的原因是:为了使数据不落在分点上,从而明确它们究竟属于哪一组。分数段人数与全班人数的比40.550.520.0550.560.520.0560.570.570.17570.580.5160.4080.590.580.2090.5100.550.125分数段人数与全班人数的比40.550.5250.560.5260.570.5770.580.51680.590.5890
3、.5100.55分数段人数与全班人数的比40.550.550.560.560.570.570.580.580.590.590.5100.5分数段人数与全班人数的比学生分数分布表(频率分布表)学生分数分布统计图(频率分布直方图)用样本估计总体用样本估计总体 用样本估计总体用样本估计总体(两种):两种): 一种是:用样本的频率分布估计总体的一种是:用样本的频率分布估计总体的分布。分布。 另一种是:用样本的数字特征(平均数另一种是:用样本的数字特征(平均数标准差等)估计总体的数字特征。标准差等)估计总体的数字特征。用样本的频率分布估计总体分布用样本的频率分布估计总体分布一一 频率分布图和频率分布直方
4、图频率分布图和频率分布直方图2频率分布折线图和总体密度曲线频率分布折线图和总体密度曲线三 茎叶图(茎叶图(stem-and-leaf display)探究探究:我国是世界上严重缺水的我国是世界上严重缺水的 国家之一,城市国家之一,城市缺水问题较为突出。某市政府为了节约用缺水问题较为突出。某市政府为了节约用水,计划在水,计划在 本市试行居民生活用水定额管本市试行居民生活用水定额管理,即确定一个居民月用水量标准理,即确定一个居民月用水量标准a,用水用水量不超过量不超过a的按平价收费,超过的按平价收费,超过 a的按议价的按议价收费。如果希望大部分居民的收费。如果希望大部分居民的 日常生活不日常生活不
5、受影响,那么标准受影响,那么标准a定为多少比较合理?定为多少比较合理?你认为,为了较为合理地确定出这个标准,你认为,为了较为合理地确定出这个标准,需要做什么工作?需要做什么工作?根据这些数据根据这些数据你能得出用水你能得出用水量其他信息吗量其他信息吗?表表21 100位居民的月均用水量位居民的月均用水量 (单位(单位 :t ) 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1
6、.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 表表22 100位居民月均用水量的位居民月均用水量的 频率分布表频率分布表 分组分
7、组 频数累计频数累计 频数频数 频率频率 0 , 0.5) 4 0.04 0.5 , 1) 8 0.08 1 , 1.5) 15 0.15 1.5 , 2) 22 0.22 2 , 2.5) 25 0.25 2.5 , 3) 14 0.14 3 , 3.5) 6 0.06 3.5 , 4) 4 0.04 4 , 4.5) 2 0.02 合计合计 100 1.0000.511.522.53 3.5 4 4.50.500.400.300.200.10频率频率/组距组距月均用水量月均用水量 /t注:小长方形的面积组距注:小长方形的面积组距频率频率/组距频率组距频率 各长方形的面积总和等于各长方形的面
8、积总和等于1。1、求极差、求极差(即一组数据中最大值与最小值的差即一组数据中最大值与最小值的差) 知道这组数据的变动范围知道这组数据的变动范围4.3-0.2=4.12、决定组距与组数(将数据分组)、决定组距与组数(将数据分组)3、 将数据分组将数据分组(8.2取整取整,分为分为9组组)画频率分布直方图的步骤画频率分布直方图的步骤4、列出、列出频率分布表频率分布表.(学生填写频率学生填写频率/组距一栏组距一栏)5、画出、画出频率分布直方图频率分布直方图。组距组距:指每个小组的两个端点的距离,组距指每个小组的两个端点的距离,组距组数组数:将数据分组,当数据在将数据分组,当数据在100个以内时,个以
9、内时, 按数据多少常分按数据多少常分5-12组。组。4.18.20.5极差组数=组距例例. .从规定尺寸为从规定尺寸为25.40mm25.40mm的一堆产品中任取的一堆产品中任取 100100件,测得尺寸如下:件,测得尺寸如下: 25.39 25.36 25.34 25.42 25.45 25.38 25.39 25.42 25.4725.35 25.41 25.43 25.44 25.48 25.45 25.43 25.46 25.4025.51 25.45 25.40 25.39 25.41 25.36 25.38 25.31 25.56 25.43 25.40 25.38 25.37 2
10、5.44 25.33 25.46 25.40 25.4925.34 25.42 25.50 25.37 25.35 25.32 25.45 25.40 25.2725.43 25.54 25.39 25.45 25.43 25.40 25.43 25.44 25.41 25.53 25.37 25.38 25.24 25.44 25.40 25.36 25.42 25.39 25.46 25.38 25.35 25.31 25.34 25.40 25.36 25.41 25.3225.38 25.42 25.40 25.33 25.37 25.41 25.49 25.35 25.47 25.3
11、4 25.30 25.39 25.46 25.29 25.40 25.37 25.33 25.40 25.35 25.41 25.37 25.37 25.47 25.39 25.42 25.47 25.38 25.39样本的频率分布表示形式有:样本的频率分布表示形式有: 频率分布表频率分布表和和频率分布直方图频率分布直方图一一、计算最大值与最小值的差(也称极差),计算最大值与最小值的差(也称极差),从而知道这组数据的变动范围。从而知道这组数据的变动范围。二、决定组距与组数(将数据分组)二、决定组距与组数(将数据分组)组距:组距:指每个小组的两个端点的距离,指每个小组的两个端点的距离,组距组距=
12、极差极差/组数组数列出频率分布表、画频率分布直方图的方法列出频率分布表、画频率分布直方图的方法极差为:极差为:25.56 25.24=0.32三三. .决定分点决定分点 可以令分点比数据多可以令分点比数据多1 1位小数,并且把第位小数,并且把第1 1小组的小组的起点稍微减少一点起点稍微减少一点组数:组数:将数据分组,当数据在将数据分组,当数据在100100个以内时,个以内时, 按数据多少分成按数据多少分成5 51212组组 分分 组组个数累计个数累计频频 数数 频频 率率累计频率累计频率25.235,25.265)一一10.010.0125.265,25.295) T20.020.0325.2
13、95,25.325)正正50.050.0825.325,25.355)正正正正 T120.120.2025.355,25.385)正正正下正正正下180.180.3825.385,25.415)正正正正正正正正正正250.250.6725.415,25.445)正正正一正正正一160.160.7925.445,25.475)正正下正正下130.130.9225.475,25.505)TT40.040.9625.505,25.535)T20.020.9825.535,25.565)T20.021.00 合计合计1001.00四四. .列出频率分布表列出频率分布表频率频率/组距组距产品尺寸产品尺寸
14、(mm)五五. .画频率分布直方图画频率分布直方图注意:直方图的纵轴表注意:直方图的纵轴表示频率与组距的比值,示频率与组距的比值, =频率长方形的面积组距频率组距8.3频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5小长方形的面小长方形的面积积=?频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5小长方形的面小长方形的面积总和积总和=?频率分布直方图如下频率分布直方图如下:月均用
15、水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5月均用水量最月均用水量最多的在那个区多的在那个区间间?频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5请大家阅读第请大家阅读第68页页,直方图有直方图有那些优点和缺那些优点和缺点点?练练 习习1.有一个容量为有一个容量为50的样本数据的分组的频数如下:的样本数据的分组的频数如下:12.5, 15.5) 315.5, 18.5) 818.5, 21.5) 921.5, 24.
16、5) 1124.5, 27.5) 1027.5, 30.5) 530.5, 33.5) 4(1)列出样本的频率分布表列出样本的频率分布表;(2)画出频率分布直方图画出频率分布直方图;(3)根据频率分布直方图估计根据频率分布直方图估计,数据落在数据落在15.5, 24.5)的)的百分比是多少百分比是多少? 某校对初二年级60名15岁女学生的身高做了测量,结果如下(单位:cm):142 154 159 175 159 156 149 162 166158 159 156 166 160 164 155 157 146147 161 158 158 153 158 154 158 163154 15
17、3 153 162 162 151 154 165 164152 151 146 151 158 160 165 158 163163 162 161 154 165 162 162 159 157159 149 164 149 159 153列出频率分布表,绘出频率分布直方图。例题已知一组数据如下:25 21 23 25 27 29 25 28 30 2926 24 25 27 26 22 24 25 26 28填写下面的频率分布表,绘出频率分布直方图。组别频数累计频数频率20.522.522.524.524.526.526.528.528.530.5 合计练习一红星养猪场400头猪的质量频
18、率分布直方图如图,其中数据不在分点上。按图回答:1)质量在 组里的猪最多,有 头。2)质量在60.5kg以上的猪有 头。3)这400头猪的总质量约 kg,平均质量约是 kg。4004000.4=1600.4=16055.555.560.560.5400400(0.2+0.08+0.02)=120(0.2+0.08+0.02)=120组组平均值每组头数每组总质量45.550.54840192050.555.55380424055.560.558160928060.565.56380504065.570.56832217670.575.5738584总质量232402324023240232402
19、3240400=58.1400=58.1练习二如 果 用 n 表 示 样 本 容 量 , 分 别 用it,if表 示 频 率 分 布 表 中 第i组 的 频 数 和 频率 , 你 能 用 公 式 表 示 出 样 本 容 量 、 频 数和 频 率 之 间 的 关 系 吗 ? 各 组 的 频 数 和 等于 几 ? 各 组 的 频 率 和 呢 ? ntfii)1( ntttn.)2(21 1.)3(21nfff 想一想频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5连接频率分布直方图连接频率
20、分布直方图中各小长方形上端的中各小长方形上端的中点中点,得到得到频率分布折频率分布折线图线图0.511.522.53 3.5 44.50.20频率频率/组距组距0月均用水量月均用水量 /t0.500.400.300.10图图2.22 100位居民的月均用水量的频率分位居民的月均用水量的频率分布折线图布折线图利用样本频率分布对总体分布进行相应估利用样本频率分布对总体分布进行相应估计计(3)当样本容量无限增大,组距无限缩小,)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑那么频率分布直方图就会无限接近于一条光滑曲线曲线总体密度曲线总体密度曲线。(2)样本容量越大,这种估
21、计越精确。)样本容量越大,这种估计越精确。(1)上例的样本容量为)上例的样本容量为100,如果增至,如果增至1000,其频率分布直方图的情况会有什么变化?假如增其频率分布直方图的情况会有什么变化?假如增至至10000呢?呢?月均用水量月均用水量/t频率频率组距组距0ab总体密度曲线能够很好的反映总体在各个范围总体密度曲线能够很好的反映总体在各个范围内的百分比,能构提供更准确的信息。尽管有些内的百分比,能构提供更准确的信息。尽管有些总体密度曲线是客观存在的,但是很难象函数图总体密度曲线是客观存在的,但是很难象函数图象那样准确的地画出来。象那样准确的地画出来。?思考一下图中阴影部分的面积表示什么?
22、思考一下图中阴影部分的面积表示什么? 用样本分布直方图去估计相应的总体分布时,用样本分布直方图去估计相应的总体分布时,一般样本容量越大,一般样本容量越大,频率分布直方图频率分布直方图就会无限接就会无限接近近总体密度曲线总体密度曲线,就越精确地反映了总体的分布,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值规律,即越精确地反映了总体在各个范围内取值百分比。百分比。 总体密度曲线反映了总体在各个范围内取值的总体密度曲线反映了总体在各个范围内取值的百分比百分比,精确地反映了总体的分布规律。是研究总精确地反映了总体的分布规律。是研究总体分布的工具体分布的工具.总体密度曲线总体密度
23、曲线茎叶图茎叶图某赛季甲、乙两名篮球运动员每场比赛得分的原某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:始记录如下:(1)甲运动员得分:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(1)乙运动员得分乙运动员得分: 49,24,12,31,50,31,44,36,15,37,25,36,39 茎茎(中间一列数)取得分的十位数,(中间一列数)取得分的十位数,叶叶(两边的数)(两边的数)取得分的个位数,故称为茎叶图。取得分的个位数,故称为茎叶图。26甲甲乙乙01234584 6 33 6 83 8 9 12 55 41 6 1 6 7 94 9 01.认识茎叶
24、图,并学习如何做茎叶图?认识茎叶图,并学习如何做茎叶图?如图:茎为得分的十位数,叶为得分的个位数如图:茎为得分的十位数,叶为得分的个位数思考:思考:数据大于俩位数的数据大于俩位数的整数整数时又如何选茎,叶?时又如何选茎,叶?数据为数据为小数小数时又如何选茎,叶?时又如何选茎,叶?结论:结论:1当数据为整数时:通常个位数字在叶上,当数据为整数时:通常个位数字在叶上, 其他位数在茎上其他位数在茎上(一位数时,茎为(一位数时,茎为0)2当数据为小数时:通常小数部分在叶上,当数据为小数时:通常小数部分在叶上, 整数部分在茎上整数部分在茎上要表明茎宽stem width即可,如stem width= 0
25、.1 那么2|23478 就是代表 2.2 ,2.3 ,2.4 ,2.7 ,2.8甲的茎叶图画法甲的茎叶图画法也可以画一组数据的茎叶图,竖线也可以画一组数据的茎叶图,竖线左左边为茎边为茎, ,右右边为叶。边为叶。两组数据以上也可以分别画在一张图上,但没有两两组数据以上也可以分别画在一张图上,但没有两组数据画一起比较起来更那么直观、清晰。组数据画一起比较起来更那么直观、清晰。 0 8 1 3 6 4 2 3 6 8 3 3 8 9 4 5 127茎茎叶叶2.如何通过分析茎叶图了解总体?如何通过分析茎叶图了解总体?主要从主要从对称性,中位数(体现成绩好坏),对称性,中位数(体现成绩好坏),稳定性(
26、即集中程度)稳定性(即集中程度)来分析来分析甲甲乙乙01234584 6 33 6 83 8 9 12 55 41 6 1 6 7 94 9 0分析:分析:甲得分除甲得分除51分外大致分外大致对称对称,乙基本上也对称。,乙基本上也对称。甲的甲的中位数中位数为为26,乙的中位数为,乙的中位数为36,所以乙较甲成绩要好,所以乙较甲成绩要好,另,乙的叶较甲的更集中于峰值附近,所以乙较甲发挥另,乙的叶较甲的更集中于峰值附近,所以乙较甲发挥更更稳定稳定优点优点:1.即茎叶图保留了原始数据并展示即茎叶图保留了原始数据并展示了数据的分布情况。了数据的分布情况。2.茎叶图可以在比赛时随时记录,方便记茎叶图可以在比赛时随时记录,方便记录与表示。录与表示。缺点缺点:当样本数据较多时,茎叶图就显得不方便:当样本数据较多时,茎叶图就显得不方便3.茎叶图的优缺点茎叶图的优缺点练习练习1:某次运动会甲乙两名射击运动员的成绩(环数)某次运动会甲乙两名射击运动员的成绩(环数)如下:如下:甲:甲:9.4,8.7,7.5,8.4,10.1,10.5,10.7,7.2,7.8,10.8乙:乙:9.1,8.7,7.1,9.8,9.7,8.5,10.1,9.2,10.1,9.1(1)用茎叶图表示甲乙的成绩)用茎叶图表示甲乙的成绩(2)根据茎叶图分析甲乙的成绩根据茎叶图分析甲乙的成绩甲甲乙乙7 8 9 10 15 7 1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 现场评估及其在2025年网络规划设计师考试中的重要作用试题及答案
- 社会服务的意义与中级工作者试题及答案
- 2025年多媒体应用设计的发展机会试题及答案
- 小组讨论提高的软件评测师考试试题及答案
- 解析2025年软件评测师考试的试题
- 电子竞技俱乐部行业跨境出海项目商业计划书
- 化纤工程设计在线平台行业跨境出海项目商业计划书
- 农业生态摄影基地企业制定与实施新质生产力项目商业计划书
- 沙滩排球巡回赛行业跨境出海项目商业计划书
- 模型制作班企业制定与实施新质生产力项目商业计划书
- 2025年公路水运工程重大事故隐患判定标准深度解析
- 机器学习(山东联盟)知到智慧树章节测试课后答案2024年秋山东财经大学
- 2024年高考真题-化学(天津卷) 含解析
- 2024年可行性研究报告投资估算及财务分析全套计算表格(含附表-带只更改标红部分-操作简单)
- 湖北省石首楚源“源网荷储”一体化项目可研报告
- 交通协管员劳务外包服务方案
- 顶管工程顶进记录表
- 安全生产、环境保护监督管理制度(最终版)
- 呼吸道病原体抗体检测及临床应用课件
- 战略管理教学ppt课件(完整版)
- 太平歌词唱词
评论
0/150
提交评论