




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、总体分布估计教学目的:1 了解当总体中的个体取不同数值很少时, 可用频率分布表或频率分布条形图估计总体分布,并会用这两种方式估计总体分布;了解当总体中的个体取不同数值较多, 甚至无限时,可用频率分布表或频率分布直方图估计总体分布,并会用这两种方式估计总体分布教学重点: 用样本的频率分布估计总体分布教学难点: 频率分布表和频率分布直方图的绘制内容分析 :统计学中有两个核心问题, 一是如何从整体中抽取样本?二是如何用样本估计总体?经过前面的学习, 我们已经了解了一些常用的抽样方法 本节课,我们在初中学过样本的频率分布的基础上,研究总体的分布及其估计教学过程 :一、复习引入:1. 简单随机抽样: 设
2、一个总体的个体数为 n如果通过逐个抽取的方法从中抽取一个样本, 且每次抽取时各个个体被抽到的概率相等, 就称这样的抽样为简单随机抽样 用简单随机抽样从含有 n个个体的总体中抽取一个容量为 n 的样本时,每次抽取一个个体时任一个体被抽到的概率为1 ;在整个抽样过程中n各个个体被抽到的概率为n ; 简单随机抽样的特点是,逐个抽取,且各个个n体被抽到的概率相等; 简单随机抽样方法,体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础 (4). 简单随机抽样的特点: 它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样2. 抽签法: 先将总体中的所有个体(共有 n 个)编号(号码可从 1 到 n)
3、,并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里, 进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取 n 次,就得到一个容量为 n 的样本适用范围:总体的个体数不多时优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法3. 随机数表法 : 随机数表抽样“三步曲” :第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码4.系统抽样 : 当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先定出的规则, 从每一部分抽取一个个体, 得到需要的样本, 这种抽样叫做系统抽样 系统抽样的步骤: 采用随机的方式将总体中的
4、个体编号 为简便起见,有时可直接采用个体所带有的号码, 如考生的准考证号、 街道上各户的门牌号,等等 为将整个的编号分段 (即分成几个部分),要确定分段的间隔 k 当 n n( n为总体中的个体的个数, n 为样本容量)是整数时,k= n ; 当 n 不是整数时,nn第 1页共 6页通 从 体中剔除一些个体使剩下的 体中个体的个数 n 能被 n 整除, k= n . 在第一段用 随机抽 确定起始的个体 号 l 按照事先确定的 n抽取 本(通常是将 l 加上 隔 k,得到第 2 个 号 l +k, 第 3 个 号 l +2k, 下去,直到 取整个 本)系 抽 适用于 体中的个体数 多的情况,它与
5、 随机抽 的 系在于:将 体均分后的每一部分 行抽 ,采用的是 随机抽 ;与 随机抽 一 ,系 抽 是等概率抽 ,它是客 的、公平的 体中的个体数恰好能被 本容量整除 ,可用它 的比 作 系 抽 的 隔;当 体中的个体数不能被 本容量整除 , 可用 随机抽 先从 体中剔除少量个体,使剩下的个体数能被 本容量整除在 行系 抽 5.分 抽 : 当已知 体由差异明 的几部分 成 , 了使 本更充分地反映 体的情况,常将 体分成几部分,然后按照各部分所占的比例 行抽 , 种抽 叫做分 抽 ,所分成的部分叫做 6. 不放回抽 和放回抽 : 在抽 中, 如果每次抽出个体后不再将它放回 体,称 的抽 不放回
6、抽 ;如果每次抽出个体后再将它放回 体,称 的抽 放回抽 随机抽 、系 抽 、分 抽 都是不放回抽 7. 分布列 :x1x2xipp1p2pi分布列的两个性 : pi 0,i 1,2,; p1+p2+=1 二、 解新 : 率分布表或 率分布条形 史上有人通 作抛 硬 的大量重复 ,得到了如下 果: 果 数 率正面向上 (0)361240.5011反面向上 (1)359640.4989抛 硬 的 果的全体构成一个 体, 上表就是从 体中抽取容量 72088 的相当大的 本的 率分布表尽管 里的 本容量很大,但由于不同取 有2 个(用0 和 1 表示),所以其 率分布可以用上表和右面的条形 表示其
7、中条形 是用高来表示取各 的 率 明: 率分布表在数量表示上比 确切,而 率分布条形 比 直 ,两者相互 充,使我 数据的 率分布情况了解得更加清楚各 条的 度要相同; 相 条之 的要适当 果当 次数无限增大 ,两种 正面向上 ( 记为 率 就成 相 的概率,得到右表,抽 造成的 差,精确地反映了 体取 的反面向上 ( 记为间 隔概率0)05果的除 了1)05概 率第 2页共 6页分布规律这种整体取值的概率分布规律通常称为总体分布 .说明:频率分布与总体分布的关系:通过样本的频数分布、频率分布可以估计总体的概率分布.研究总体概率分布往往可以研究其样本的频数分布、频率分布.2.总体分布: 总体取
8、值的概率分布规律在实践中,往往是从总体中抽取一个样本,用样本的频率分布去估计总体分布 一般地,样本容量越大,这种估计就越精确3. 总体密度曲线 : 样本容量越大, 所分组数越多, 各组的频率就越接近于总体在相应各组取值的概率 设想样本容量无限增大, 分组的组距无限缩小, 那么频率分布直方图就会无限接近于一条光滑曲线 , 这条曲线叫做 总体密度曲线 频率 /组距总体密度曲线单位oab它反映了总体在各个范围内取值的概率根据这条曲线,可求出总体在区间 (a,b内取值的概率等于总体密度曲线,直线x a,x b 及 x 轴所围图形的面)=积三、讲解范例:例 1为了了解某地区高三学生的身体发育情况,抽查了
9、地区内 100 名年龄为 17.5 岁18 岁的男生的体重情况 , 结果如下 ( 单位 :kg)56.569.56561.564.566.56464.57658.57273.556677057.565.56871756268.562.56659.563.564.567.57368557266.574636055.57064.5586470.55762.5656971.573625876716663.55659.563.5657074.568.56455.572.566.5687657.56071.55769.57464.55961.5676863.5585965.562.569.57264.5
10、75.568.5646265.558.567.570.5656666.5706359.5试根据上述数据画出样本的频率分布直方图, 并对相应的总体分布作出估计解 : 按照下列步骤获得样本的频率分布 .(1) 求最大值与最小值的差 . 在上述数据中, 最大值是 76,最小值是 55,它们的差 ( 又称为极差 ) 是 7655=21)所得的差告诉我们,这组数据的变动范围有多大 .(2) 确定组距与组数 . 如果将组距定为 2,那么由 212=10.5 ,组数为 11,这个组数适合的 . 于是组距为 2,组数为 11.第 3页共 6页(3)决定分点 . 根据本例中数据的特点,第 1 小 的起点可取 5
11、4.5 ,第 1 小 的 点可取 56.5 , 了避免一个数据既是起点,又是 点从而造成重复 算,我 定分 的区 是“ 左 右开 ”的 . ,所得到的分 是 54.5 ,56.5 ),56.5 ,58.5 ),74.5 ,76.5 ) .( 4)列 率分布表 , 如表 率分布表分 数累 数 率54.5 ,56.5 )20.0256.5 ,58.5 )60.0658.5 ,60.5 )100.1060.5 ,62.5 )100.1062.5 ,64.5 )140.1464.5 ,66.5 )160.1666.5 ,68.5 )130.1368.5 ,70.5 )110.1170.5 ,72.5
12、)80.0872.5 ,74.5 )70.0774.5 ,76.5 )30.03合 1001.00( 5) 制 率分布直方 . 率分布直方 如 所示频率 / 组距54.556.558.560.562.564.566.568.570.572.574.576.5体重由于 中各小 方形的面 等于相 各 的 率, 个 形的面 的形式反映了数据落在各个小 的 率的大小. 在反映 本的 率分布方面, 率分步表比 确切, 率分布直方 比 直 ,它 起着相互 充的作用.在得到了 本的 率后, 就可以 相 的 体情况作出估 . 例如可以估 ,体重在( 64.5 , 66.5 )kg 的学生最多, 占学生 数的1
13、6%;体重小于 58.5kg的学生 少, 占 8%;等等例 2 某 子元件 行寿命追踪 ,情况如下:寿命()100200 300 400500200300400500600个数2030804030出 率分布表;()画出 率分布直方 和累 率分布 ;()估 子元件寿命在100 400以内的概率;第 4页共 6页()估计电子元件寿命在400以上的概率;()估计总体的数学期望值频率解:()寿命频数频率累计频率组距100 200200.10.10200 300300.150.25300 400800.400.65400 500400.200.85500 600300.151合计2001100 200
14、300 400 500 600寿命频率分布直方图()频率分布直方图如右和累计频率分布图如下累 计频率10.800.600.400.200.100100 200 300 400 500 600寿命()频率分布图可以看出,寿命在 100 400的电子元件出现的频率为 0.65 ,所以我们估计电子元件寿命在 100 400的概率为 0.65()由频率分布表可知,寿命在400以上的电子元件出现的频率为0.20+0.15 0.35 ,故我们估计电子元件寿命在400以上的概率为0.35()样本的期望值为1002002003003004004005000.100.150.4020.20222所以,我5006
15、000.151537.51409082.53652们估计总体生产的电子元件寿命的期望值(总体均值)为 365四、课堂练习 :1 . 为检测某种产品的质量,抽取了一个容量为 30 的样本,检测结果为一级品 5 件,二级品 8 件,三级品 13 件,次品 14 件列出样本频率分布表;画出表示样本频率分布的条形图;根据上述结果,估计此种商品为二级品或三级品的概率约是多少?第 5页共 6页解:样本的频率分布表为产品频数频率一级品50.17二级品80.27三级品130.43次品40.13样本频率分布的条形图如右:此种产品为二极品或三极品的概率为0.27+0.43=0.72. 如下表:分 组频数频率分 组
16、频数频率10.75,10.85)311.25, 11.35)2010.85,10.95)911.35,11.45)710.95,11.05)1311.45,11.55)411.05,11.15)1611.55,11.65)211.15,11.25)26合 计100完成上面的频率分布表根据上表,画出频率分布直方图根据上表,估计数据落在10.95 ,11.35) 范围内的概率约为多少 ?答案: 略数据落在 10.95 ,11.35) 范围的频率为 0.13+0.16+0.26+0.20=0.75 落在 10.95 ,11.35) 内的概率约为 075五、小结:用样本的频率分布估计总体分布,可以分成两种情况讨论:当总体中的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年纺织品设计师证书考试培养的能力试题及答案
- 初二英语提高试题及答案
- 2024年纺织工程师市场竞争策略试题及答案
- 广告设计的理念与方法论研究 试题及答案
- 幻想情景测试题及答案
- 2024年纺织品检验员备考攻略试题及答案
- 2024年纺织工程师考试试题及答案
- 2024年纺织品设计师证书考试中成功的关键要素试题及答案
- 本科国际公法试题及答案
- 农业区位因素试题及答案
- 2023年福建三明市初中毕业班数学质量检测卷(附答案)
- 现金盘点表完整版
- 金蝶固定资产管理系统
- LY/T 2457-2015西南桦培育技术规程
- GB/T 40998-2021变性淀粉中羟丙基含量的测定分光光度法
- GB/T 25840-2010规定电气设备部件(特别是接线端子)允许温升的导则
- 军标类型整理文档
- FZ/T 52019-2011莱赛尔短纤维
- 止血包扎(课件)
- 2022年湖南高二学业水平合格考试政治试卷真题及答案详解
- 投行业务二o一五年度经营绩效考核办法
评论
0/150
提交评论