用样本的频率分布估计总体的分布.ppt_第1页
用样本的频率分布估计总体的分布.ppt_第2页
用样本的频率分布估计总体的分布.ppt_第3页
用样本的频率分布估计总体的分布.ppt_第4页
用样本的频率分布估计总体的分布.ppt_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

11 4 1用样本的频率分布估计总体分布 复习旧知识 1 随机抽样包括哪几种 2 简单随机抽样又包括几种方法 适用于什么样的个体 一般步骤 优点和缺点 3 系统抽样适用于什么样的个体 一般步骤 优点和缺点 4 分层抽样适用于什么样的个体 一般步骤 优点和缺点 复习旧知识 1 抛掷硬币的大量重复试验的频率分布表 0 5011 0 4989 样本容量为72088 什么叫频率分布条形图 频数 频率 正面向上 记为0 反面向上 记为1 注意点 各直方长条的宽度要相同 宽窄与频率无关 相邻长条之间的间隔要适当 条形图的高度就是频率 当试验次数无限增大时 两种试验结果的频率就成为相应的概率 排除了抽样造成的误差 精确地反映了总体取值的概率分布规律 这种总体取值的概率分布规律称为总体分布 1 频率分布与总体分布的关系 通过样本的频数分布 频率分布可以估计总体的概率分布 研究总体概率分布往往可以研究其样本的频数分布 频率分布 2 总体分布 总体取值的概率分布规律在实践中 往往是从总体中抽取一个样本 用样本的频率分布去估计总体分布一般地 样本容量越大 这种估计就越精确 练习 1 在100名学生中 每人参加一个运动队 其中参加田径队的有13人 参加体操队的有10人 参加足球队的有24人 参加篮球队的有27人 参加排球队的有15人 参加乒乓球队的有11人 1 列出学生参加各运动队的频率分布表 2 画出表示频率分布的条形图 解 频率分布表如下 频率分布条形图如下 频率 结果 例某市政府为了节约生活用水 计划在本市试行居民生活用水定额管理 即确定一个居民月用水量标准a 用水量不超过a的部分按平价收费 超过a的部分按议价收费 如果希望大部分居民的日常生活不受影响 那么标准a定为多少比较合理呢 为了较合理地确定这个标准 你认为需要做哪些工作 思考 由上表 大家可以得到什么信息 通过抽样 我们获得了100位居民某年的月平均用水量 单位 t 如下表 1 求极差 即一组数据中最大值与最小值的差 2 决定组数与组距 组数 4 3 0 2 4 1 3 决定分点 0 0 5 0 5 1 4 4 5 组数 将数据分组 当数据在100个以内时 按数据多少常分5 12组 组距 指每个小组的两个端点的距离 4 列频率分布表 100位居民月平均用水量的频率分布表 注意 这里出来了条形图中条形的宽度 频率不仅与条形的高度有关 而且与它的宽度有关 为了使选择不同宽度的总体分布相同 我们用另一种图形表示 即直方图 用面积表示概率 5 绘制频率分布直方图 小长方形的面积 组距 频率 注意 这里的纵坐标不是频率 而是频率 组距 某个区间上的概率用这个区间的面积表示 直方图 思考 所有小长方形的面积之和等于 探究 同样一组数据 如果组距不同 横轴 纵轴的单位不同 得到的图的形状也会不同 不同的形状给人以不同的印象 这种印象有时会影响我们对总体的判断 分别以1和0 1为组距重新作图 然后谈谈你对图的印象 一 求极差 即数据中最大值与最小值的差 二 决定组距与组数 组距 极差 组数 三 分组 通常对组内数值所在区间 取左闭右开区间 最后一组取闭区间 四 登记频数 计算频率 列出频率分布表 画一组数据的频率分布直方图 可以按以下的步骤进行 五 画出频率分布直方图 纵轴表示频率 组距 频率分布直方图如下 连接频率分布直方图中各小长方形上端的中点 得到频率分布折线图 利用样本频分布对总体分布进行相应估计 3 当样本容量无限增大 组距无限缩小 那么频率分布直方图就会无限接近于一条光滑曲线 总体密度曲线 2 样本容量越大 这种估计越精确 1 上例的样本容量为100 如果增至1000 其频率分布直方图的情况会有什么变化 假如增至10000呢 当样本容量无限增大 分组的组距无限缩小 那么频率分布直方图就会无限接近一条光滑曲线 总体密度曲线 总体在区间内取值的概率 S 图中阴影部分的面积 表示总体在某个区间 a b 内取值的百分比 用样本分布直方图去估计相应的总体分布时 一般样本容量越大 频率分布直方图就会无限接近总体密度曲线 就越精确地反映了总体的分布规律 即越精确地反映了总体在各个范围内取值百分比 总体密度曲线反映了总体在各个范围内取值的百分比 精确地反映了总体的分布规律 是研究总体分布的工具 总体密度曲线 1 离散型 当总体中的个体所取的不同数值较少时 其随机变量是离散型的 试验结果 频数 频率 频率 试验结果 0 1 条形图 小结 2 连续型 当总体中的个体所取的数值较多 甚至无限时 其随机变量是连续型的 分组 频数 频率 产品尺寸 25 295 25 355 频率分布直方图 累积频率 频率分布表 离散型随机变量 指变量的取值是有限个 或者无限可列个 有限个 比如你身边有10个朋友 那么你要得到他们的身高 他们身高作为一个变量的时候只能有10个取值 这十个值就是离散的 你可以把它们一一写出来 对于无限可列个 比如有个随机变量x x可以取得值是自然数 也就是说x可以取到1 2 3 n 虽然有无穷多 但是你可以把它们按照某种规律列出来 或者说 存在这样的两个x取值 按照某种规律排定之后 它们之间不允许再存在x其它取值 那么x也是离散的 如果x的取值是实数的话 那么就是不可列的 x就变成了连续性变量 3 频率分布条形图和频率分布直方图 两者是不同的概念 虽然它们的横坐标表示的内容是相同的 但是频率分布条形图的纵轴 矩形的高 表示频率 频率分布直方图的纵轴 矩形的高 表示频率与组距的比值 其相应组距上的频率等于该组距上的面积 如果当地政府希望85 以上的居民每月的用水量不超出标准 根据频率分布表和频率分布直方图 你能对制定月用水量提出建议吗 你认为3吨这个标准一定能够保证85 以上的居民用水量不超过标准吗 例题 一个容量为100的样本 数据的分组和各组的相关信息如下表 试完成表中每一行的两个空格 0 06 0 06 8 0 14 0 16 16 0 21 0 51 0 18 18 0 16 0 85 10 0 95 0 05 5 例1 对某电子元件进行寿命追踪调查 情况如下 1 列出频率分布表 2 画出频率分布直方图 3 估计电子元件寿命在100h 400h以内的概率 4 估计电子元件寿命在400h以上的概率 应用举例 1 列出频率分布表 茎叶图 情境 某赛季甲 乙两名篮球运动员每场比赛得分的原始记录如下 1 甲运动员得分 13 51 23 8 26 38 16 33 14 28 39 2 乙运动员得分 49 24 12 31 50 31 44 36 15 37 25 36 39 问题 如何有条理地列出这些数据 分析该运动员的整体水平及发挥的稳定程度 茎叶图 甲 乙 012345 2554161679490 8463683891 一般地 当数据是一位和两位有效数字时 用中间的数字表示十位数 即第一个有效数字 两边的数字表示个位数 即第二个有效数字 它的中间部分像植物的茎 两边部分像植物茎上长出来的叶子 因此通常把这样的图叫做茎叶图 茎按从小到大的顺序从上向下列出 共茎的叶一般按从大到小 或从小到大 的顺序同行列出 1 茎叶图的概念 2 茎叶图的特征 用茎叶图表示数据有两个优点 一是从统计图上没有原始数据信息的损失 所有数据信息都可以从茎叶图中得到 二是茎叶图中的数据可以随时记录 随时添加 方便记录与表示 茎叶图只便于表示两位 或一位 有效数字的数据 对位数多的数据不太容易操作 而且茎叶图只方便记录两组的数据 两个以上的数据虽然能够记录 但是没有表示两个记录那么直观 清晰 茎叶图对重复出现的数据要重复记录 不能遗漏 3画茎叶图的步骤 第一步 将每个数据分为 茎 高位 和 叶 低位 两部分 第二步 将最小的茎和最大的茎之间的数按大小次序排成一列 写在左 右 侧 第三步 将各个数据的叶按大小次序写在茎右 左 侧 注意 在制作茎叶图时 重复出现的数据要重复记录 不能遗漏 特别是 叶 部分 同一数据出现几次 就要在图中体现几次 用茎叶图表示数据有两个突出的优点 一 没有原始信息的损失 所有的数据信息都可以从这个茎叶图上得到 二 茎叶图便于记录 添加和表示 用茎叶图表示数据有两个突出的缺点 一 只便于表示两位有效数字的数据 二 虽然可以表示两个以上的记录 但没有表示两个记录那么直观 清晰 1 求极差 即一组数据中最大值与最小值的差 知道这组数据的变动范围4 3 0 2 4 1 2 决定组距与组数 将数据分组 3 将数据分组 8 2取整 分为9组 小结 一 画频率分布直方图的步骤 4 列出频率分布表 填写频率 组距一栏 5 画出频率分布直方图 组距 指每个小组的两个端点的距离 组距组数 将数据分组 当数据在100个以内时 按数据多少常分5 12组 注意 纵坐标为 二 总体密度曲线 1 当样本容量无限增大 组距无限缩小 那么频率分布直方图就会无限接近于一条光滑曲线 总体密度曲线 2 用样本分布直方图去估计相应的总体分布时 一般样本容量越大 频率分布直方图就会无限接近总体密度曲线 就越精确地反映了总体的分布规律 即越精确地反映了总体在各个范围内取值百分比 三 茎叶图 茎叶图 类似直方图 但又与直方图不同 它的思路是将数组的数按位数进行比较 将数大小基本不变或变化不大的位作为一个主杆 茎 将变化大的位的数作为分枝 叶 列在主杆的后面 这样就可以清楚地看到每个主杆后面的几个数 每个数具体是多少 茎叶图在质量管理上用途与直方图差不多 但它通常是作为更细致的分析阶段使用 由于它是用数字组成直方图 所以在做的时候比直方图还 通常我们常使用专业的软件进行绘制 几种表示频率分布的方法的优点和不足 1 频率分布表在数量上比较确切 但不够直观 形象 分析数据分布的总体态势不太方便 2 频率分布直方图能够很容易地表示大量数据 非常直观地表明分布的形状 使我们能够看到分布表中看不清楚的数据模式 但是从直方图本身

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论