四川省开江县高中数学 第二章 统计 2.2 用样本估计总体(2)课件 新人教A版必修3.ppt_第1页
四川省开江县高中数学 第二章 统计 2.2 用样本估计总体(2)课件 新人教A版必修3.ppt_第2页
四川省开江县高中数学 第二章 统计 2.2 用样本估计总体(2)课件 新人教A版必修3.ppt_第3页
四川省开江县高中数学 第二章 统计 2.2 用样本估计总体(2)课件 新人教A版必修3.ppt_第4页
四川省开江县高中数学 第二章 统计 2.2 用样本估计总体(2)课件 新人教A版必修3.ppt_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2 2用样本估计总体 2 复习 绘制频率分布直方图有哪几个步骤呢 在样本频率分布直方图中 当样本容量增加 作图时所分的组数增加 组距减少 相应的频率折线图会越来越接近于一条光滑曲线 统计中称这条光滑曲线为总体密度曲线 它能够精确地反映了总体在各个范围内取值的百分比 它能给我们提供更加精细的信息 总体密度曲线 茎叶图的作法 1 将每个数据分为茎 高位 和叶 低位 两部分 如本例中 用茎表示十位上的数字 用叶表示个位上的数字 2 将最小茎和最大茎之间的数按大小顺序排成一列 写在左 右 侧 3 将各个数据的叶按大小次序写在其茎的右 左 侧 茎叶图 频率分布表与频率分布直方图的比较 1 茎叶图 频率分布表与频率分布直方图都是用来描述样本数据的分布情况的 2 茎叶图由所有的样本数据构成 没有损失任何样本信息 同时 茎叶图中的数据可以随时记录 随时添加 方便记录与表示 这对于教练员发现运动员现场状态特别有用 但当样本的数据较多时 枝叶就会很长 茎叶图就显得不太方便 3 频率分布表与频率分布直方图则损失了样本的一些信息 必须在完成抽样后才能制作 某校高一 1 班同学在老师的布置下 用单摆进行测试 以检验重力加速度 全班同学两人一组 在相同条件下进行测试 得到下列实验数据 单位 s2 9 629 59 789 9410 019 669 889 6810 329 769 459 999 819 569 789 729 939 949 659 799 429 689 709 849 90 怎样用这些数据对重力加速度进行估计 问题引入 知识新授 一 众数 中位数 平均数的概念 一般地 n个数据按大小顺序排列 处于最中间位置的一个数据 或最中间两个数据的平均数 叫做这组数的中位数 median 一组数据中出现次数最多的那个数据叫做这组数的众数 mode 算术平均数是指资料中各观测值的总和除以观测值个数所得的商 简称平均数或均数 用这些特征数据对总体进行估计的优缺点是什么 平均数 中位数 众数都是描述数据的 集中趋势 的 特征数 它们各自特点如下 用平均数作为一组数据的代表 比较可靠和稳定 它与这组数据中的每一个数都有关系 对这些数据所包含的信息的反映最为充分 因而应用最为广泛 特别是在进行统计推断时有重要作用 但计算较繁琐 并且易受极端数据的影响 用众数作为一组数据的代表 可靠性较差 但众数不受极端数据的影响 并且求法简便 当一组数据中个别数据变动较大时 适宜选择众数来表示这组数据的 集中趋势 用中位数作为一组数据的代表 可靠性也较差 但中位数也不受极端数据的影响 也可选择中位数来表示这组数据的 集中趋势 任何一个样本数据的改变都会引起平均数的改变 这是中位数 众数都不具备的性质 也正是这个原因 与众数 中位数比较起来 平均数可以反映出更多的关于样本数据全体的信息 练习 在一次中学生田径运动会上 参加男子跳高的17名运动员的成绩如下表所示 分别求这些运动员成绩的众数 中位数与平均数 解 在17个数据中 1 75出现了4次 出现的次数最多 即这组数据的众数是1 75 上面表里的17个数据可看成是按从小到大的顺序排列的 其中第9个数据1 70是最中间的一个数据 即这组数据的中位数是1 70 这组数据的平均数是 答 17名运动员成绩的众数 中位数 平均数依次是1 75 米 1 70 米 1 69 米 用这些特征数据对总体进行估计的优缺点是什么 二 众数 中位数 平均数与频率分布直方图的关系 1 众数在样本数据的频率分布直方图中 就是最高矩形的中点的横坐标 例如 在上一节调查的100位居民的月均用水量的问题中 从这些样本数据的频率分布直方图可以看出 月均用水量的众数是2 25t 如图所示 3 12 52 02 01 51 01 61 81 91 63 42 62 22 21 51 20 20 40 30 43 22 72 32 11 61 23 71 50 53 83 32 82 32 21 71 33 61 70 64 13 22 92 42 31 81 43 51 90 84 33 02 92 42 41 91 31 41 80 72 02 52 82 32 31 81 31 31 60 92 32 62 72 42 11 71 41 21 50 52 42 52 62 32 11 61 01 01 70 82 42 82 52 22 01 51 01 21 80 62 2 100位居民的月均用水量 单位 t 频率分布直方图如下 2 25 2 在样本中 有50 的个体小于或等于中位数 也有50 的个体大于或等于中位数 因此 在频率分布直方图中 中位数左边和右边的直方图的面积应该相等 由此可以估计中位数的值 下图中虚线代表居民月均用水量的中位数的估计值 此数据值为2 03t 频率分布直方图如下 2 03 说明 2 03这个中位数的估计值 与样本的中位数值2 0不一样 这是因为样本数据的频率分布直方图 只是直观地表明分布的形状 但是从直方图本身得不出原始的数据内容 所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致 3 平均数是频率分布直方图的 重心 是直方图的平衡点 n个样本数据的平均数公式 频率分布直方图如下 1 973 三 三种数字特征的优缺点 1 众数体现了样本数据的最大集中点 但它对其它数据信息的忽视使得无法客观地反映总体特征 如上例中众数是2 25t 它告诉我们 月均用水量为2 25t的居民数比月均用水量为其它数值的居民数多 但它并没有告诉我们多多少 2 中位数是样本数据所占频率的等分线 它不受少数几个极端值的影响 这在某些情况下是优点 但它对极端值的不敏感有时也会成为缺点 如上例中假设有某一用户月均用水量为10t 那么它所占频率为0 01 几乎不影响中位数 但显然这一极端值是不能忽视的 3 由于平均数与每一个样本的数据有关 所以任何一个样本数据的改变都会引起平均数的改变 这是众数 中位数都不具有的性质 也正因如此 与众数 中位数比较起来 平均数可以反映出更多的关于样本数据全体的信息 但平均数受数据中的极端值的影响较大 使平均数在估计时可靠性降低 四 众数 中位数 平均数的简单应用 例1某工厂人员及工资构成如下 1 指出这个问题中周工资的众数 中位数 平均数 2 这个问题中 工资的平均数能客观地反映该厂的工资水平吗 为什么 加权平均数 分析 众数为200 中位数为220 平均数为300 因平均数为300 由表格中所列出的数据可见 只有经理的周工资在平均数以上 其余的人都在平均数以下 故用平均数不能客观真实地反映该工厂的工资水平 问题 有两位射击运动员在一次射击测试中各射靶十次 每次命中的环数如下 甲78795491074乙9578768677 如果你是教练 你应当如何对这次射击情况作出评价 如果这是一次选拔性考核 你应当如何作出选择 两人射击的平均成绩是一样的 那么两个人的水平就没有什么差异吗 4 5 6 7 8 9 10 环数 频率 0 1 0 2 0 3 甲 4 5 6 7 8 9 10 0 1 0 2 0 3 0 4 环数 频率 乙 发现什么 为此 我们还需要从另外一个角度去考察这2组数据 直观上看 还是有差异的 如 甲成绩比较分散 乙成绩相对集中 如图示 因此 我们还需要从另外的角度来考察这两组数据 例如 在作统计图表时提到过的极差 甲的环数极差 10 4 6乙的环数极差 9 5 4 它们在一定程度上表明了样本数据的分散程度 与平均数一起 可以给我们许多关于样本数据的信息 显然 极差对极端值非常敏感 注意到这一点 我们可以得到一种 去掉一个最高分 去掉一个最低分 的统计策略 四 标准差 考察样本数据的分散程度的大小 最常用的统计量是标准差 标准差是样本平均数的一种平均距离 一般用s表示 所谓 平均距离 其含义可作如下理解 方差 标准差是样本数据到平均数的一种平均距离 它用来描述样本数据的分散程度 在实际应用中 标准差常被理解为稳定性 1 方差 标准差的平方 公式为 2 标准差公式为 在刻画样本数据分散程度上 两者是一致的 标准差 方差 标准差是样本数据到平均数的一种平均距离 它用来描述样本数据的离散程度 在实际应用中 标准差常被理解为稳定性 规律 标准差越大 则a越大 数据的离散程度越大 反之 数据的离散程度越小 例2 已知有一个样本的数据为1 2 3 4 5 求平均数 方差 标准差 例3甲乙两人同时生产内径为25 40mm的一种零件 为了对两人的生产质量进行评比 从他们生产的零件中各抽出20件 量得其内径尺寸如下 单位 mm 甲25 46 25 32 25 45 25 39 25 3625 34 25 42 25 45 25 38 25 4225 39 25 43 25 39 25 40 25 4425 40 25 42 25 35 25 41 25 39 乙25 40 25 43 25 44 25 48 25 4825 47 25 49 25 49 25 36 25 3425 33 25 43 25 43 25 32 25 4725 31 25 32 25 32 25 32 25 48 从生产的零件内径的尺寸看 谁生产的质量较高 解 用计算器计算可得 性质归纳 课堂小结 一 众数 中位数 平均数的概念 一般地 n个数据按大小顺序排列 处于最中间位置的一个数据 或最中间两个数据的平均数 叫做这组数的中位数 median 一组数据中出现次数最多的那个数据叫做这组数的众数 mode 算术平均数是指资料中各观测值的总和除以观测值个数所得的商 简称平均数或均数 二 众数 中位数 平均数与频率分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论