已阅读5页,还剩21页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
用样本的数字特征估计总体的数字特征 1 一 求极差 即数据中最大值与最小值的差 二 决定组距与组数 组数 极差 组距 三 分组 通常对组内数值所在区间 取左闭右开区间 最后一组取闭区间 四 登记频数 计算频率 列出频率分布表 五 画出频率分布直方图 纵轴表示频率 组距 复习回顾 画频率分布直方图的步骤 2 连接频率分布直方图中各小长方形上端的中点 得到频率分布折线图 总体密度曲线反映了总体在各个范围内取值的百分比 精确地反映了总体的分布规律 是研究总体分布的工具 画茎叶图的步骤 1 将每个数据分为茎 高位 和叶 低位 两部分 2 将最小茎和最大茎之间的数按大小次序排成一列 写在一侧 3 将各个数据的叶按大小次序写在其茎的另一侧 3 练习 在一次中学生田径运动会上 参加男子跳高的17名运动员的成绩如下表所示 分别求这些运动员成绩的众数 中位数与平均数 4 用样本的数字特征估计总体的数字特征 中位数众数平均数 5 众数 中位数 平均数的概念 中位数 将一组数据按大小依次排列 把处在最中间位置的一个数据 或最中间两个数据的平均数 叫做这组数据的中位数 众数 在一组数据中 出现次数最多的数据叫做这组数据的众数 平均数 一组数据的算术平均数 即x 6 二 众数 中位数 平均数与频率分布直方图的关系 例如 在上一节调查的100位居民的月均用水量的问题中 从这些样本数据的频率分布直方图可以看出众数 中位数 平均数为多少 7 0 1 0 2 0 3 0 4 0 5 O0 511 522 533 544 5月平均用水量 t 在样本数据的频率分布直方图中 就是最高矩形的中点的横坐标 众数 众数 众数体现了样本数据的最大集中点 但它对其它数据信息的忽视使得无法客观地反映总体特征 特点 8 0 1 0 2 0 3 0 4 0 5 O0 511 522 533 544 5月平均用水量 t 2 02这个中位数的估计值 与样本的中位数值2 0不一样 为什么 因为样本数据的频率分布直方图 只是直观地表明分布的形状 但是从直方图本身得不出原始的数据内容 所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致 左边和右边的直方图的面积应该相等 由此可以估计中位数的值 中位数 2 中位数不受少数几个极端值的影响 1 中位数易计算 能较好地表现数据信息 3 常用于计算数据质量较差时 特点 9 0 1 0 2 0 3 0 4 0 5 O0 511 522 533 544 5月平均用水量 t 是频率分布直方图的 重心 等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点横坐标之和 平均数 3 平均数受数据中的极端值的影响较大 使平均数在估计时可靠性降低 1 平均数与每一个样本的数据有关 所以任何一个样本数据的改变都会引起平均数的改变 2 平均数可以反映出更多的关于样本数据全体的信息 特点 10 练习 有两位射击运动员在一次射击测试中各射靶10次 每次命中的环数如下 甲 乙 如果你是教练 你应当如何对这次射击作出评价 如果看两人本次射击的平均成绩 由于 两人射击的平均成绩是一样的 那么两个人的水平就没有什么差异吗 11 考察样本数据的分散程度的大小 所谓 平均距离 其含义可作如下理解 标准差是样本数据到平均数的一种平均距离 一般用s表示 标准差 12 由于上式含有绝对值 运算不太方便 因此 通常改用如下公式来计算标准差 13 探究提高 1 平均数与方差都是重要的数字特征 是对总体的一种简明的描述 它们所反映的情况有着重要的实际意义 平均数 中位数 众数描述其集中趋势 方差和标准差描述波动大小 2 平均数 方差的公式推广 若数据x1 x2 xn的平均数为 那么mx1 a mx2 a mx3 a mxn a的平均数是 数据x1 x2 xn的方差为s2 a s2 b 数据x1 a x2 a xn a的方差为 c 数据ax1 ax2 axn的方差为 14 知识补充 1 标准差的平方s2称为方差 有时用方差代替标准差测量样本数据的离散度 方差与标准差的测量效果是一致的 在实际应用中一般多采用标准差 2 现实中的总体所包含的个体数往往很多 总体的平均数与标准差是未知的 我们通常用样本的平均数和标准差去估计总体的平均数与标准差 但要求样本有较好的代表性 15 例4在去年的足球甲A联赛中 甲队每场比赛平均失球数是1 5 全年比赛失球个数的标准差为1 1 乙队每场比赛平均失球数是2 1 全年比赛失球个数的标准差为0 4 你认为下列说法是否正确 为什么 1 平均来说甲队比乙队防守技术好 2 乙队比甲队技术水平更稳定 3 甲队有时表现很差 有时表现又非常好 4 乙队很少不失球 16 例题分析 例1画出下列四组样本数据的条形图 说明他们的异同点 1 2 17 3 4 18 2 已知一组数据按从小到大的顺序排列 得到 1 0 4 x 7 14 中位数为5 则这组数据的平均数和方差分别为 A 5 24B 5 24C 4 25D 4 25解析 中位数为5 5 x 6 s2 5 1 2 5 0 2 5 4 2 5 6 2 5 7 2 5 14 2 24 A 19 9 2009 福建 某校开展 爱我海西 爱我家乡 摄影比赛 9位评委为参赛作品A给出的分数如茎叶图所示 记分员在去掉一个最高分和一个最低分后 算得平均分为91 复核员在复核时 发现有一个数字 茎叶图中的x 无法看清 若记分员计算无误 则数字x应该是 解析当x 4时 x 4 则 91 x 1 1 20 11 下图是某市有关部门根据该市干部的月收入情况 作抽样调查后画出的样本频率分布直方图 已知图中第一组的频数为4000 请根据该图提供的信息解答下列问题 图中每组包括左端点 不包括右端点 如第一组表示收入在 1000 1500 21 1 求样本中月收入在 2500 3500 的人数 2 为了分析干部的收入与年龄 职业等方面的关系 必须从样本的各组中按月收入再用分层抽样方法抽出100人作进一步分析 则月收入在 1500 2000 的这段应抽多少人 3 试估计样本数据的中位数 解 1 月收入在 1000 1500 的概率为0 0008 500 0 4 且有4000人 样本的容量n 10000 月收入在 1500 2000 的频率为0 0004 500 0 2 22 月收入在 2000 2500 的频率为0 0003 500 0 15 月收入在 3500 4000 的频率为0 0001 500 0 05 月收入在 2500 3500 的频率为1 0 4 0 2 0 15 0 05 0 2 样本中月收入在 2500 3500 的人数为0 2 10000 2000 2 月收入在 1500 2000 的人数为0 2 10000 2000 23 再从10000人中用分层抽样方法抽出100人 则月收入在 1500 2000 的这段应抽取100 20 人 3 由 1 知月收入在 1000 2000 的频率为0 4 0 2 0 6 0 5 样本数据的中位数为1500 1500 250 1750 元 24 三种数字特征的优缺点 1 众数体现了样本数据的最大集中点 但它对其它数据信息的忽视使得无法客观地反映总体特征 2 中位数它不受少数几个极端值的影响 这在某些情况下是优点 但它对极端值的不敏感有时也会成为缺点 3 由于平均数与每一个样本的数据有关 所以任何一个样本数据的改
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 年底餐厅活动策划方案(3篇)
- 装修材料活动策划方案(3篇)
- 爬行系列活动方案策划(3篇)
- 酒店新颖活动策划方案(3篇)
- 场内运输施工方案(3篇)
- 更换护栏-施工方案(3篇)
- 春季消防安全教育班会方案
- 2025新能源汽车固态电池技术商业化落地路径研究报告
- 2025新能源汽车动力电池技术发展现状解析与未来规划报告
- 零售超市商品陈列与促销策划方案
- 空压机技术规格书
- 铸造机械日常点检表
- 高钛渣生产工艺资料
- [河南]高速公路桥梁现浇箱梁专项施工方案
- 供应室pdca质量提高腔镜器械包装合格率品管圈ppt模板课件
- ISO9001-2015精华培训
- 天然药物化学-第九章-生物碱
- 迈克尔杰克逊(Michael-Jackson)英文介绍
- 口腔一般检查(口腔基本检查)
- 分层沉降仪使用说明书
- 03 第三章 道岔转换设备及融雪装置20120418
评论
0/150
提交评论