




已阅读5页,还剩48页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2 2用样本估计总体 第二章统计 统计的基本思想方法 用样本估计总体 即通常不直接去研究总体 而是通过从总体中抽取一个样本 根据样本的情况去估计总体的相应情况 统计的核心问题 如何根据样本的情况对总体的情况作出一种推断 这里包括两类问题 一类是如何从总体中抽取样本 另一类是如何根据对样本的整理 计算 分析 对总体的情况作出推断 用样本的有关情况去估计总体的相应情况 这种估计大体分为两类 一类是用样本频率分布估计总体分布 一类是用样本的某种数字特征 例如平均数 方差等 去估计总体的相应数字特征 整体介绍 将一批数据按要求分为若干个组 各组内数据的个数 叫做该组的频数 每组数据的个数除以全体数据个数的商叫做该组的频率 复习 频数与频率 根据随机抽取样本的大小 分别计算某一事件出现的频率 频率的分布规律 取值状况 就叫做样本的频率分布 频率分布 思考 样本频率分布与总体频率分布有什么关系 通过样本的频数分布 频率分布可以估计总体的频率分布 频率分布 样本中所有数据 或数据组 的频数和样本容量的比 叫做该数据的频率 频率分布的表示形式有 样本频率分布表 样本频率分布图样本频率分布直方图 样本频率分布折线图 所有数据 或数据组 的频数的分布变化规律叫做样本的频率分布 知识探究 一 频率分布表 问题 我国是世界上严重缺水的国家之一 城市缺水问题较为突出 某市政府为了节约生活用水 计划在本市试行居民生活用水定额管理 即确定一个居民月用水量标准a 用水量不超过a的部分按平价收费 超出a的部分按议价收费 通过抽样调查 获得100位居民的月均用水量如下表 单位 t 3 12 52 02 01 51 01 61 81 91 63 42 62 22 21 51 20 20 40 30 43 22 72 32 11 61 23 71 50 53 83 32 82 32 21 71 33 61 70 64 13 22 92 42 31 81 43 51 90 84 33 02 92 42 41 91 31 41 80 72 02 52 82 32 31 81 31 31 60 92 32 62 72 42 11 71 41 21 50 52 42 52 62 32 11 61 01 01 70 82 42 82 52 22 01 51 01 21 80 62 2 如果希望大部分居民的日常生活不受影响 那么标准a定为多少比较合理呢 为了较合理地确定这个标准 你认为需要做哪些工作 显然 这里的总体可以在一个实数区间取值 称为连续型总体 样本的频率分布表示形式有 频率分布表和频率分布直方图 画频率分布表和频率分布直方图其一般步骤为 1 计算一组数据中最大值与最小值的差 即求极差 2 决定组距与组数 3 将数据分组 4 列频率分布表 5 画频率分布直方图 1 极差 样本数据中的最大值和最小值的差称为极差 2 确定组距 组数 如果将上述100个数据按组距为0 5进行分组 那么这些数据共分为多少组 0 2 4 3 4 3 0 2 0 5 8 2 8 2取过剩整数值 分为9组 3将数据分组 决定分点 以组距为0 5进行分组 上述100个数据共分为9组 各组数据的取值范围可以如何设定 4画频率分布表 如何统计上述100个数据在各组中的频数 如何计算样本数据在各组中的频率 你能将这些数据用表格反映出来吗 0 0 5 0 5 1 1 1 5 4 4 5 分组频数累计频数频率 0 0 5 40 04 0 5 1 正80 08 1 1 5 正正正150 15 1 5 2 正正正正220 22 2 2 5 正正正正正250 25 2 5 3 正正140 14 3 3 5 正一60 06 3 5 4 40 04 4 4 5 20 02合计1001 00 知识探究 二 频率分布直方图 5画频率分布直方图为了直观反映样本数据在各组中的分布情况 我们将上述频率分布表中的有关信息用下面的图形表示 上图称为频率分布直方图 其中横轴表示月均用水量 纵轴表示频率 组距 频率分布直方图中各小长方形的宽度和高度在数量上有何特点 宽度 组距 2图形的意义 频率分布直方图 各个小长方形的面积 频率 小长方形的面积总和 频率分布直方图 1 月均用水量最多的在哪几个区间 频率分布直方图 3分析例题 频率分布直方图非常直观地表明了样本数据的分布情况 使我们能够看到频率分布表中看不太清楚的数据模式 但原始数据不能在图中表示出来 你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗 1 居民月均用水量的分布是 山峰 状的 而且是 单峰 的 2 大部分居民的月均用水量集中在一个中间值附近 只有少数居民的月均用水量很多或很少 3 居民月均用水量的分布有一定的对称性等 探要点 究所然 探要点 究所然 探要点 究所然 探要点 究所然 探要点 究所然 频率分布直方图如下 连接频率分布直方图中各小长方形上端的中点 得到频率分布折线图 利用样本频率分布对总体分布进行相应估计 2 样本容量越大 这种估计越精确 1 上例的样本容量为100 如果增至1000 其频率分布直方图的情况会有什么变化 假如增至10000呢 总体密度曲线 月均用水量 t a b 图中阴影部分的面积 表示总体在某个区间 a b 内取值的百分比 当样本容量无限增大 分组的组距无限缩小 那么频率分布折线图就会无限接近一条光滑曲线 总体密度曲线 总体密度曲线 用样本分布直方图去估计相应的总体分布时 一般样本容量越大 频率分布直方图就会无限接近总体密度曲线 就越精确地反映了总体的分布规律 即越精确地反映了总体在各个范围内取值百分比 总体密度曲线反映了总体在各个范围内取值的百分比 精确地反映了总体的分布规律 是研究总体分布的工具 总体密度曲线 1 对于任何一个总体 它的密度曲线是不是一定存在 它的密度曲线是否可以被非常准确地画出来 思考 实际上 尽管有些总体密度曲线是客观存在的 但一般很难像函数图象那样准确地画出来 我们只能用样本的频率分布对它进行估计 一般来说 样本容量越大 这种估计就越精确 由于样本是随机的 不同的样本得到的频率分布折线图不同 即使是同一样本 不同的分组得到的频率分布折线图也不同 也就是说 频率分布折线图是随着样本的容量和分组情况的变化而变化的 因此不能由样本的频率分布折线图得到准确的总体密度曲线 2 图中阴影部分的面积表示什么 2 总体在范围 a b 内取值的百分比 NBA某赛季甲 乙两名篮球运动员每场比赛的得分的原始纪录如下 甲运动员得分 13 51 23 8 26 38 16 33 14 28 39 乙运动员得分 49 24 12 31 50 31 44 36 15 37 25 36 39 问题一 请用适当的方法表示上述数据 并对两名运动员的得分能力进行比较 引例 问题二 用上次课所学的制作样本的频率分布直方图来分析好吗 甲 13 51 23 8 26 38 16 33 14 28 39 乙 49 24 12 31 50 31 44 36 15 37 25 36 39 当数据比较少时 应用列分布直方图反而不方便 简化制图格式和步骤 得到新的统计制图方法 甲运动员得分 13 51 23 8 26 38 16 33 14 28 39 乙运动员得分 49 24 12 31 50 31 44 36 15 37 25 36 39 茎叶图 一种被用来表示数据的图 当数据是两位有效数字时 用中间的数字表示十位数 即第一个有效数字 两边的数字表示个位数 即第二个有效数字 它的中间部分像植物的茎 两边部分像植物茎上长出来的叶子 因此通常把这样的图叫做茎叶图 注 中间的数字表示得分的十位数字 旁边的数字分别表示两个人得分的个位数 茎叶图 乙 得分基本上是对称的 叶的分布是 单峰 的 有10 13的叶是分布在茎2 3 4上 中位数是36 甲 得分除一个特殊得分 51分 外 也大致对称 分布也是 单峰 的 有9 11的叶主要集中在茎1 2 3上 中位数是26 从上述中位数的大小就可以看得出 乙运动员的成绩更好 另外 乙运动员的得分更集中于峰值附近 这说明乙运动员的发挥更稳定 请用适当的方法表示上述数据 并对两名运动员的得分能力进行比较 茎叶图特点 茎叶图不仅能保留原始数据 而且能够展示数据的分布情况 当样本数据较少时 用茎叶图表示数据的效果较好 它不但可以保留所有的信息 而且可以随时记录 给数据的记录和表示都方便 探要点 究所然 探要点 究所然 探要点 究所然 探要点 究所然 A 探要点 究所然 C 探要点 究所然 D 当堂测 查疑缺 C 当堂测 查疑缺 A 当堂测 查疑缺 乙 课堂小结 表示样本分布的方法 1 频率分布表 2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 33208-2025设备结构健康监测基于叶尖定时原理的透平叶片振动在线监测方法
- 软件技术专业教学标准(高等职业教育专科)2025修订
- 2025年中国紧急救援和其他救助服务行业市场全景分析及前景机遇研判报告
- 2025年中国建筑护板行业市场全景分析及前景机遇研判报告
- 2025年中国咖啡器具行业市场发展监测及投资前景展望报告
- 癌症患者情绪疏导
- 防爆培训课件
- 中国维生素B12行业市场调查研究及投资规划建议报告
- 2020-2025年中国摩托车铝轮行业市场调研分析及投资前景预测报告
- 2024年中国四氯吡啶行业市场调查报告
- 电子政务内网机房运维管理制度
- 陕西省专业技术人员继续教育2025公需课《党的二十届三中全会精神解读与高质量发展》20学时题库及答案
- 学习通《科研诚信与学术规范》课后及考试答案
- 典当行组织架构和岗位设置
- 2023-2024学年内蒙古自治区锡林浩特市小学语文五年级期末自我评估试题
- GB/T 24025-2009环境标志和声明Ⅲ型环境声明原则和程序
- 《半导体及二极管》教学课件
- 病房床头卡模板
- 2022年西双版纳傣族自治州景洪教师进城考试笔试题库及答案解析
- 公路改建工程边施工边通车安全专项施工方案
- 道路交通安全法律法规知识测试题
评论
0/150
提交评论