




已阅读5页,还剩22页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
复习回顾 抽样方法 简单随机抽样 分层抽样 抽签法 随机数表法 抽样过程中每个个体被抽取的机会相等 体现了抽样的客观性与公平性 系统抽样 为了考察一个总体的情况 在统计中通常是从总体中抽取一个样本 用样本的有关情况去估计总体相应的情况 这种估计大体分为两类 一类是用样本的某种数字特征 例如平均数 标准差等 去估计总体的相应数字特征 一类是用样本的频率分布去估计总体分布 1 5用样本估计总体 1 一 估计总体的分布 例1 为了了解某地区高二学生的身体发育情况 抽查了地区100名年龄为16 5岁至17岁的男生的体重情况 结果如下 单位 kg 60 569 56561 564 566 56464 56258 573 559677057 565 568717568 562 56659 563 564 567 573687266 5746360557064 5586470 55762 5656971 573625874716663 560 559 563 5657074 568 56455 572 566 568766160685769 57464 55961 5676863 5585965 562 569 57264 56168 5646265 558 567 570 5656666 5706359 5 请你估计该地区年龄为16 5岁至17岁的男生体重的分布情况 2 解 这里 如果把总体看作是该地区年龄为16 5岁至17岁的男生体重 那么我们就要通过上面的样本信息 来估计总体的分布情况 但从抽样的数据很难直接估计出总体的分布情况 60 569 56561 564 566 56464 56258 573 559677057 565 568717568 562 56659 563 564 567 573687266 5746360557064 5586470 55762 5656971 573625874716663 560 559 563 5657074 568 56455 572 566 568766160685769 57464 55961 5676863 5585965 562 569 57264 56168 5646265 558 567 570 5656666 5706359 5 3 为此 我们可以先将抽样的数据按每个数据出现的频数和频率汇成下表 解 这里 如果把总体看作是该地区年龄为16 5岁至17岁的男生体重 那么我们就要通过上面的样本信息 来估计总体的分布情况 但从抽样的数据很难直接估计出总体的分布情况 4 为此 我们可以先将抽样的数据按每个数据出现的频数和频率汇成下表 解 这里 如果把总体看作是该地区年龄为16 5岁至17岁的男生体重 那么我们就要通过上面的样本信息 来估计总体的分布情况 但从抽样的数据很难直接估计出总体的分布情况 从表格中 我们就能估计出总体大致的分布情况了 如在年龄为16 5岁至17岁之间 男生的体重主要在58 72kg之间 58kg以下及72kg以上所占的比率相对较小等 但是 这些关于分布情况的描述仍不够直观形象 为了得到更为直观的信息 我们可以再将表中的数据按照下表的方式分组 5 为此 我们可以先将抽样的数据按照下表进行分组 解 这里 如果把总体看作是该地区年龄为16 5岁至17岁的男生体重 那么我们就要通过上面的样本信息 来估计总体的分布情况 但从抽样的数据很难直接估计出总体的分布情况 频数分布直方图 6 为此 我们可以先将抽样的数据按照下表进行分组 解 这里 如果把总体看作是该地区年龄为16 5岁至17岁的男生体重 那么我们就要通过上面的样本信息 来估计总体的分布情况 但从抽样的数据很难直接估计出总体的分布情况 7 思考交流 1 体重位于哪个区间的人数最多 2 体重在64 5 66 5kg的频率约是多数 3 体重小于64 5kg的频率约是多数 4 体重在63 5 65 5kg的频率约是多数 64 5 66 5 16 42 15 8 抽象概括 上图中 每个小矩形的宽度为 xi 分组的宽度 高为 小矩形的面积恰为相应的频率fi 通常称这样的图形为频率分布直方图 当样本容量较大时 样本中落在每个区间内的样本数的频率会稳定于总体在相应区间内取值的概率 因此 我们就可以用样本的频率分布直方图来估计总体在任意区间内取值的概率 也即总体的分布情况 频率折线图 9 注意 折线与横轴所围成的面积是1 10 如果样本容量取得足够大 分组的组距取得足够小 则相应的频率折线图将趋于一条光滑的曲线 我们称这条光滑的曲线为总体的密度曲线 11 例2 为了了解一大片经济林生长情况 随机测量其中的100株树木的底部周长 得到如下数据表 单位 cm 1 编制频率分布表 2 绘制频率分布直方图 3 估计该片经济林中底部周长小于100cm的树木约占多少 周长不小于120cm的树木约占多少 12 解 1 这组数据的最大值是135 最小值是80 全距是55 可将其分为11组 组距为5 13 解 1 这组数据的最大值是135 最小值是80 全距是55 可将其分为11组 组距为5 2 直方图如图 3 样本小于100的频率为 0 21 样本不小于120的频率为 0 19 估计该片经济林中底部周长小于100cm的树木约占21 周长不小于120cm的树木约占19 14 问题提出 在日常生活中 我们不仅需要了解总体的分布形态 有时会更关心总体的某些数字特征 15 5用样本估计总体 2 一 估计总体的数字特征 1 分析理解 1996年奥运会风帆比赛前7场比赛 共比赛11场 结束后 排名前5名的选手积分如下 根据上面的比赛结果 我们如何比较各选手之间的成绩及稳定情况呢 如果此时让你预测谁将获得最后胜利 你会怎样看 16 5位选手前7场比赛积分的平均数和标准差如下 从上表中可见 李丽珊的平均积分及积分标准差都比其他选手的小 这说明 在前7场的比赛中 她的成绩最为优秀 且表现最为稳定 假定每位运动员在各自的11场比赛中发挥的水平大致相同 因而可以把前7场比赛看作是总体的一个样本 并由此估计每位运动员最后比赛的成绩 事实验证了我们的预测 李丽珊正是凭着自己优异而稳定的表现 成为香港首位奥运金牌得主的 17 2 思考交流 1 若取前3场比赛 前5场比赛 前9场比赛作为样本去估计总体结果各会怎样 哪一种与11场比赛结束后的结果最接近 2 若全部比赛已结束 假如你的同桌与你抽取的样本容量相同 你们两人的样本平均积分和积分标准差一定相同吗 样本频率分布直方图呢 3 若全部比赛已结束 假如你用同样的方法先后从总体中抽取了两个大小相同的样本 两次得到的样本平均积分和积分标准差一定相同吗 样本频率分布直方图呢 为什么 18 3 抽象概括 用样本估计总体时 如果抽样的方法比较合理 那么样本可以反映总体的信息 但从样本得到的信息会有偏差 在随机抽样中 这种偏差是不可避免的 虽然我们从样本数据得到的分布 平均数和标准差 通常称之为样本分布 样本平均数和样本标准差 并不是总体真正的分布 平均数和标准差 而只是总体的一个估计 但这种估计是合理的 特别是当样本容量很大时 它们确实反映了总体的信息 19 4 例题与练习 例1 在一批试验田里对某种早稻品种进行栽培实验 抽测了其中15块试验田的单位面积的产量如下 单位 504402495492500501405409460486460371420456395 这批试验田的单位面积产量约是多少 解 把这批试验田里每块试验田的单位面积的产量的全体称为总体 那么这15块试验田的单位面积产量就是这个总体的一个样本 用计算器算得样本平均数为 由此可以估计 这批试验田的单位面积产量约是450 20 504402495492500501405409460486460371420456395 这批试验田的单位面积产量约是多少 解 把这批试验田里每块试验田的单位面积的产量的全体称为总体 难么这15块试验田的单位面积产量就是这个总体的一个样本 由此可以估计 这批试验田的单位面积产量约是450 发现这些数据都在460附近波动 每个数据都减去460 得到一组新数据 44 58 35 32 40 41 55 51 26 89 40 4 65 新数据的平均数是 样本平均数是 例1 在一批试验田里对某种早稻品种进行栽培实验 抽测了其中15块试验田的单位面积的产量如下 单位 21 灯泡甲 16101590154016501450165015701630169017201580162015001700153016701520169016001590灯泡乙 16701610155014901430161015301430141015801520144015001510154014001420153015201510根据上述两个样本 你准备选哪种灯泡 请说明理由 例2 某工厂研制甲 乙两种电灯泡 从两种电灯泡中各抽取了20只进行寿命试验 得到如下数据 单位 小时 22 甲 乙两种灯泡的样本平均数分别是 可以估计 甲种灯泡比乙种灯泡的平均使用寿命长一些 想一想 1 用样本平均值去估计总体平均值一定准确吗 2 你认为减少错误发生的途径有哪些 采用更合理的抽样方法 增大样本的容量 解 23 例3 要从甲 乙两名男跳远运动员选拔一名参加一次田径比赛 为此 对两名运动员进行了15次测验比赛 成绩如下 单位 cm 甲755752757744743729721731778768761773764736741乙729767744750745753745752769743760755748752747 如何通过上述数据 来作出选人的决定 解 每个数据都减去750 得到两组新数据 527 6 7 21 29 19 2818112314 14 9 2117 60 53 52 19 7105 22 3 这说明两人的平均成绩相差甚微 所以乙的成绩稳定 应选拔乙 24 练习1 从湖中打一网鱼 共m条 做上记号后再放入湖里 数天后再打一网鱼共n条 其中k条有记号 估计湖中有鱼大约 条 练习2 要从甲乙丙三名选手中挑选一名同学参加数学竞赛 参考5次平时成绩如下表 甲 8685908584乙 7095858397丙 7578727476请你分析数据 作出选拔决定 解 设湖中有x条鱼 则由 可得 由于甲 乙两人平均成绩相同 我们还须通过标准差 或方差 的计算来决定 解 根据上面的计算结果可知 应挑选甲参加数学竞赛 练习3 P39 练习 25 用样本估计总体时 如果抽样的方法比较合理 那么样本可以反映总体的信息 但从样本得到的信息会有偏差 在随机抽样中 这种偏差是不可避免的 虽然我们从样本数据得到的分布 平均数和标准差 通常称之为样本分布 样本平均数和样本标准差 并不是总体真正的分布 平均数和标准差 而只是总体的一个估计 但这种估计是合理的 特别是当样本容量很大时 它们确实反映了总体的信息
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年短视频平台内容风险识别与防范策略研究报告
- 现场发泡包装机知识培训课件
- 2025年基因治疗药物临床研发人才需求分析:市场前景与人才培养报告
- 吉林省永吉县实验高级中学2026届化学高二上期中监测试题含解析
- 炮车中学2026届高三上化学期中学业水平测试模拟试题含解析
- 2026届山西省大同市铁路一中高一化学第一学期期中联考试题含解析
- 2025年注册环保工程师考试 环境保护与可持续发展专项训练试卷
- 2025年注册化工工程师考试化工原理专项训练试卷:巩固化工基础知识
- 2026届浙江省温州树人中学高二化学第一学期期末教学质量检测试题含答案
- 民法典普法课件
- 职业道德与法治中职PPT完整全套教学课件
- 惠州卫生职业技术学院工作人员招聘考试真题2022
- 三级创业指导师考试复习题库(500题)
- 2022年北京语言大学各单位新编长聘人员招聘需求笔试备考题库及答案解析
- 部编版小学语文四年级上册课程纲要
- GB/T 31997-2015风力发电场项目建设工程验收规程
- HG20615-RF法兰标准尺寸
- 三尖瓣下移畸形(Ebstein畸形)
- 计算机组装与维护完整版课件(全)
- 一键自动生成spccpkMSAPPK数据工具
- (知识扩展)城市轨道交通CBTC系统功能课件
评论
0/150
提交评论