5概率基础知识7_总体、样本与统计量.ppt_第1页
5概率基础知识7_总体、样本与统计量.ppt_第2页
5概率基础知识7_总体、样本与统计量.ppt_第3页
5概率基础知识7_总体、样本与统计量.ppt_第4页
5概率基础知识7_总体、样本与统计量.ppt_第5页
已阅读5页,还剩77页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

probability probability 第七章抽样调查 总体 样本与统计量 常用统计分布 一 抽样调查的概念1 概念 是按照随机原则 从研究总体中抽取部分单位进行调查 并推断总体数量特征的一种非全面调查 运用数理统计原理 根据被抽取那部分单位的数量特征来推算总体数量特征 2 特点 抽样调查是非全面调查 一定要遵守随机原则 利用样本数据推算总体数量特征 抽样调查必然产生抽样误差 7 1抽样调查概述 二 抽样调查的作用1 适用于不能或者很难进行全面调查的场合 主要是无限总体和破坏性试验 2 适用于理论上能进行全面调查 但实际上没有必要的场合 3 能节约人力 费用和时间 比较灵活 4 可以验证和修正全面调查的正确性和不足 5 可用于工业生产过程的质量控制 6 可用于某种总体的假设检验 三 抽样调查的几个基本概念 以概率论为理论基础 研究 2 研究如何合理地分析随机数据从而作出科学的推断 称为统计推断 1 研究如何以有效的方式收集和整理随机数据 总体 研究对象的单位元素所组成的集合 个体 组成总体的每个单位元素 例1要考察本校男生的身体情况 则将本校的所有男生视为一个总体 而每一位男生就是一个个体 一 总体 总体是随机变量 总体指标 根据总体标志值计算的指标 二 样本 从总体中抽取一部分 取n个 进行观测 再依据这n个个体的试验 或观察 的结果去推断总体的性质 样本 按照一定的规则从总体中抽取的一部分个体 抽样 抽取样本的过程 样本容量 样本中个体的数目n 抽样指标 根据样本总体标志值计算的指标 为使样本具有代表性 抽样应满足什么条件 从民意测验看抽样 1 Xi与总体同分布 2 X1 X2 Xn相互独立 从民意测验看抽样 1936年 FranklinDelanoRosevelt 罗斯福 与共和党的候选人 Kansas州州长AlfredLandon 兰登 竞选总统 绝大多数观测家认为罗斯福会是获胜者 但 文学摘要 却预测兰登会以57 43 的优势获胜 摘要 自1916年以来的历届总统选举中都正确地预测出获胜的一方 但这次罗斯福以62 38 的压倒优势取胜 不久 文学摘要 就垮了 摘要 调查的过程是将问卷寄给一千万人 这些人的名字和地址摘自电话簿或俱乐部会员名册 这筛掉了不属俱乐部或未装电话的穷人 这在1936年前影响不大 因为穷人富翁以类似的思考投票 但1936年经济正在从大萧条中恢复 故穷人选罗斯福 而富翁们选兰登 抽样方法和规则 1 抽样必须遵循随机原则2 抽样调查必然会产生误差 抽样误差是可以事先计算和控制的 抽样调查的组织方式 一 简单随机抽样 二 类型抽样 三 机械抽样 四 整群抽样 五 多阶段抽样 四 抽样调查的组织方式 一 简单随机抽样 二 类型抽样 三 机械抽样 四 整群抽样 五 多阶段抽样 一 简单随机抽样 1 概念 又称纯随机抽样 是对总体不作任何处理 随机抽取样本单位的方法 2 种类 1 直接抽选法 2 抽签法 3 随机数字表法3 特点 简单 最符合随机原则 但误差较大 二 类型抽样 1 概念 又称分类抽样 是先对总体各单位按一定标志加以分类 然后再从各类中按随机原则抽取样本单位的方法 2 种类 1 类型比例抽样 1 不等比例抽样 3 特点 把分组法与随机抽样有机结合 提高了样本的代表性 误差较小 三 机械抽样 1 概念 又称等距抽样或系统抽样 是先对总体按一定顺序加以排列 然后按一定的间隔抽取样本单位的方法 2 种类 1 按排队标志与研究目的是否有关分 按无关标志机械抽样 按有关标志机械抽样 2 按抽样单位抽选的方法不同分为随机起点等距抽样 半距起点等距抽样 对称等距抽样3 特点 简便易行 但容易出现系统误差 四 整群抽样 1 概念 是先对总体按某一标志分为若干群或组 然后 以群为抽样单位抽取样本的方法 2 特点 方便节约费用 但误差较大 五 多阶段抽样 1 概念 样本不是一次性抽取 而是分两个或两个以上阶段 2 特点 节约人力和物力 可以以现成的行政区域 组织系统作为划分各阶段的依据 五 抽样方法 一 重复抽样特点 N保持不变 各单位中选的机会均等 二 不重复抽样特点 N逐渐减小 各单位中选的机会逐渐提高 六 统计量 统计量 样本的不含任何未知参数的函数 总体是随机变量 统计量是随机变量 或向量 样本是随机向量 样本均值 样本方差 常见统计量 样本k阶原点矩 样本k阶中心矩 统称样本矩 抽样误差的意义纯随机抽样抽样平均误差的计算分类抽样抽样平均误差的计算机械抽样抽样平均误差的计算整群抽样抽样平均误差的计算 7 2抽样误差 一 抽样误差的意义 一 抽样误差的概念抽样误差是指样本指标与总体指标之间数量上的差别 用符号表示为 抽样误差的来源为 二 影响抽样平均误差的因素1 总体标志变动度 2或 与抽样平均误差呈正比关系 2 抽样单位数 n 与抽样平均误差呈反方向变化 3 抽样组织方式 4 抽样方法 三 抽样平均误差的概念简例以平均数抽样平均误差为例 例 有四个工人 各人每月产量分别是40 50 70 80件 现在随机从其中抽取2人 并求平均加工零件数 用以代表4人总体的平均产量水平 为方便说明问题 先计算出4人的月平均产量为 1 重复抽样 样本配合数 4 4 16 2 不重复抽样 样本配合数 4 3 12 很明显 重复抽样平均误差大于不重复抽样平均误差 四 抽样平均误差的的意义1 可以衡量抽样调查的准确性 2 是抽样推断和估计的基本根据 重复抽样抽样平均误差计算表 不重复抽样抽样平均误差计算表 二 纯随机抽样平均误差的计算 一 平均数抽样平均误差的计算1 重复抽样根据数理统计证明 在纯随机重复抽样条件下 抽样平均误差与全及总体的标准差成正比 与样本总体单位数的平方根成反比 利用此关系可得出重复抽样平均数抽样误差的计算公式为 1 过去调查所得资料 选多个方差中最大的2 用样本标准差代替总体标准差 用s代替 3 用小规模调查资料4 用估计资料 2 不重复抽样 其中 1 n N 是修正系数 二 成数抽样平均误差的计算假定 某一现象有两种表现 具有一种表现的单位数为N1 变量值为1 不具有该种表现的单位数为N0 变量值为0 则平均数 方差分别为 2 不重复抽样平均误差 1 重复抽样平均误差 三 分类抽样平均误差的计算 关键问题是影响抽样平均误差的主要因素 组内方差 计算抽样平均误差时用平均组内方差 总体 用表示 样本 用表示 一 平均数抽样平均误差的计算1 重复抽样 2 不重复抽样 其中 平均组内方差为 总体平均组内方差 样本平均组内方差 例 假定用分类比例抽样方式 从山区 丘陵 平原三种类型的200亩耕地上抽取10块 每块1亩 亩产量见下表 进行抽样调查 用来推断全部耕地的平均亩产量 求平均亩产量的抽样平均误差 三 分类抽样平均误差的计算 解 1 计算各组内方差 2 计算平均组内方差 3 计算抽样平均误差 二 成数抽样平均误差计算 2 不重复抽样 1 重复抽样 其中 平均组内方差为 总体平均组内方差 样本平均组内方差 仍用上述资料计算成数的抽样平均误差 假设亩产450斤以上为高产田 不到450斤的为低产田 计算高产田所占比重的抽样平均误差 三 分类抽样平均误差的计算 解 1 计算平均组内方差 2 计算抽样平均误差 三 分类抽样平均误差的计算 四 机械抽样平均误差的计算 机械抽样一般都用不重复抽样 无关标志排队机械抽样类似于简单随机抽样 计算公式为 有关标志排队机械抽样类似于分类抽样 计算公式为 五 整群抽样平均误差的计算 其中 R 总体群数 r 样本群数 总体或样本平均数群间方差的计算公式为 关键问题是影响抽样平均误差的主要因素 群间方差 总体 用表示 整群抽样一般都用不重复抽样 需要修正系数 一 平均数抽样平均误差的计算 二 成数抽样平均误差的计算 其中 R 总体群数 r 样本群数 总体或样本成数群间方差的计算公式为 数理统计的引入 某厂生产的一批产品中次品率为p 从中抽取10件产品装箱 1 没有次品的概率 2 平均有几件次品 概率 3 为以0 95的概率保证箱中有10件正品 箱中至少要装多少件产品 所有这些问题的关键是p是已知的 如何获取p 这就是数理统计的任务了 一个很自然的想法就是 首先从这批产品中随机抽取产品进行检验 怎样随机抽取这属于抽样理论与方法问题 其次利用概率论的知识处理实测数据 如何分析 处理实测数据 这属于统计推断的问题 也是我们研究的内容 统计推断常解决的问题 1 如何估计次品率p 2 如果以p 0 01为出厂的标准 这批产品能否出厂 数理统计的引入 参数估计问题 假设检验问题 7 3常用统计分布 上侧分位数u 0 1 满足 标准正态分布分位数 一 四种常用统计分布 对于正态分布有 上侧分位数u 阴影部分面积为 查表如 0 025时 u a分位数例 2 2分布 统计量的分布 之一 定理7 2 1设X1 X2 Xn相互独立且都服从标准正态分布 则 即随机变量 2服从自由度为n的卡方分布 标准正态随机变量的独立平方和 2分布的三条性质 性质1 数字特征 设 2 2 n 则有E 2 n D 2 2n 性质2 可加性 设Y1 Y2相互独立 且Y1 2 n1 Y1 2 n2 则Y1 Y2 2 n1 n2 性质3 大样本分位数 当n足够大 如n 45 时 有 2 n 的上侧分位数 0 1 阴影部分面积为 3 自由度为n的t分布T t n 又称学生氏分布 第一个研究者以Student作笔名发表文章 即随机变量T服从自由度为n的t分布 定理7 2 2设随机变量X Y相互独立 X N 0 1 Y 2 n 则 阴影部分面积为 t n 的上侧分位数t n 0 1 T分布的特点 1 关于纵轴对称 例查表计算 t t t1 因 P T t P T t 1 P T t 故P T t 1 即t t1 例查表计算 2 n较大时 4 F分布F F n1 n2 称X服从第一自由度为n1 第二自由度为n2的F分布 定理7 2 3设随机变量X Y相互独立 X 2 n1 Y 2 n2 则 即随机变量F服从第一自由度为n1 第二自由度为n2的F分布 例统计量的分布 之二 F n1 n2 的上侧分位数F n1 n2 0 1 阴影部分面积为 推论1 推论2 证 二 抽样分布定理 定理7 2 4 应用例 定理6 2 5 设正态总体X与Y相互独立 X 样本为X1 X2 Xn1 样本均值和样本方差为 Y 样本为Y1 Y2 Yn2 样本均值和样本方差为 有 分析 证明 2 服从正态分布 Sw2可化为 2分布 二者组合而成的统计量应服从t分布 因 相互独立 故U与V也相互独立 从而 总体 个体 简单随机样本 统计量 统计量的分布 正态总体的2个抽样定理 样本均值样本方差样本矩 样本相关系数 2分布t分布F分布 分位数 结构定理 例7 2 1设随机变量X服从正态分布N 0 1 对给定的 0 1 数u 满足 则x等于 u 是上侧 分位数 解 阴影部分面积为 1 2 面积为 例7 2 2统计量的分布 之一 解 设X1 X2 Xn是来自正态总体的容量为n的样本 求下列统计量的概率分布 例7 2 3查表计算概率 注意应注意分布表的定义与查法 解 例7 2 4统计量的分布 之二 设X1 X2 Xn m是来自正态总体的样本 求下列统计量的概率分布

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论