第四章 样本及抽样分布.ppt_第1页
第四章 样本及抽样分布.ppt_第2页
第四章 样本及抽样分布.ppt_第3页
第四章 样本及抽样分布.ppt_第4页
第四章 样本及抽样分布.ppt_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章样本及抽样分布 总体和样本随机抽样方法统计量几个常用的分布和抽样分布 4 1总体和样本 从本质上讲 总体就是所研究的随机变量或随机变量的分布 即一个具有确定概率分布的随机变量 一 总体在数理统计中 把所研究的对象的全体称为总体 通常指研究对象的某项数量指标 一般记为X 把总体的每一个基本单位称为个体 如全体在校生的身高X 某批灯泡的寿命Y 对不同的个体 X的取值是不同的 X是一个随机变量或随机向量 X或Y的分布也就完全描述了我们所关心的指标 即总体的分布 为方便起见 我们将X的可能取值的全体组成的集合称为总体 或直接称X为总体 X的分布也就是总体的分布 二 随机样本从总体X中抽出若干个个体称为样本 一般记为 X1 X2 Xn n称为样本容量 而对这n个个体的一次具体的观察结果 x1 x2 xn 是完全确定的一组数值 但它又随着每次抽样观察而改变 x1 x2 xn 称为样本观察值 如果样本 X1 X2 Xn 满足 1 代表性 样本的每个分量Xi与X有相同的分布 2 独立性 X1 X2 Xn是相互独立的随机变量 则称样本 X1 X2 Xn 为简单随机样本 总体 样本 样本观察值的关系 总体 样本 样本观察值 理论分布 统计是从手中已有的资料 样本观察值 去推断总体的情况 总体分布 样本是联系两者的桥梁 总体分布决定了样本取值的概率规律 也就是样本取到样本观察值的规律 因而可以用样本观察值去推断总体 4 2随机抽样方法 一 单纯随机抽样 simplerandomsampling 1 抽样方法根据研究目的选定总体 首先对总体中所有的观察单位编号 遵循随机原则 采用不放回抽取方法 从总体中随机抽取一定数量观察单位组成样本 具体方法 随机数字法 抽签法 2 优缺点 对所有观察单位编号 当数量大时 有难度 抽样误差的计算较方便 3 抽样误差的估计有限总体与无限总体总体类型均数标准误率的标准误无限总体有限总体 二 系统抽样 systematicsampling 又称等距 机械抽样1 抽样方法先将总体的观察单位按某顺序号等分成n个部分再从第一部分随机抽第k号观察单位 依次用相等间隔 机械地从每一部分各抽取一个观察单位组成样本 2 优缺点 1 抽样方法简便 2 易得到一个按比例分配的样本 抽样误差较小 3 仍需对每个观察单位编号 4 当观察单位按顺序有周期趋势或单调性趋势时 产生明显偏性 3 抽样误差无固定的计算公式 常按单纯随机抽样方法来计算 与总体的性质和被抽样个体间的间隔有关 三 整群抽样 clustersampling 1 抽样方法先将总体划分为若干个 群 组 每个群包括若干个观察单位 再随机抽取n个群 被抽到的各群的全部观察单位则组成样本 2 优缺点 1 在较大规模的现场调查中 易组织 较节省 2 若各群间的差异较大 该抽样方法的误差较大 四 分层抽样 stratifiedsampling 1 抽样方法先将总体按某种特征分成若干层 再从每一层内随机抽取一定数量的观察单位 合起来组成样本 1 按比例分配 按总体各层观察单位数的多少分配 2 最优分配 按各层观察单位数多少及其变异大小分配 2 优缺点 1 在一定程度上控制了抽样误差 尤其是最优分配法 2 应尽量使层内差别小而层间差别大 以提高效率 3 事先应了解各层的总体含量 最优分配还应了解标准差 多阶段随机抽样 4 3 统计量 样本是我们进行分析和推断的起点 但实际上我们并不直接用样本进行推断 而需对样本进行 加工 和 提炼 将分散于样本中的信息集中起来 为此引入统计量的概念 X1 X2 Xn g X1 X2 Xn 其中g x1 x2 xn 是 x1 x2 xn 的连续函数 如果g X1 X2 Xn 中不含有未知参数 称g X1 X2 Xn 为统计量 不含未知参数的样本的函数 如 未知 X1 X2 Xn 为X的一个样本 均为统计量 不是统计量 若 已知 2未知 X1 X2 X5 为X的一个样本 几个常用的统计量样本均值 样本方差 样本均方差 样本k阶原点矩 样本k阶中心矩 2 经验分布函数 例 随机观察总体 得到一个容量为10的样本值 解 把样本值按从小到大的顺序排列为 于是得经验分布函数为 值个数 从而 注 当样 本容量增大时 相邻两阶梯的跃度变低 阶梯宽度 变窄 容易想像 这样的阶梯形折线几乎就是一条 曲线 则 非常接近于 4 4几个常用的分布和抽样分布 一 2 分布1 定义 设n个r v X1 X2 Xn Xi N 0 1 i 1 2 n则 一 常用分布 2 分布 t 分布和F 分布 称为自由度为n的 2分布 n个相互独立的服从标准正态分布的随机变量的平方和服从 2 n 2 分布的密度函数f y 曲线 2 性质 1 2 2分布的可加性 X1 X2相互独立 则X1 X2 2 n1 n2 例1 X1 X2 X3 为X的一个样本 求 的分布 解因为 X1 X2 X3 为X的一个样本 Xi N i 1 2 3 则 i 1 2 3 附表1 附表只详列到n 45为止 附表2 附表3 例2 在Matlab中求解 例如 利用上面公式 而查详表可得 费舍尔 R A Fisher 证明 t分布又称学生氏 Student 分布 2 当n充分大时 其图形类似于标准正态变量概率密度的图形 由分布的对称性知 附表4 附表5 例3 在Matlab中求解 注 三 F 分布 1 定义若X 2 n1 Y 2 n2 X Y独立 则 称为第一自由度为n1 第二自由度为n2的F 分布 其概率密度为 根据定义可知 附表6 附表7 例4 在Matlab中求解 证明 4 正态总体的样本均值与样本方差的分布 定理一 定理二 证明 且两者独立 由t分布的定义知 定理三 定理四 证明 1 由定理二 2 重点内容小结 两个最重要的统计量 样本均值 样本方差 三个来自正态分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论