06-抽样分布及参数估计_第1页
06-抽样分布及参数估计_第2页
06-抽样分布及参数估计_第3页
06-抽样分布及参数估计_第4页
06-抽样分布及参数估计_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六讲 抽样误差与抽样分布 统计学研究特点 研究的是样本 要对总体作出推断 得到的是频率 要对概率作出推断 需进行参数估计和假设检验 抽样研究 抽样误差 抽样研究统计推断 样本 测量计算 随机抽样 推断 总体参数 参数估计 误差与抽样误差 定量变量 从总体中随机抽取一份样本 计算其均数 该均数不等于总体均数 为什么 再从该总体中随机抽取一份样本 算其均数 前后抽取的两个样本均数不等 为什么 均数的抽样误差 用统计学的方法怎样从样本现象推断总体的特征 这种推断可信吗 可信程度有多大 1 1样本均数的抽样分布1 2常用的抽样分布 t分布1 3参数估计 总体均数的估计 一 样本均数的抽样分布 实验一 假定某年某地16岁所有女学生的身高服从总体均数 155 4cm 总体标准差s2 5 3cm的正态分布 记作X N 155 4 5 32 在这样的一个总体中进行随机抽样 1 每次均抽取30例组成一个样本2 共抽100次3 计算每个样本的均数 153 6 153 1 154 9 157 7 样本个数为100 得出了一组数据 一 正态分布样本均数的抽样分布 表6 1从正态总体N 155 4 5 32 抽样得到的100个样本均数的分布频数表 n 30 样本均数的分布特征 频数 样本均数 cm 图6 1 图6 1某年某地女学生身高样本均数分布的频数表 小结 1 各样本均数未必等于总体均数 2 样本均数之间存在差异 3 样本均数的分布总是围绕着总体均数 近似地呈正态分布 所以若随机变量X服从X N s2 的正态分布 则以之随机抽样计算的样本均数所构成的分布也呈正态分布 1 样本均数的总体均数仍等于原来的总体均数 2 样本均数的标准差叫做标准误 standarderrorofmean SEM 记作 是描述均数的抽样误差大小的指标 中心极限定理 标准误 standarderror SE 概念 即样本均数的标准差 是描述均数的抽样误差大小的指标 2 实际工作中 常用S代 计算样本标准误 即样本均数的估计标准误 样本量n越大 样本均数的标准误就越小 1 标准误的理论值 标准误的计算 所以增加样本量n 可以降低抽样误差 举例 大规模普查得某地健康成年男子血红蛋白总体均数为 135g L 20 5g L 若在其中进行随机抽样 样本量n 100 样本均数X 130g L S 23 4g L 求其理论标准误和样本均数的估计标准误 2 样本均数的估计标准误 1 理论标准误 解 标准误的意义 1 标准误 standarderror 是描述均数的抽样误差大小的指标 可用来衡量样本均数的可靠性 均数标准误越小 说明均数的抽样误差越小 样本均数代表总体均数就越可靠 2 估计总体均数的可信区间 3 用于均数的假设检验 均数 标准差 N 2 标准差与标准误的区别与联系 总体分布 抽样分布 原变量 样本均数 标准差与标准误的区别与联系 二 常用的抽样分布 t分布 抽出n足够大的样本 随机抽样 样本均数 标准化转换 N 0 1 一 t分布的概念 实际工作中 是未知的 所以常需以代替 u分布 N 0 1 的标准正态分布 t分布 非标准正态分布 1908年W S Gosett研究了它的分布规律 提出它不服从标准正态分布的规律 而服从自由度 n 1的t分布 后人用其笔名student命名 称之为student st distribution 简称t分布 t 分布 实验三 从前述13岁女学生身高这个正态总体中分别作样本量为3或50的随机抽样 各取1000份样本 分别得到1000个样本的均数及其标准误 对它们分别作t转换 将t值绘成直方图 n 3时的t分布 n 50时的t分布 所以 不同的自由度 n 1 即有不同的t分布 实验三 从前述13岁女学生身高这个正态总体中分别作样本量为3或50的随机抽样 各取1000份样本 分别得到1000个样本的均数及其标准误 对它们分别作t转换 将t值绘成直方图 n 3时的t分布 n 50时的t分布 所以 不同的自由度 n 1 即有不同的t分布 不同自由度的t分布的曲线 二 t分布图形的特征 t分布的图形特征 t分布是一簇曲线 曲线均呈单峰分布 以0为中心 左右对称 它仅受自由度 的影响 不同 对应不同的曲线 与标准正态曲线相比 t曲线较扁平 越小 t值越分散 曲线的峰越矮 尾越高 随 增大 t分布逐渐逼近标准正态分布 若 则t分布完全成为标准正态分布 t分布的曲线下面积可通过查 t分布界值表 得到 1 t分布曲线下的整个面积为1 2 t分布曲线下从a到b的面积为t值分布在此范围内的百分比 即t值落在此范围内的概率P t分布曲线下的面积分布规律 附表2t界值表 三 t界值表 以自由度 为横标目 概率P为纵标目 表中数字表示当 和P确定时 对应的是正侧或双侧的t临界值表 记作t 或t 2 包括 单侧概率的t临界值 记作t 双侧概率的t临界值 记作t 2 双侧 P t t P t t 2P t t t 1 单侧 P t t 或P t t 故单侧 和双侧2 的t界值同 即单侧t 双侧t2 1 相同 时 t值越大 对应的尾部概率就越小 2 相同t值 双侧尾部概率是单侧尾部概率的2倍 例1查表 当 9时 单侧 0 025对应的t界值 例2查表 当 9时 双侧 0 05对应的t界值 三 参数估计 总体均数的估计 抽样研究统计推断 样本 测量计算 随机抽样 推断 总体参数 一 基本概念 参数估计 Parameterestimation 用样本信息估计总体参数 包括 点值估计 Pointestimation 不考虑抽样误差 直接用样本统计量来作为总体参数的估计值 区间估计 Intervalestimation 考虑抽样误差 按一定的概率或可信度 1 用一个区间来估计总体参数的所在范围 这个区间范围叫总体参数的1 的可信区间 confidenceinterval CI 或置信区间 一般取值0 05或0 01 所以1 为0 95或0 99 若确定1 0 95 则根据t分布的特征 t有95 可能性在 t0 05 2到t0 05 2间 故 注明 可信程度95 1 概率包含了 的概率未包含 可信区间概念 总体均数的1 可信区间指一个范围 指该范围包含 在内的可能性为1 不包含 在内的可能性为 常用1 为95 和99 又称置信区间 可信限的概念 指可信区间的下限和上限 即两个端点值 可信区间是指以上 下可信限为界的一个范围 但不包含上下限两个值 故用 表示 其为开区间 上可信限 下可信限 实验 从前面某年某地所有女学生所构成的正态总体N 155 4 5 32 抽到100份随机样本 计算每份样本的95 可信区间 1 可信度的含义 表6 1从正态总体N 155 4 5 32 抽到的100份随机样本的可信区间 n 30 1 5 可信度实际含义 从总体中进行随机抽样 共作100次抽样 每个样本可算得一个可信区间 得100个可信区间 平均有95个可信区间包括 估计正确 只有5个可信区间不包括 估计错误 二 正态总体均数 的区间估计 正态分布法 1 总体方差 2已知 呈标准正态u分布2 总体方差 2未知 但样本n较大 n 30 时 接近于标准正态u分布 举例 抽样得到一个n 10的样本 样本均数为70 54 标准差为5 79 求该次抽样的95 及99 的可信区间 查t值表 答 即 此次抽样95 的可信区间为 69 40 74 68 99 的可信区间为 63 59 76 49 1 t分布法 小结 t分布法适用条件和计算公式 适用条件 未知n较小时 n 30 区间范围 2 正态分布法 适用条件 样本较大时 n 100 t分布近似于标准正态分布 此时用Z值代替t值参与计算 其相应的总体均数1 的可信区间范围为 举例 测得某地110名18岁男大学生身高 172 73cm S 4 19cm 估计该地18岁男大学生身高均数的95 和99 的可信区间 n 110 172 73cm S 4 19cm 双侧u0 05 1 96 答 即 该地18岁男大学生身高均数的95 可信区间为171 97cm 173 49cm 1 明确条件 2 用正态分布法求可信区间 可信区间与医学参考值范围的不同 最佳选择题 A t分布图是一簇曲线B t分布图是单峰分布C 当 时 t ZD t分布图以0为中心 左右对称E 相同 时 越大 P越大 1 关于以0为中心的t分布 错误的是 2 某指标的均数为 标准差为S 由公式计算出来的区间称为 A 99 参考值范围B 95 参考值范围C 99 置信区间D 95 置信区间E 90 置信区间 3 在已知均数为 标准差为 的正态总体中随机抽样 的概率为5 A B C D E

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论