




已阅读5页,还剩52页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
参数估计 第五章 统计推断是统计学学习的主要任务之一 期间 经常会采用抽样调查的方法 抽样调查的目的不在于了解部分单位的情况 只是作为一种手段 从而认识总体的数量特征 引言 总体 参数估计 误差 教学内容 抽样研究与抽样误差总体均数的参数估计率的抽样误差和区间估计 抽样研究与抽样误差 通过电脑模拟实验从正态总体N 74 5 5 62 中抽取一个样本含量为10的样本 比较样本均数与总体均数以及样本标准差与总体标准差的异同 重复抽样100次 结果又如何 样本均数的分布有什么特征 电脑模拟实例 tdistribution 从上边电脑模拟实验我们可以发现 我们抽样得到的100个样本均数各不相同 与总体均数74 5也不相同 此外 得到的100个标准差各不相同 与总体标准差5 6也不相同 原因何在 我们从总体中抽取一个样本含量为10的样本 即抽样研究 会产生误差 抽样误差 案例解析 误差 error 指测量值和真值之间的差别 抽样误差 samplingerror 在抽样研究中 因抽样造成的样本统计量与样本统计量 样本统计量与总体参数的差别统称为抽样误差 原因 个体变异特征 A不可避免性B可控性 借助于电脑模拟实验 研究样本均数的抽样分布 以样本均数作为一个新的变量 借助于频数分布图来看看样本均数的分布特征 抽样分布 图5 1100个样本均数的频数分布图 以样本均数作为随机变量 有以下特点 1 各样本均数未必等于总体均数 2 样本均数之间存在差异 3 样本均数的分布很有规律 围绕着总体均数 中间多 两边少 左右基本对称 4 样本均数的变异范围较之原变量的变异范围大大缩小 数理统计研究表明 抽样误差具有一定的规律性 可以用特定的指标来描述 样本均数的标准差 简称标准误 standarderror SE 是描述均数的抽样误差大小的指标 标准误的概念 标准误的理论值 标准误的理论值的估计值 标准误的计算 前提 无限总体完全随机抽样 例5 1 随机抽取了60名成年男性 得到其脉搏均数为72次 分 标准差为5 8次 分 试计算其抽样误差 0 75 次 分 中心极限定理 从正态分布资料中 随机抽取例数n的样本 其样本均数也服从正态分布 当n足够大时 n 50 从偏态总体中抽样 其均数也近似于正态分布 2 从正态分布资料中 随机抽取例数n的样本 其样本均数的总体均数也为 其标准差为 标准误的用途 衡量样本均数的可靠性由于均数标准误越小 均数的抽样误差越小 样本均数就越可靠 估计总体均数的置信区间 用于均数的假设检验 标准误和标准差的区别与联系 t分布的概念对于正态变量X N 2 N 0 1 抽出无数个样本含量为n的样本 随机抽样 均数 标准差为 如果我们从一个总体中抽取无数个样本含量n足够大的样本 样本均数的分布服从正态分布 均数 标准差为 若 未知 人们只能用S代替 从而以代替 显然 它不再服从标准正态分布 W S Gosett于1908年用笔名student研究了它的分布规律 称之为t分布 n 1 Z分布 t分布 图2不同自由度的t分布曲线 1 t分布是一簇曲线 t分布有一个参数 2 t分布曲线以0为中心 左右对称 越小 曲线越扁平 3 t分布曲线较标准正态曲线要扁平些 逐渐增大 t分布曲线逐渐的逼近于标准正态曲线 若 则t分布曲线和标准正态曲线完全吻合 4 t分布曲线下的面积分布有一定规律 P380 t分布图形的特点 生物医学研究的统计方法第4章 图5 3自由度等于20时的t分布曲线 总体均数的参数估计 参数估计 用样本统计量来估计总体参数 点值估计 不计抽样误差 直接用样本均数来估计 区间估计 根据抽样误差的规律 按一定的概率估计总体均数的所在范围 统计上习惯用95 或99 可信区间表示总体均数可能所在范围 置信区间 置信限与置信区间 置信限是指置信区间的下限和上限 即可置信区间的两个端点值 置信区间指以上 下可信限为界的一个范围 如 的1 可信区间指一个范围 该范围包含 在内的可能性为1 不包含 在内的可能性为 常用的可信区间为95 和99 总体均数的95 置信区间表示的实际涵义是 如果从同一总体中重复抽取100份样本含量相同的独立样本 每份样本分别计算1个置信区间 在100个置信区间中 将大约有95个置信区间覆盖总体均数 5个置信区间不覆盖总体均数 通常情况下 我们只进行一次抽样 对于某一次估计的置信区间 我们总是宣称这个区间覆盖了总体均数 但不一定是真的覆盖了总体均数 于是 我们补充一句 置信水平为95 均值的抽样分布 1 区间包含了 的区间未包含 总体均数 的区间估计 正态分布法 1 已知2 未知 但n 50时 一 正态分布法适用条件 已知或 未知但n较大时 n 50 例 在郑州市随机抽取了100名成年男性 测得其血清胆固醇含量为192 5mg dl 标准差为28 6mg dl 试估计郑州市成年男性血清胆固醇总体均数的95 置信区间 郑州市成年男性血清胆固醇总体均数的95 置信区间为 186 9 198 1 mg dl 二 t分布法适用条件 未知且n较小时 n 50 例5 3 已知某地25名成年女性腰围均数为77 8cm 标准差为9 2cm 试计算该地成年女性腰围均数的95 和99 置信区间 生物医学研究的统计方法第4章 区别点均数的置信区间参考值范围意义包含总体均数的可 正常人 的解剖 生理能范围生化指标的波动范围计算公式用途估计总体均数判断观察对象的某项指标是否正常 置信区间与医学参考值范围不同 率的抽样误差及区间估计 率的抽样误差 从同一总体中随机抽取样本含量相同的若干个样本 各样本率之间不完全相同 这些样本率间的差异 同时反映了样本率与总体率之间的差异 这种由抽样造成的样本率与总体率的差异称为率的抽样误差 标准误 衡量率的抽样误差大小的指标是率的标准误 p 率的标准误越小 率的抽样误差越小 用样本率估计总体率的可靠性越好 反之亦然 3率的标准误的计算 实际工作中 由于 往往是未知的 可用样本率p作 的估计值 计算率的标准误的估计值 4率的标准误的用途 1 衡量样本率的抽样误差的大小 2 估计总体率的可信区间 3 检验样本率间差异的显著性 总体率的估计有点 值 估计和区间估计 点估计是简单地用样本率来估计总体率 区间估计是求出总体率的可能范围 样本率的理论分布和样本含量n 阳性率p的大小有关 所以需要根据n和p的大小不同 分别选用下列两种方法 查表法 当样本含量n较小 如n 50 特别是p很接近于0或1时 可直接根据样本含量n和阳性数X查出总体率的可信区间 例2003年4 6月某医院重症监护病房收治重症SARS患者38人 其中死亡12人 求SARS病死率的95 置信区间 查百分率的可信区间 P393 在n 38和X 12的交叉点处下 上限界值为18和49 SARS病死率的95 置信区间18 49 由于附表百分率的可信区间中X值只列出了X n 2的部分 当X n 2时 应以n X查表 再从100中减去查得的数值即为所求置信
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年临床执业医师模拟题库【培优A卷】附答案详解
- 2024年安全员考试复习提分资料带答案详解(研优卷)
- 2025年中考数学总复习《分式》全真模拟模拟题附参考答案详解【黄金题型】
- 2024-2025学年自考专业(计算机网络)每日一练试卷及参考答案详解【培优】
- 小企业用工合同范本4篇
- 2025年陈巴尔虎旗事业单位引进人才(54人)考前自测高频考点模拟试题及答案详解(网校专用)
- 2025年美容化妆人员常考点试卷附答案详解(培优A卷)
- 2025安全监察人员试题附答案详解(精练)
- 自考专业(计算机信息管理)试题及完整答案详解【有一套】
- 高校教师资格证之《高等教育法规》综合练习含答案详解(新)
- GB/T 13452.2-2008色漆和清漆漆膜厚度的测定
- GB/T 12730-2008一般传动用窄V带
- ps6000自动化系统用户操作及问题处理培训
- 手机拍照技巧大全课件
- 基层医院如何做好临床科研课件
- 核电质量保证培训讲义课件
- 2021年东台市城市建设投资发展集团有限公司校园招聘笔试试题及答案解析
- 九年级英语全册单元测试题全套带答案(人教版新目标)
- 城市轨道交通安全管理课件(完整版)
- 礼仪概述PPT幻灯片课件(PPT 39页)
- 改革开放中国奇迹PPT33页课件
评论
0/150
提交评论