




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、(预防医学课件03参数估计第三节第三节 均数的抽样误差与均数的抽样误差与 总体均数的估计总体均数的估计23掌握:掌握:n 抽样误差与标准误的概念及计算;抽样误差与标准误的概念及计算;n参数估计的概念、计算及含义。参数估计的概念、计算及含义。熟悉熟悉nt t 分布图形及特点、分布图形及特点、t t界值表的应用。界值表的应用。本节课学习目的与要求本节课学习目的与要求41均数的抽样误差与标准误均数的抽样误差与标准误2t 分布分布参数估计参数估计3总体均数的估计总体均数的估计5用样本信息来推用样本信息来推断总体的特征,断总体的特征,称为统计推断。称为统计推断。假设检验假设检验hypothesis te
2、st统计推断统计推断statistical inference参数估计参数估计parameter estimate用样本指标统计量来用样本指标统计量来估计总体指标参数,估计总体指标参数,称为参数估计。称为参数估计。6样本样本参数参数统计量统计量总体总体 抽样抽样统计推断统计推断统计描述统计描述 抽样误差抽样误差(sampling error)是指在没有是指在没有系统误差和过失误差的前提下,单纯由系统误差和过失误差的前提下,单纯由于随机抽取样本而产生的样本指标于随机抽取样本而产生的样本指标(统计统计量量)间或样本指标与总体指标间或样本指标与总体指标(参数参数)之间之间的随机性误差。的随机性误差。
3、1 均数的抽样误差与标准误均数的抽样误差与标准误7均数的抽样误差均数的抽样误差十堰地十堰地2021年年18岁女生身高服从均数为,标岁女生身高服从均数为,标准差为的正态分布。准差为的正态分布。 153.2154.1154.8157.4nj=30100个个 =155.4cm =5.3cmX1,X2,X3,Xi8n 抽样研究的目的抽样研究的目的是用样本信息推断总体是用样本信息推断总体特征。特征。n 因随机抽样造成的因随机抽样造成的样本均数与总体均数样本均数与总体均数之间差异或之间差异或各样本均数各样本均数之间差异称为之间差异称为均数均数的抽样误差的抽样误差。 抽样实验:抽样实验: (a)样本均数的分
4、布特点:样本均数的分布特点: 1. 1. 各样本均数未必等于总体均数;各样本均数未必等于总体均数; 2. 2. 样本均数之间存在差异;样本均数之间存在差异; 3. 3. 样本均数的分布很有规律,围样本均数的分布很有规律,围绕着总体均数,中间多,两边少,左右根绕着总体均数,中间多,两边少,左右根本对称,也服从正态分布。本对称,也服从正态分布。11 常将样本均数的标准差称为常将样本均数的标准差称为均数的标均数的标准误准误。反映。反映样本均数间样本均数间的离散程度,也反的离散程度,也反映样本均数与总体均数间的差异。映样本均数与总体均数间的差异。 标准误标准误是表示抽样误差大小的指标。是表示抽样误差大
5、小的指标。12xnnSSX标准误的计算标准误的计算13_ _4 .60 .3 8()1 5 0XSScmn_X14n 反映反映样本均数样本均数的的可靠性可靠性: 同质的资料标准误越小,抽样误差越小,样本同质的资料标准误越小,抽样误差越小,样本均数越接近总体均数,说明由样本均数推断总体均数越接近总体均数,说明由样本均数推断总体均数的可靠性越大。均数的可靠性越大。n 估计估计总体均数:总体均数: 结合样本均数结合样本均数 可对总体均数可对总体均数 做区间估计做区间估计n 假设检验假设检验:进行均数的进行均数的 t 检验检验标准误的标准误的应用应用_X15标准差与标准误的区别标准差与标准误的区别 标
6、准差标准差 S 标准误标准误SX意义意义 个体变量值变异度大小,个体变量值变异度大小, 样本均数抽样样本均数抽样误差大小,误差大小, 即原始变量值的离散程度。即原始变量值的离散程度。 即样本均数的即样本均数的离散程度。离散程度。应用应用 医学参考值范围,对某一医学参考值范围,对某一 区间估计,对区间估计,对总体均数的总体均数的 变量值是否在正常范围内变量值是否在正常范围内 大小作出初步大小作出初步判断;判断; 作出初步判断作出初步判断 ;计算变异;计算变异 用于假设检验用于假设检验。 系数、标准误。系数、标准误。-16 t t 分布于分布于 1908 1908 年由英国统计学家年由英国统计学家
7、W.S. W.S. GossetGosset以以“ Student “ Student 笔名发表,故又称笔名发表,故又称Student tStudent t分布分布Studentt-Studentt-distributiondistribution或称为或称为“ “ 学生氏学生氏 t t 分布分布。 t t 分布主要用于解决小样本的问题。分布主要用于解决小样本的问题。2. t 分布分布t-distribution)17随机变量随机变量的的标准正态分布标准正态分布Xu=0,=1=0, =1样本均数样本均数的的标准正态分布标准正态分布XXuX1819 实际工作中,实际工作中, 往往是未知的,常用往
8、往是未知的,常用 s 作为作为 的估计值,为与的估计值,为与 u 转换区别,称为转换区别,称为 t 变换,变换,t 值的分布为值的分布为 t 分布分布。XSXt XXU XXuXXtS t 分布是抽样分布中的一种连续型分布,分布是抽样分布中的一种连续型分布,主要用主要用于于 t 检验检验和和总体均数的区间估计总体均数的区间估计。20t 分布的特征分布的特征l以以0为中心,左右对称为中心,左右对称l其形态变化与自由度其形态变化与自由度的大小有关的大小有关 越小,越小,t值分布越离散,曲线峰高越矮尾部越高值分布越离散,曲线峰高越矮尾部越高 越大,越大,t值分布越集中,曲线峰高上移尾部降低值分布越集
9、中,曲线峰高上移尾部降低 趋近趋近+,t分布分布趋近标准正态分布趋近标准正态分布21tf(t) = (标准正态分布标准正态分布) = 5 = 1图图15-5 自由度分别为自由度分别为1、5、的的t分布分布22 在在t界值表中列出了界值表中列出了t 分布曲线下尾端分布曲线下尾端的面积的面积 ,其中:,其中: 一侧尾部的面积称为单侧概率,对应的一侧尾部的面积称为单侧概率,对应的t值表示为值表示为t . ; 两侧尾部的面积称为双侧概率,对应的两侧尾部的面积称为双侧概率,对应的t值表示为值表示为t /2. 。t 界值表界值表2324 由由 t 界值表可知:界值表可知:相同自由度时,相同自由度时,t越大
10、,概率越大,概率P越越 小。小。 相同相同 t 值时,双侧概率是单侧概率的两倍。值时,双侧概率是单侧概率的两倍。 =时,时,t 分布即为分布即为u分布,故分布,故t界值表中最界值表中最 后一行是后一行是u界值。界值。25tB0AP26 t 分布主要用于:分布主要用于:n 总体均数置信区间的估计总体均数置信区间的估计n t 检验检验27点估计点估计point estimation区间估计区间估计interval estimation 统计推断统计推断 参数估计参数估计假设检验假设检验3. 总体均数的估计总体均数的估计用样本指标统计量来用样本指标统计量来估计总体指标参数,估计总体指标参数,称为参数
11、估计。称为参数估计。 X ,即认为即认为20002000年该地所有健康成年男年该地所有健康成年男性血红蛋白量的总体均数为性血红蛋白量的总体均数为125125g/L 。1) 点估计:点估计: 用样本统计量直接作为总体参数的估计值。用样本统计量直接作为总体参数的估计值。 例如例如 于于2000年测得某地年测得某地2727例健康成年男性血例健康成年男性血红蛋白量的样本均数为红蛋白量的样本均数为125125g/L,试估计其总体均,试估计其总体均数。数。29n 均数的区间估计:均数的区间估计:指按预先给定的概率,指按预先给定的概率,确定的未知参数的可能范围。确定的未知参数的可能范围。n 估计错误的概率为
12、估计错误的概率为,估计正确的概率估计正确的概率为为1-。2) 区间估计区间估计30n 1- 1-称可信度或置信度称可信度或置信度confidence confidence level level ,常取,常取 95% 95% 或或 99% 99% 。n 可信限可信限confidence limitconfidence limit,CLCL:下限:下限lower limitlower limit,L L ,上限,上限upper limitupper limit,U U n 根据一定的可信度估计得到的区间,称根据一定的可信度估计得到的区间,称为可信区间为可信区间confidence interva
13、l,CI。1、 时时, -1.96u +1.96 1.961.96XX1.961.96xxxx (1.96,1.96)xxxx根据条件,可信区间的估计有根据条件,可信区间的估计有3 3种方法:种方法:1.961.96t 1 .9 61 .9 6xxs1.961.96xxxSxS(1.96,1.96)xxxSxS2、 未知,但未知,但n足够大时足够大时(n30:3、 未知且未知且n小小(n30时:时: 0.050.05vvttt 0.050.05vvxxtts0.05( )0.05( )xxxtSxtS0.05()0.05()(,)xxxtSxtS34例例12 随机抽查某地随机抽查某地 10 名
14、男孩出生体重名男孩出生体重 , 得其得其平均体重为平均体重为 3.21kg , 标准差为标准差为 0.47kg , 试估计试估计该地男孩出生体重均数的该地男孩出生体重均数的 95% 可信区间。可信区间。35查查 t 值表值表:t(0.05/2,9)=2. 262 该地男孩出生体重均数的该地男孩出生体重均数的95%可信区间为可信区间为: 2.873.55 kg_ _ _( 0 .0 5 / 2 ,)tS(3.21 2.262 0.47/ 10,3.21 2.262 0.47/ 10)36例例 某地抽查某地抽查 150 名名 3 岁女孩岁女孩 , 得身高均数为得身高均数为 92.8cm ,标准误为
15、标准误为 0.38cm , 试估计该地试估计该地 3 岁女岁女孩身高总体均数的孩身高总体均数的 95% 可信区间。可信区间。37_96.1_S(92.8 1.96 0.38,92.8 1.96 0.38)38 从理论上讲,进行从理论上讲,进行 100 次抽样,可算得次抽样,可算得100 个可信区间,平均有个可信区间,平均有 95% 或或 99% 的可的可信区间包含了总体参数。信区间包含了总体参数。39例:假设例:假设=0.05,反复抽样,反复抽样 100次,根据样本次,根据样本均数可估计得到均数可估计得到100个可信区间,这个可信区间,这100个区个区间中约有间中约有95个包含个包含,有,有5
16、个不包含个不包含。 40可信区间的可信区间的两个要素两个要素可信度可信度 1- 精度精度即可信区间即可信区间的宽度的宽度可信区间的本卷须知可信区间的本卷须知是可信区间包含是可信区间包含总体均数总体均数的概率的概率41 置信度和精度置信度和精度互相制约互相制约。为了提高可信度,得放大置信区间,降低为了提高可信度,得放大置信区间,降低精度;精度;反之提高了精度,必然会使可信度降低。反之提高了精度,必然会使可信度降低。42均数的可信区间与参考值范围的区别均数的可信区间与参考值范围的区别 区别点区别点 均数的可信区间均数的可信区间 参考值范围参考值范围XXvXuSXtS或 /2 /2,100XXXuSPP或/2意义意义计算计算公式公式 用途用途按预先
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 网红家居装饰灵感创新创业项目商业计划书
- 园艺衍生品制作创新创业项目商业计划书
- 乳制品品质提升创新创业项目商业计划书
- oa系统公文管理办法
- 预制箱梁制作、运输与施工劳务分包合同范本
- 饲料公司职业健康安全告知及事故应急预案合同
- 郑州学校命名管理办法
- 老宅基地使用权买卖合同书:乡村振兴示范村建设
- 个人线上学习管理办法
- 马铃薯全产业链投资合作与市场开发协议
- 中学群团工作管理制度
- Q-GDW10250-2025 输变电工程建设安全文明施工规程
- 物流车队轮胎管理制度
- 碳化硅项目可行性分析报告
- 2025年试验检测师之桥梁隧道工程能力检测试卷A卷附答案
- 老年共病管理中国专家共识(2023)课件
- 惠州市惠阳区水资源综合规划 修编(2020-2035 年)
- AI大模型赋能数据治理解决方案
- 应聘简历模板进厂
- 公司配送员工管理制度
- 工厂员工星级管理制度
评论
0/150
提交评论