医学统计学参数估计_第1页
医学统计学参数估计_第2页
医学统计学参数估计_第3页
医学统计学参数估计_第4页
医学统计学参数估计_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学,参数估计,卫生部“十二五”规划教材,抽样误差,概述,由个体差异和抽样造成的样本统计量与总体参数的差异。,包括:样本统计量与总体参数间的差异,样本统计量间的差异。,均数的抽样误差,抽样实验:利用计算机从近似正态分布N(4.6602,0.57462)总体中重复随机抽样,每次抽取一个样本含量n=5的样本。总体均数=4.6602,总体方差=0.5746,样本1(n=5):,样本2(n=5):,样本3(n=5):,样本4(n=5):,样本均数总体均数样本均数的趋势?,从总体N(4.6602,0.57462)中抽样,n5,1000份样本;n10,1000份样本;n30,1000份样本。,具有如下特点:各样本均数未必等于总体均数;各样本均数间存在差异;样本均数的分布围绕着总体均数呈现中间多、两边少、左右基本对称,近似服从正态分布;样本均数的变异范围较之原变量的变异范围小;随着样本含量的增大,样本均数的变异范围逐渐缩小。,数理统计原理和中心极限定理表明:在正态总体N(,2)中,反复多次随机抽取样本含量固定为n的样本,其样本均数服从正态分布,即的总体均数仍为,样本均数的标准差为。在样本含量很大的情况下(n50),无论原始测量变量服从什么分布,的抽样分布都近似服从正态分布N(,2/n)。,标准误(standarderror,SE),指样本统计量的标准差。,均数的标准误,总体均数标准误用表示,样本均数标准误用表示。,均数的标准误(standarderrorofmean,SEM),指样本均数的标准误。它反映样本均数间的离散程度,反映样本均数与相应总体均数间的差异,说明了均数抽样误差的大小。,均数的标准误,在n一定的情况下,标准误与标准差呈正比,说明当总体中各观测值变异较小时,抽到的与可能相差较小,用估计的可靠程度高;反之,当总体中各观测值变异较大时,可靠程度较低。标准误与样本含量的平方根呈反比,说明在同一总体中随机抽样,n越大,标准误越小。,率的抽样误差,率的标准误,总体率标准误用p表示,样本率标准误用Sp表示。,率的标准误(standarderrorofrate,SER),指样本率的标准误。它反映样本率间的离散程度,反映样本率与相应总体率间的差异,说明了率抽样误差的大小。,总体均数的估计,概述,样本,均数、标准差、标准误,总体,已知,未知,统计推断,概述,假设检验hypothesistesting,参数估计parameterestimation,统计推断statisticalinference,点估计(pointestimation),是用样本统计量直接作为其总体参数的估计值。,区间估计(intervalestimation),是按预先给定的概率(1-)所确定的包含未知总体参数的一个范围。,点估计,优点:表达简单缺点:未考虑抽样误差,无法评价参数估计的准确程度,欲调查某市2015年7岁正常发育男孩的身高,随机抽取该市9名7岁正常发育男孩,计算得=121.44cm,S=5.75cm,某市2015年7岁正常发育男孩的平均身高为121.44cm,标准差为5.75cm,可信区间,在区间估计中,预先给定的概率(1-),称为可信度(confidencelevel),常取95%或99%。,通过可信度,计算得到的区间范围,称为可信区间(confidenceinterval,CI)。,可信区间由两个数值界定的可信限(confidencelimit,CL)构成,较小的数值为下限(lowerlimit,L),较大的数值为上限(upperlimit,U),一般表示为LU。,可信度为95%可信区间的涵义:若重复100次样本含量相同的抽样,每个样本均按同一方法构建95%可信区间,则理论上平均有95个可信区间包含了总体均数,只有5个可信区间未包含。,可信区间,可信区间估计的优劣:准确性,反映可信度1-的大小,其值越接近1越好。精确性,用可信区间的宽度CUCL衡量,宽度越小越好。,t分布,t分布(t-distribution),最早由戈塞于1908年提出,主要用于总体均数的区间估计和t检验等。,W.S.Gosset,t分布,若样本含量为n的样本均数服从总体均数为、总体标准差为的正态分布,则通过z变换可将其转换为标准正态分布N(0,12),即z分布。,在实际工作中,由于未知,用代替,则z变换服从t分布。,为自由度(degreeoffreedom,df),指能够自由取值的变量个数。,t分布,t分布的特点:t分布图是一簇曲线,曲线的形态变化与自由度有关。随的增大,曲线越来越接近标准正态分布曲线;当时,t分布的极限分布就是标准正态分布。,t分布,t分布的特点:t分布的密度曲线下面积有一定的规律性。,自由度=9时,单侧(a)与双侧(b)t分布曲线下尾部面积,t分布,在t界值表中,横标目为自由度,纵标目为尾部概率。一侧尾部面积称为单侧概率(one-tailedprobability),两侧尾部面积之和称为双侧概率(two-tailedprobability)。,当和确定时,与单侧概率对应的t界值用t,表示,与双侧概率对应的t界值用t/2,表示。,t分布,从t界值表中看出:在相同自由度时,t值越大,概率P越小。,总体均数的区间估计,已知,设XN(,2),则N(,2/n)。,通过z变换,则N(0,1),根据标准正态分布原理,则,总体均数的可信度为(1-)的可信区间为,总体均数的区间估计,未知,样本较小,未知,用代替,则不再服从标准正态分布,而服从自由度为=n-1的t分布。,根据t分布原理,则,总体均数的可信度为(1-)的可信区间为,总体均数的区间估计,未知,大样本,按照中心极限定理,同时t分布逼近标准正态分布,则总体均数的可信度为(1-)的可信区间为,【例】随机抽取某地健康男子20人,测得该样本的收缩压均数为118.4mmHg,标准差为10.8mmHg,试估计该地男子收缩压总体均数的95%可信区间。,本例20-119,0.05,t0.05,192.093代入(118.42.09310.8/,18.4+2.09310.8/)(113.3,123.5)该地健康男子收缩压总体均数的95%可信区间为(113.3,123.5)mmHg。,【例】随机抽取某地90名正常成年女性,计算红细胞的均值为4.18(1012/L)、标准差为0.29(1012/L)。试估计该地正常成年女性红细胞数总体均数的95%可信区间。,本例0.05,u0.05/21.96代入(4.181.960.29/,4.18+1.960.29/)(4.12,4.24)该地正常成年女性红细胞数总体均数的95%可信区间为(4.12,4.24)(1012/L)。,小结,两总体均数差值的区间估计,在实际工作中,常常需要估计两总体均数之差12的大小,需估计两总体均数差值的可信区间。,根据数理统计理论,则,12的可信度为(1-)的可信区间为,【例】某医师观察某新药治疗肺炎的疗效,将肺炎病人随机分为对照组和新药组。两组的退热天数试验资料如下表。试估计两药平均退热天数之差的95%可信区间。,两药平均退热天数之差的95%可信区间为(1.00,1.80)天。,总体率的估计,总体率的区间估计,小样本率的区间估计,在样本例数较小,且样本率接近1或0时,利用二项分布可估计其总体率的(1-)可信区间。,当n50,样本例数n和阳性例数Xn/2时,直接查表得到95%和99%可信区间。,当阳性例数Xn/2时,用nX查表,获得总体阴性率可信区间,再用1减去总体阴性率可信区间,既为总体阳性率可信区间。,【例】某疗法治疗某病10人,7人有效。求该疗法有效率的95%可信区间。,1.本例n=10,阳性例数X=75;2.用nX=107=3查表,得到总体阴性率95%可信区间为(7%,65%);3.用1减去此区间的上下限,可获得最终答案。,该疗法有效率的95%可信区间为(35%,93%)。,总体率的区间估计,大样本率的区间估计,在样本例数较大,且p和1p均不太小,如np与n(1p)均大于5时,样本率p的抽样分布近似正态分布,可按正态分布近似法求总体率的(1-)可信区间。,【例】为了解某医院剖宫产情况,在该医院随机抽查106人,其中施行剖宫产者62人。试估计该医院剖宫产率。,本例n=106,X=62,p=62/106=58.5%,np=62,n(1p)=44,该医院总体剖宫产率的95%可信区间为(49.1%,67.9%)。,两总体率差值的区间估计,设两样本率分别为p1和p2,当n1与n2均较

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论