总体率的估计和假设检验(卫生统计学课件)_第1页
总体率的估计和假设检验(卫生统计学课件)_第2页
总体率的估计和假设检验(卫生统计学课件)_第3页
总体率的估计和假设检验(卫生统计学课件)_第4页
总体率的估计和假设检验(卫生统计学课件)_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

率的标准误的计算

率的标准误计算公式为:在一般情况下,总体率往往是未知的,此时可用样本率来代替总体率,其估计值为:

率的标准误的计算例1检查居民800人粪便中蛔虫阳性200人,阳性率为25%,试求阳性率的标准误。本例:n=800,p=0.25,1-p=0.75,率的抽样误差

在同一总体中按一定的样本含量n抽样,样本率和总体率或样本率之间也存在着差异,这种差异称为率的抽样误差。

率的抽样误差的大小是用率的标准误来表示的。

率的标准误越小,则率的抽样误差越小,率的标准误越大,则率的抽样误差越大。

率的抽样误差总体均数置信区间的含义及应用点击添加文本点击添加文本点击添加文本点击添加文本学习内容总体均数的区间估计两总体均数差值的区间估计123均数可信区间的含义一、总体均数可信区间的含义总体均数可信区间是指按预先给定的概率

计算得到的一个区间,该区间由下限和上限构成。1-α(如95%)总体均数可信区间的含义是:总体均数被包含在该区间内的可能性是1-α,即(95%),没有被包含的可能性为α,即(5%)。二、总体均数的区间估计(一)σ

已知如果变量服从均数为μ、标准差为的正态分布,则:服从标准正态分布。则:则95%可信区间为:

其中,为标准正态分布的双侧界值。一般情况(二)σ未知1.t分布事实上,总体标准差通常是未知的,这时我们可以用其估计量S代替,但在这种情况下,已不再服从标准正态分布,而是服从著名的t

分布。不同自由度的t分布图WilliamGosset2.可信区间的计算

1.未知σ且n较小(n<100)按t分布的原理2.已知σ或n较大(n≥100)按u分布的原理例1某医生测得25名动脉粥样硬化患者血浆纤维蛋白原含量的均数为3.32g/L,标准差为0.57g/L,试计算该种病人血浆纤维蛋白原含量总体均数的95%可信区间。下限:(g/L)上限:(g/L)

例2试计算例6-1中该地成年男子红细胞总体均数的95%可信区间。本例属于大样本,可采用正态近似的方法计算可信区间(),则95%可信区间为:下限:(/L)上限:(/L)实例模拟抽样和可信区间示意图3.单侧可信区间前面涉及的都是双侧可信区间。但有些情况下,我们所关心的仅仅是单侧的可信限。单侧可信区间与双侧可信区间的计算公式基本相同,只需将公式中的抽样分布的双侧界值换成单侧界值,同时只取下限或上限。实际中,有时需要计算两个总体均数差值的可信区间,例如通过计算两种降压药物平均降压的差值比较两种药物疗效的差别,其双侧可信区间的计算公式为:三、两总体均数差值的区间估计其中,为自由度,为两样本均数之差的标准误,当两总体方差相同时,

,其中,为两样本的合并方差。当两样本的样本含量均较大时,上述计算可信区间中的可用相应的代替,而且无论两总体的方差是否相同,均有例3评价复方缬沙坦胶囊与缬沙坦胶囊对照治疗轻中度高血压的有效性,将102名患者随机分为两组,其中试验组和对照组分别为54例和48例。经六周治疗后测量收缩压,试验组平均下降15.77mmHg,标准差为13.17mmHg;对照组平均下降9.53mmHg,标准差为13.55mmHg。试估计两组收缩压平均下降差值的95%可信区间。

由公式计算:下限:

上限:实例1.反映均数抽样误差大小的指标是标准误。均数标准误的估计值为。2.参数估计指由样本统计量估计总体参数,是统计推断的重要内容之一,常用的方法有点估计和区间估计。区间估计是指按预先给定的可信度,计算出一个区间,使它能够包含未知的总体参数。区间越窄说明估计的准确度越高。小结总体率的点估计与区间估计点击添加文本点击添加文本点击添加文本点击添加文本学习内容总体率的区间估计12总体率的点估计一、

总体率的点估计总体率的点估计是使用单一的数值直接作为总体参数的估计值,如用p估计相应的

。此法计算简便,但由于存在抽样误差,通过样本率不可能准确地估计出总体率的大小,也无法确知总体率的可靠程度。

π1.正态分布法

样本含量n足够大,np与n(1-p)均≥5时,利用二项分布可估计其总体率

可信区间,一般取

。二、总体率的区间估计总体均数区间估计区间估计是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体率。事先给定的概率

称为可信度或置信度,计算得到的区间称为置信区间或可信区间(confidenceinterval,CI)。

当较大,和均不太小,如和均大于5时,可利用样本率近似服从正态分布的原理来估计总体率的可信区间,计算公式为

例1

某区疾病预防控制中心2002年对该乡镇250名小学生进行贫血的检测,结果发现有86名贫血者,检出率为34.40%,求贫血检出率95%的可信区间。

2.查表法

当样本含量较小(如n≤50),np或n(1-p)<5时,样本率的分布呈二项分布,总体率的可信区间可据二项分布的理论求得。例2某医院用某药治疗脑动脉硬化症22例,其中显效者10例。问该药总显效率的95%可信区间为多少?本例n=22,X=10,查百分率的可信区间表,得此两数相交处的数值为24~68,即该药总显效率的95%可信区间为(24%,68%)。

例32003年4~6月某医院重症监护病房收治重症SARS患者38人,其中死亡14人,求SARS病死率的95%可信区间。

查百分率的可信区间表,95%的可信区间为22%~54%。1.反映率的抽样误差大小的指标是率的标准误。率的标准误样本估计值为。2.率的参数估计指由样本统计量估计总体参数,是统计推断的重要内容之一,常用的方法有点估计和区间估计。率的区间估计是指按预先给定的可信度,计算出一个区间,使它能够包含未知的总体率。区间越窄说明估计的准确度越高。小结两个样本率的比较适用条件为两样本的np和n(1-p)均大于5。计算公式为

两样本率比较的Z检验例1

某中药研究所试用某种草药预防流感,观察用药组和对照组(未用药组)的流感发病率,其结果见表1。问两组流感发病率有无差别?表1用药组和对照组流感发病率比较组别观察人数发病人数发病率(%)用药组1001414对照组1203025合计2204420计算结果本例n1=100,p1=14%,n2=120,p2=25%,pc=20%,1-pc=80%,代入公式

判断:Z

=2.031>Z0.05=1.96,故p

<0.05。在α=0.05水准上,拒绝H0,接受H1,差异有统计学意义。样本率与总体率的比较样本率与总体率比较的z检验z值的计算公式为:例1根

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论