卫生统计ppt课件 第五章参数估计基础_第1页
卫生统计ppt课件 第五章参数估计基础_第2页
卫生统计ppt课件 第五章参数估计基础_第3页
卫生统计ppt课件 第五章参数估计基础_第4页
卫生统计ppt课件 第五章参数估计基础_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章参数估计基础参数估计基础抽样误差t分布可信区间第一节抽样分布与抽样误差在医学科学和卫生学研究中有很多现象需采用抽样研究方法,抽样研究的目的就是用样本信息推论总体特征,这叫统计推断。一、样本均数的抽样分布与抽样误差1、抽样分布以一个抽样模拟实验,看样本均数的抽样分布的特点:P84-85表5-11)各样本均数未必等于总体均数;2)样本均数间存在差异;3)样本均数围绕均数(155.4cm)也呈正态分布;4)样本均数变异较原变量的变异大大减小。2、抽样误差的概念

由抽样引起的样本统计量与总体参数间的差异

两种表现形式

1)样本统计量与总体参数间的差异2)样本统计量间的差异

抽样误差产生的条件:抽样研究

个体变异3、均数的标准误

中心极限定理(centrallimittheorem)从均数为、标准差为的总体中独立随机抽样,当样本含量n增加时,样本均数的分布将趋于正态分布,此分布的均数为,标准差为如图5-1P88标准误(standarderror,SE),样本统计量的标准差称为标准误,用来衡量抽样误差的大小。标准误与个体变异成正比,与样本含量n的平方根成反比。实际工作中,往往是未知的,一般可用样本标准差s代替:因为标准差s随样本含量的增加而趋于稳定,故增加样本含量可以降低抽样误差。

事实上,任何一个样本统计量均有其分布。统计量的抽样分布规律是进行统计推断的理论基础。

标准差与标准误的联系和区别

联系1、都是变异指标。S反映个体观察值的变异;反映统计量的变异。2、当n不变时,标准差↑,标准误↑

二、样本频率的抽样分布与抽样误差以电脑实验为例P89,将其频数列表5-3。从表中可见,黑球的比例是围绕着20%(总体率)分布的,在此组段内的频数最多,但不等于总体率,样本频率间也有差异。表示频率的抽样误差的指标叫率的标准误。例5-1某研究组随机调查了某市50岁以上中老年妇女776人,其中患有骨质疏松症者322人,患病率为41.5%,试估计该样本频率的抽样误差。本例标准误较小,说明用样本患病率41.5%来估计总体患病率的可靠性较好。第二节t分布

f(t)

=∞(标准正态曲线)

=5

=10.10.2-4-3-2-1012340.3图3.2自由度分别为1、5、∞时的t分布

t分布的特征

t分布为一簇单峰分布曲线t分布以0为中心,左右对称t分布与自由度有关,自由度越小,t分布的峰越低,而两侧尾部翘得越高;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。

第三节总体均数及总体率的估计一、参数估计的概念参数估计:用样本统计量推断总体参数的数值。有点估计(pointestimation)和区间估计(intervalestimation)。2.区间估计(intervalestimation):

按预先给定的概率(1)所确定的包含未知总体参数的一个范围。

如给定=0.05,该范围称为参数的95%可信区间或置信区间;如给定=0.01,该范围称为参数的99%可信区间或置信区间抽样研究:从总体到样本实际工作:由样本推断总体统计推断(statisticalinference)就是根据样本所提供的信息,以一定的概率推断总体的性质。置信区间的确切涵义

置信度为95%

的置信区间的确切涵义是:每100个样本所算得的100个置信区间,平均有95个包含了总体参数,有5%没有包含了总体参数。置信区间的两个要素

可靠性

反映为置信度1-

的大小

,1-

越大可靠性越高,如99%的置信度就比95%的置信度可靠。精确性

用区间长度CU-CL衡量,区间越窄精确性越好,

95%的置信区间就比99%置信的精确性好。

在置信度1-

确定后,要想同时作到既可靠又精确只有增大样本含量。置信区间的计算

(一)总体均数的置信区间

均数的置信区间

1、t分布法σ未知且n较小(n≤50)时总体均数的(1-)双侧置信区间定义为:

例5-2已知某地27名健康成年男子的血红蛋白量均数为125g/L,标准差为15g/L。问该地健康成年男子的血红蛋白平均含量的95%置信区间和99%置信区间各是多少?2、正态分布近似法(1)当σ未知时,当样本含量较大时,例如n>50,t分布近似标准正态分布,此时可用标准正态分布代替t分布,作为置信区间的近似计算。相应的(1-)双侧置信区间为:单侧置信区间为:(2)当σ已知时相应的(1-)双侧置信区间为:单侧置信区间为:例5-3某市2000年随机测量了90名19岁健康男大学生的身高,均数为172.2cm,标准差为4.5cm,估计该市2000年19岁健康男大学生平均身高的95%置信区间。(二)总体概率的置信区间根据样本含量n和样本频率p的大小,可采用查表法和正态近似法。1、查表法对于n≤50的小样本资料,尤其是p很接近0或100%时,直接查附表6百分率的置信区间表,ρ478,即可得到其总体率的置信区间。例5-4某医院对39名前列腺癌患者实施开放手术治疗,术后有合并症者2名,估计该手术合并症发生概率的95%置信区间。例5-5某医生用某药治疗31例脑血管梗塞患者,其中25例患者治疗有效,求该药治疗脑血管梗塞患有效概率的95%置信区间。本例n=31,X=25>n/2,所以用n-X=6查表,得8—38,再用100减去所查的值,得该药治疗脑血管梗塞患有效概率的95%置信区间为:62%—92%。2、正态近似法当n足够大,且样本频率p和(1-p)均不太小时。如np与n(1-p)均大于5时,p的抽样分布近似正态分布。此时可按下式求总体概率的置信区间。例5-6

用某种仪器检查已确诊的乳腺癌患者120名,检出乳腺癌患者94例,检出率为78.3%。估计该仪器乳腺癌总体检出率的95%置信区间。正确理解置信区间的涵义

置信区间一旦形成,它要么包含总体参数,要么不包含总体参数,二者必居其一,无概率可言。所谓95%的置信度是针对置信区间的构建方法而言的。

以均数的置信区间为例,其涵

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论