医学统计学 参数估计基础_第1页
医学统计学 参数估计基础_第2页
医学统计学 参数估计基础_第3页
医学统计学 参数估计基础_第4页
医学统计学 参数估计基础_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章参数估计基础

第五章

由抽样造成的样本均数与总体均数及样本均数之间的差别称为均数的抽样误差。第一节均数的抽样误差与标准误一、均数的抽样误差抽样误差:

抽样研究中,样本统计量与总体参数间的差别及统计量与统计量间的差别称为抽样误差。均数的抽样误差:

二、标准误的计算【例5-1】假设已知100名(总体)正常成年男性红细胞数的均值为5.00

1012/L,标准差为0.431012/L,现从该总体中进行随机抽样,每次抽取10名正常成年男子,并测得他们的红细胞数,最终共抽取100份样本,并计算出每份样本的均数。将一百个样本均数看成一批资料或为一个新样本,我们可以计算其均数与标准差,均数值为4.9097,标准差为0.1350。将样本均数的“标准差”定名为均数的标准误,简称标准误,以区别于通常所说的标准差。标准差表示个体值的变异程度,而标准误则说明样本均数的变异程度,两者不能混淆。将第1号样本的标准差及例数代入式(5-2),得

(5-2)

(5-1)

100个样本均数的频数分布图标准误统计量的标准差称为标准误(如均数标准误、率的标准误);均数的标准误是描述均数抽样误差大小的统计指标。标准误的用途:1.衡量样本均数的可靠性。2.结合样本均数和正态分布曲线下的面积分布规律,估计总体均数的置信区间。3.用于均数的假设检验。思考题:标准误和标准差的区别?则z~N(0,1)第二节t分布

则z~N(0,1);~(μ,),作z转换x~N(μ,σ),作转换,

一、t分布的概念t变量为用以推断总体均数的样本检验统计量。t

分布只有1个参数自由度ν=n-1。1.当σ已知时,可作z转换,推断总体均数的样本检验统计量为z。2.当σ未知时,可作正态变量的t转换,二、t分布的特征与t界值表

图5-1不同自由度t分布的概率密度曲线3.当

→∞时,t分布逼近z分布;特征:1.单峰分布,以0为中心,左右对称;2.

越小,t值越分散,t分布的峰部越矮而尾部翘得越高;4.t分布曲线下的面积有一定规律。双侧:单侧:图5-2ν=9时单侧(a)与双侧(b)分布曲线下尾部面积第三节总体均数的估计【例5-2】

随机抽取某地100名16岁男孩,测得其体重均数为48.65kg,标准差为15.23kg,试估计该地16岁男孩体重的总体均数。

一、点估计(pointestimation)

用样本统计量作为总体参数的点值估计二、区间估计(intervalestimation)

结合样本统计量和抽样误差在一定的可信度100(1-

)%下估计总体参数所在的范围,称为总体参数的置信区间(confidenceinterval,CI)。

置信区间的概念1.Z分布法正态分布原理计算总体均数的1-

可信区间为:

/2

/21-

-z/2z/2(1)σ已知(小样本要求资料服从正态)均数置信区间的计算(2)σ未知,但样本例数n足够大时(n>50)

注意:若总体不服从正态分布时,一般是很难确定其总体中的未知参数,但当样本量n很大时,我们可利用中心极限定理按上式对其总计均数作出近似的区间估计。2.t分布法(σ未知)根据t分布原理,P(-t

/2,

<t<t

/2,

)=1-

0

/2

/21-

-t/2t/2总体均数(1-

)可信区间计算公式如下:

对于例5-2,因为总体标准差未知,所以采用公式(5-6)计算总体均数的95%置信区间为:

48.65±1.984×1.523=48.65±3.02=(45.63,51.67)kg95%可信区间~

可以认为是每抽100个由样本含量相等的样本算得的置信区间,平均有95个置信区间会包括总体均数,只有5个置信区间不会包括总体均数。置信区间的涵义(1)置信区间~包括总体均数的可能性为95%;

(2)总体均数落在置信区间~范围内的可能性为95%;

(3)通过样本资料计算出的95%置信区间19.6~23.2kg包括总体均数的可能性为95%。判断:置信区间的两个要素:1.准确度2.精密度反映在可信度1-

的大小上,从准确度的角度,愈接近1越好,如99%可信区间比95%的好;它反映在区间的宽度上,即区间越窄越好均数可信区间与参考值范围的区别1.含义:均数可信区间用于估计总体参数,而参考值范围用于估计变量值的分布范围。2.计算公式:均数可信区间的计算公式是基于统计量的抽样分布,而参考值范围的计算基于变量值的分布。Bernoulli试验以A表示所感兴趣的事件,A事件发生称为“成功”,不发生称为“失败”。相应的这类试验称作为“成——败型”试验或Bernoulli试验。一、二项分布第四节

二项分布和Poisson分布

必须满足下列三条件:(1)每次试验结果只能是两个互斥结果之一(A或非A)。(2)每次试验的条件不变,每次试验结果

A事件发生的概率为常数

。(3)各次试验独立,即每次试验出现事件

A的概率与前面各次试验出现的结果无关。概率的运算法则乘法法则:几个相互独立事件的乘积(同时发生)的概率等于各独立事件概率之积:

P(A1A2···An)=P(A1)P(A2)···P(An

)可加性:互不相容事件A1、A2、

、An(任一次试验至多一个出现)的和(至少一个发生)的概率等于各事件发生的概率之和:

P(A1+A2+···An)=P(A1)+P(A2)++P(An)二项分布—成功次数的概率分布

某实验中小白鼠染毒后死亡概率:

为0.7,则生存概率为:1-

=0.3,故对一只小白鼠进行实验的结果为:死(概率为

)或生(概率为1-

);对二只小白鼠(甲乙)进行实验的结果为:甲乙均死 [概率为

2]甲死乙生 [概率为

(1-

)]乙死甲生 [概率为(1-

)

]甲乙均生 [概率为(1-

)2]概率相加得:

2+

(1-

)+(1-

)

+(1-

)2

=[

+(1-

)]2

对三只小白鼠(甲乙丙)进行实验的结果为:表3只白鼠各种实验结果及其发生概率概率相加得:[

+(1-

)]3

对n只小白鼠进行实验,所有可能结果的概率相加得:

n+Cn1

(1-

)n-1+…+Cnx

x(1-

)n-x+…+(1-

)n=[

+(1-

)]nn次试验中事件A出现的次数为x的概率是:

,k=0,1,2,…n

记为xB(n,)表5-3接种3人可能出现不适反

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论