医学统计学:第四章 可信区间_第1页
医学统计学:第四章 可信区间_第2页
医学统计学:第四章 可信区间_第3页
医学统计学:第四章 可信区间_第4页
医学统计学:第四章 可信区间_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章可信区间

ConfidenceInterval主要内容统计推断的思路统计推断参数的估计可信区间构建方法均数之差的可信区间正确应用Graph1ResearchProcessFlowchart.1)统计推断的思路populationhomogeneity,variationparameterunknownsamplerepresentation,samplingerrorrandomsampling

statisticsknownstatisticalinferencerisk1)统计推断的思路StatisticalAnalysisDescriptiveStatisticsInferentialStatisticsParameterEstimationHypothesisTesting1)统计推断的思路DescriptiveStatisticsInferentialStatistics(A)ParameterEstimation(B)HypothesisTestingWhereistheμ?μ1=μ2SamplingGeneralizing?2)统计推断(statisticalinference)总体参数的估计(parameterestimation)假设检验(hypothesistest)主要内容统计推断的思路统计推断参数的估计可信区间构建方法均数之差的可信区间正确应用总体样本随机抽样参数估计总体参数未知样本统计量已知3)参数估计3)参数的估计点估计(pointestimation)区间估计(intervalestimation)按一定的概率或可信度(1-

)用一个区间估计总体参数所在范围。这个范围称作可信度为1-

的可信区间(confidenceinterval,CI),又称置信区间。【例】随机抽取12名口腔癌患者,检测其发锌含量,得

=253.05

g/g=27.18

g/g

估计发锌含量总体均数95%的可信区间。3)参数的估计t

值的分布理论基础:t值的抽样分布-2.201

0

2.201v=110.0250.0251-

区间估计:可信区间(confidenceinterval):结论估计该地口腔癌患者发锌含量总体均数的95%可信区间为:193.23~321.87(

g/g)。主要内容统计推断的思路统计推断参数的估计可信区间构建方法均数之差的可信区间正确应用-t

,v

0t

,v

/2

/21-

图5100(1-

)100%可信区间构建方法4)均数的(1-

)100%可信区间构建方法4)均数的(1-)100%可信区间构建方法均数的(1-

)100%的可信区间:可信限(confidencelimit):样本含量较大时,u值的分布:0-u

u

/2

/21-

样本含量较大时,均数(1-

)100%的可信区间:此时,均数的(1-)100%的可信区间:主要内容统计推断的思路统计推断参数的估计可信区间构建方法均数之差的可信区间正确应用5)均数之差的(1-

)100%可信区间例

转铁蛋白含量正常人:n1=12,病人:n2=15,问题:两组平均相差多少?问题:

正常组病人组

2=?均数:235.21ug/dl标准差:14.39ug/dl

1=?均数:271.89ug/dl标准差:10.28ug/dl

1-

2

=?与均数之差有关的抽样分布

“均数之差”与“均数之差的标准误”之比,服从自由度

=n1+n2-2的t分布。样本含量较大时,服从标准正态分布。合并方差与均数之差的标准误合并方差(方差的加权平均)均数之差的标准误根据可得

1-

2的可信区间:5)均数之差的(1-

)100%可信区间计算:则合并方差为:自由度为

=n1+n2-2=12+15-2=25、

=0.05的t界值为:t0.05,25=2.060

,则两组均数之差的95%可信区间为:(271.89-235.21)±2.060×4.95=26.48~46.88结论病毒性肝炎患者的血清转铁蛋白含量较正常人平均低36.68(

g/dl),其95%可信区间为26.48~46.88(

g/dl)。

5)均数之差的(1-

)100%可信区间可信区间均数率事件数方差主要内容统计推断的思路统计推断参数的估计可信区间构建方法均数之差的可信区间正确应用6)可信区间的两个要素可信度(1-

),可靠性一般取90%,95%。可人为控制。精确性是指区间的大小(或长短)兼顾可靠性、精确性影响可信区间大小的因素可信度可信度越大,区间越宽个体变异变异越大,区间越宽样本含量样本含量越大,区间越窄7)正确理解可信区间:可信度为95%的CI的涵义:每100个样本,按同样方法计算95%的CI,平均有95%的CI包含了总体参数。95%,指的是方法本身!而不是某个区间!在可信区间被估计之前,概率是存在的;在可信区间被估计之后,就没有概率了。从N(0,1)中随机抽取100个n=10的样本所估计的100个95%可信区间

-2-1012

按这种方法构建的可信区间,理论上平均每100次,有95次可以估计到总体参数。置信区间演示

为了对置信区间概念有更好的理解,并对样本容量、置信水平对置信区间的影响建立直观印象,请看演示:下列说法正确吗?算得某95%的可信区间,则:总体参数有95%的可能落在该区间。有95%的总体参数在该区间内。该区间包含95%的总体参数。该区间有95%的可能包含总体参数。该区间包含总体参数,可信度为95%。

例如,临床上观察120例使用某生物制剂的患者,其皮疹发生率2/120=1.67%,则该生物制剂的皮疹发生率的95%可信上限为:即该生物制剂的皮疹发生率最大为5.2%。8)单侧可信区间9)注意区别:标准差

标准误个体变异

抽样误差参考值范围

可信区间变量分布

抽样分布10)可信区间与容许区间的区别

可信区间用于估计总体参数,总体参数只有一个;容许区间用于估计变量值的分布范围,变量值可能很多甚至无限,95%容许区

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论