医学统计学第3版-chap6-总体均数的估计_第1页
医学统计学第3版-chap6-总体均数的估计_第2页
医学统计学第3版-chap6-总体均数的估计_第3页
医学统计学第3版-chap6-总体均数的估计_第4页
医学统计学第3版-chap6-总体均数的估计_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

总体均数的估计,第六章,复习,抽样研究的目的:利用获得样本信息,推断总体特征,能否直接认为“使用圣地红景天8周的SHR大鼠尾动脉SBP上升值8.89mmHg”能否认为“SHR大鼠使用圣地红景天8周后,归因于圣地红景天的效应为8.89-23.83=14.94mmHg”,圣地红景天对SHR大鼠尾动脉SBP(mmHg)影响研究分析结果,注:*表示差值=第8周SBP8-基线SBP0,内容提要,从总体N(9.0,12.02)中进行随机抽样样本例数n分别为10、30、50、100每种样本含量下进行100次抽样计算样本均数和标准差S,数学模拟,从总体N(9.0,1.52)中抽出100个样本的均数、标准差,不同抽样例数100次抽样中样本均数和总体均数之间的关系,样本统计量和总体参数间的关系,样本统计量总是围绕着总体参数上下波动,不会离开总体参数太远样本统计量是个变量总体参数和样本统计量之间总是存在一定差异当样本量n时,样本统计量无限的逼近于总体参数,抽样误差(samplingerror),由于个体变异引起的,在抽样过程中发生的,总体参数与样本统计量之间的差异产生原因:个体变异产生条件:抽样研究表现形式:总体参数与样本统计量之间的差异度量指标:标准误,总体参数的估计,点估计:直接用样本统计量的值估计总体参数的值样本均数估计总体均数来自有代表性的样本样本量越大,估计的精度越高抽样误差客观存在总体参数和样本统计量之间总是存在一定差异,内容提要,样本均数直方图,100个样本均数(n=100)直方图,样本统计量的标准差(SE)刻画样本统计量的变异性说明样本统计量抽样误差大小的指标,该值越大说明抽样误差越大:样本均数的标准差:抽样研究中未知时的估计根据一次抽样获得的s估计:本例:,标准误(standarderror),样本均数的抽样分布,若XN(,2),为来自总体的随机样本的样本均数中心极限定理:即使总体不服从正态分布只要样本含量足够大,总体均数客观存在,样本均数的分布亦服从正态分布,样本均数的抽样分布,正态分布曲线,样本均数的抽样分布,已知,未知,X不服从正态分布,n足够大,中心极限定理,样本均数的抽样分布,样本均数的抽样分布经过转换已知未知未知,n足够大,t分布,为高斯特(WilliamSealyGosset)于1908年所推导,并以笔名Student发表,故又名学生氏t分布(Studentst-distribution)总体标准差未知,尤其当样本量较小时,说明样本均数与总体均数关系的概率分布形式,t分布曲线,t,f(t),=1,不同自由度下的t分布曲线,=5,=,t分布曲线的特征,钟形曲线以0为中心,左右对称,均匀下降单峰曲线以x轴为其渐近线与自由度有关的一簇曲线自由度越小,则t值越分散,曲线越低平自由度逐渐增大时,t分布曲线逐渐逼近标准正态分布曲线当=时,t分布即为标准正态分布,t分布曲线的特征,t分布曲线为的概率密度曲线相应区间的曲线下面积为该区间t值的发生概率曲线下总面积仍为1或100%,t,t分布曲线,t界值,|t|界值表(P316),P(|t|t#),P(tt#),t界值,t0.05/2,11=2.201,t0.025,11=2.201,双侧:P(t-t/2,)+P(tt/2,)=,单侧:P(t-t/2,)=/2或P(tt/2,)=/2,中间:P(-t/2,tt/2,)=1-,内容提要,总体均数的估计,总体均数估计的两种方法点估计:直接用样本统计量估计总体参数区间估计:由于抽样误差的客观存在,因而按一定的概率1-,在一定分布基础上,利用样本信息估计总体参数所在的区间,并使得该区间包含总体均数的概率为1-该区间称为可信区间或置信区间(confidenceinterval)1-称为置信水平或置信度(confidencelevel)常取95%或99%,即=0.05或0.01,样本均数的抽样分布,样本均数的抽样分布经过转换已知未知未知,n足够大,未知,未知,但n足够大,已知,1-可信区间的计算,1-可信区间的计算公式,引例,根据样本信息,推断使用圣地红景天8周的SHR大鼠尾动脉SBP上升值的总体均数:点估计值为8.89mmHg95%可信区间为(1.29mmHg,16.49mmHg),圣地红景天对SHR大鼠尾动脉SBP(mmHg)影响研究分析结果,注:*表示差值=第8周SBP8-基线SBP0,利用样本信息,估计总体均数差值1-2点估计:SHR大鼠使用圣地红景天8周后,归因于圣地红景天的效应为8.89-23.83=14.94mmHg区间估计,两总体均数差值的估计,圣地红景天对SHR大鼠尾动脉SBP(mmHg)影响研究分析结果,注:*表示差值=第8周SBP8-基线SBP0,均数差的抽样分布,利用样本信息,估计总体均数差值1-2点估计:SHR大鼠使用圣地红景天8周后,归因于圣地红景天的效应为8.89-23.83=-14.94mmHg区间估计:95%可信区间-25.11mmHg,-4.78mmHg,两总体均数差值的估计,圣地红景天对SHR大鼠尾动脉SBP(mmHg)影响研究分析结果,注:*表示差值=第8周SBP8-基线SBP0,可信区间的两个要素,可信区间的两个要素,准确度:可信区间包含总体均数的可能性大小反映在置信度1-的大小上从准确度的角度看,愈接近1愈好如可信度99%比95%好精密度反映在可信区间的长度上长度愈小愈好,可信区间的两个要素,在抽样误差确定的情况下,二者是相互矛盾的若提高准确度,即提高可信度,可信区间势必增大,精密度下降若提高精密度,可信区间势必减小,即可信度下降,准确度下降一般情况下,同时兼顾准确度与精密度,常用95%可信区间,总结,样本统计量与总体参数的差异抽样研究中难以避免的误差可用标准误度量其大小,说明样本均数与总体均数间关系的概率分布形式,未知时,说明样本均数与总体均数关系的概率分布形式,课后习题,抽样研究的目的:利用获得样本信息,推断总体特征为了解大学生早餐前血糖水平,共对100名大学生进行了调查能否认为=6.0mmol/L,并说明理由,如不能,如何估计,=6.0mmol/Ls=1.5mmol/L,=6.0mmol/L,补充阅读:t分布,设变量X、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论