总体均数的估计.ppt_第1页
总体均数的估计.ppt_第2页
总体均数的估计.ppt_第3页
总体均数的估计.ppt_第4页
总体均数的估计.ppt_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,教学要求,1.抽样误差的概念,标准误的意义和计算2.总体均数95%置信区间的意义,估计方法及适用条件,1.标准误和标准差的区别,参数估计的概念,1.置信区间与医学参考值范围的区别2.样本均数的抽样分布规律3.t分布的概念,t分布图形与曲线下面积的分布规律,t界值表的使用4.区间估计的准确度和精确度,从总体N(6.0,1.52)中进行随机抽样样本例数n分别为10、30、50、100每种样本含量下进行100次抽样计算样本均数和标准差S,样本统计量的分布规律,均数的抽样误差,1.抽样误差的概念:由个体变异产生的,随机抽样引起的样本指标与总体指标之间,样本指标与样本指标之间的差异。2.抽样误差产生的原因:个体变异3.抽样误差的特点:随机,不可避免,有规律可循。4.在大量重复抽样的情况下,可以展示其规律性5.度量指标:标准误(standarderror,SE),均数的标准误,1.概念:将样本均数的标准差称为均数的标准误,它是描述均数抽样误差大小的指标2.计算:,3.统计学意义:均数的标准误越大,样本均数的分布越分散,样本均数离总体均数就越远,样本均数与总体均数的差别越大,抽样误差越大;抽样误差越大,由样本均数估计总体均数的可靠性越差。反之亦然。4.影响抽样误差大小的因素:标准差(同质性)、样本含量n5.实际工作中,可通过适当增加样本含量来减少均数的标准误,从而降低抽样误差。,标准差与标准误的区别,t分布曲线,不同自由度下的t分布曲线t分布为一簇单峰分布曲线,不同,曲线形状不同t分布以0为中心,左右对称t分布与有关,越小,t值越分散,t分布的峰部越低,而两侧尾部翘得越高当逼近,t分布逼近标准正态分布,t,f(t),=1,=5,=,t界值表,t0.05/2,10=2.228,t0.025,10=2.228,总体参数的估计,两种方法:点估计(pointestimation)和区间估计(intervalestimation),点估计:用样本统计量直接估计其总体参数值。方法虽简单,但未考虑抽样误差的大小。,区间估计是按预先给定的概率(1),确定一个包含总体参数的范围。该范围称为参数的可信区间(confidenceinterval,CI),参数估计(parameterestimation)的概念:用样本统计量估计总体参数,总体参数的估计,两种方法:点估计(pointestimation)和区间估计(intervalestimation),点估计:用样本统计量直接估计其总体参数值。方法虽简单,但未考虑抽样误差的大小。,区间估计是按预先给定的概率(1),确定一个包含总体参数的范围。该范围称为参数的可信区间(confidenceinterval,CI),参数估计(parameterestimation)的概念:用样本统计量估计总体参数,可信区间的确切含义,如果能够进行重复抽样试验,平均有(1)的可信区间包含了总体参数,而不是总体参数落在该范围的可能性为(1)。,可信区间一旦形成,它要么包含总体参数,要么不包含总体参数,二者必居其一,无概率可言。可信度是事前概率。,可信区间的两个要素,准确度:可信区间包含总体均数的可能性大小,反映在置信度1-的大小上,从准确度的角度看,愈接近1愈好,如可信度99%比95%好。精密度:反映在可信区间的长度上,长度愈小愈好,在抽样误差确定的情况下,二者是相互矛盾的。若提高准确度,即提高可信度,可信区间势必增大,精密度下降。若提高精密度,可信区间势必减小,即可信度下降,准确度下降一般情况下,同时兼顾准确度与精密度,常用95%可信区间。,可信区间与医学参考值范围的区别,在正态假定下,可信区间用标准误,而参考值范围用标准差。,95%可信区间中的95%是可信度,即所求可信区间包含总体参数的可信程度为95%;95%参考值范围中的95%是一个比例,即所求参考值范围包含了95%的“正常人”。,可信区间用于估计总体参数,总体参数只有一个;参考值范围用于估计个体值的分布范围,个体值有很多。,相关人物介绍,威廉戈塞特(WilliamSealyGosset,1876年6月13日-1937年10月16日),全名威廉希利戈塞,英国化学家、数学家与统计学家,以笔名Student著名。英国现代统计方法发展的先驱,小样本理论研究的先驱,为研究样本分布理论奠定了重要基础,被统计学家誉为统计推断理论发展史上的里程碑。,罗纳德艾尔默费希尔(RonaldAylmerFisher,R.A.Fisher,1890年2月17日-1962年7月29日),英国统计学家、生物进化学家、数学家、遗传学家和优生学家。是现代统计科学的奠基人之一。,卡尔皮尔逊(KarlPearson,1857年3月27日1936年4月27日)是英国数学家,生物统计学家,数理统计学的创立者,自由思想者,对生物统计学、气象学、社会达尔文主义理论和优生学做出了重大贡献。他被公认是旧派理学派和描述统计学派的代表人物,并被誉为现代统计科学的创立者。,1.利用抽样研究制定男性血红蛋白95%医学参考值范围,下列说法错误的是:A该范围为95%的“正常”男性血红蛋白测量值的波动范围B理论上有95%的“正常”男性血红蛋白测量值在该范围内C应同时制定该区间的上限和下限D若男性HB服从正态分布,可用计算E男性血红蛋白总体均数有95%可能性在该范围内,2.总体均数的区间估计中,值越大,则:A抽样误差越大B置信度越低C估计的准确度越大D抽样误差越小,3.关于置信区间,下列说法错误的是:A99%的置信区间优于95%的置信区间B置信区间的精确度反映在区间的长度C当样本含量确定时,准确度与精确度是相矛盾的D置信区间的准确度反映在置信度(1-)的大小上E当置信度(1-)确定时,增加样本含量可提高精确度,4.为了解某市女婴出生体重的情况,随机得到该市区120名新生女婴的平均出生体重为3.10kg,标准差为0.50kg。用算式3.101.96X0.50/计算得到的区间,可以解释为A此范围包含该市女婴平均出生体重,但可信的程度为95%B95%的可能性认为此范围包含了该市女婴的出生体重C该市95%的女婴出生体重在此范围内D该市女婴出生体重在此范围内的可能性为95%,例1:某地随机抽取了

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论