卫生统计学-潘海燕 卫统6 总体均数和总体率的估计.ppt_第1页
卫生统计学-潘海燕 卫统6 总体均数和总体率的估计.ppt_第2页
卫生统计学-潘海燕 卫统6 总体均数和总体率的估计.ppt_第3页
卫生统计学-潘海燕 卫统6 总体均数和总体率的估计.ppt_第4页
卫生统计学-潘海燕 卫统6 总体均数和总体率的估计.ppt_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章,总体均数和总体率的估计,【例6-1】欲了解某地正常成年男性血清胆固醇的平均水平,某研究者在该地随机抽取正常成年男性120名,得其血清胆固醇的均数为3.86mmol/L,标准差为1.73 mmol/L,据此认为该地正常成年男性血清胆固醇的平均水平为3.86 mmol/L。,以样本均数3.86mmol/L来代表该地区正常成年男性血清胆固醇的平均水平是否合适?,以上问题为统计推断内容 假设检验:方差分析、秩和检验等 参数估计: 总体均数估计、总体率估计,本章主要内容,抽样误差与标准误 t 分布 总体均数的估计 二项分布和Poisson分布 总体率的估计,第一节 抽样误差与标准误,【例6-2】假设已知某地正常成年男性红细胞数的均值为5.001012/L,标准差为0.431012/L。现从该总体中进行随机抽样,每次抽取10名正常成年男子,并测得他们的红细胞数,抽取100份样本,计算出每份样本的均数。,抽样误差与标准误,表6-1 随机抽取的100份样本红细胞数的计算结果 (n=10),表6-1 随机抽取的100份样本红细胞数的计算结果 (n=10),引起这种现象的原因?,抽样误差与标准误,1.1抽样误差:由抽样引起的样本统计量与总体参数间的差异称抽样误差。不可避免、可以控制。 表现:样本统计量与总体参数之间的差异 样本统计量之间的差异 产生原因:个体变异抽样,1.均数的抽样误差(sampling error),抽样误差与标准误,2.1均数的分布:,2.均数的分布和标准误,抽样误差与标准误,先看一个抽样研究例子,从N(4.6602,0.57462)总体中进行抽样,样本例数n分别为5,10,20,50,每一样本例数抽样100次,观察样本均数的频数分布,会得到什么结论?,抽样误差与标准误,从N( 4.6602,0.57462)抽样的样本均数分布图,图6-1 表6-1资料 100个样本均数的频数分布图,抽样误差与标准误,中心极限定理,从正态分布总体 中固定样本含量n反复多次抽样,所得的 各不相同,但它们以为中心呈正态分布。,即使从偏态分布总体抽样,只要n足够大(n50), 也近似正态分布。,抽样误差与标准误,2.均数的分布和标准误,抽样误差与标准误,2.2 标准误(standard error),2.2.1样本统计量的标准差称为标准误。 2.2.2样本均数的标准差称为均数的标准误,2.均数的分布和标准误,抽样误差与标准误,均数的标准误表示样本均数的变异度 总体标准差未知时,用样本标准差代替,4.标准误的计算,例 随机抽取某市200名7岁男童的身高均数为124.0cm,标准差为4.6cm,估计抽样误差的大小。,抽样误差与标准误,2.2.3标准误的用途,衡量样本均数的可靠性; 估计总体均数的可信区间; 用于均数的假设检验。,抽样误差与标准误,第二节 t 分布,样本均数 ,根据标准化变换, 则,实际工作中,总体方差未知。所以,用样本方差代替总体方差, 此时 =t,t值的分布如何?,t 分布,从N(0,1)中1000次抽样的 t 值的分布(n=4),Fraction,t,-8,-6,-4,-2,0,2,4,6,8,0,.05,.1,.15,.2,.25,.3,.35,均数为 0.05696 标准差为 1.55827,t 分布,2.1概念:从正态总体N(,2)中进行无数次 样本含量为n的随机抽样,每次均可得到一个 和一个s,通过公式: 转换,可得无数个t值,t值的分布即为t分布,t 分布,自由度为1、5、的t分布,近似标准正态分布,t 分布,2.2特征 以0为中心,左右对称 t分布是一簇曲线形状与自由度有关 当 趋于 时, t分布逼近标准正态分布 t分布曲线下面积为1 t分布曲线下面积分布可由t值表中查出: 双侧P( t -t /2) +P( t t/2) = 单侧P( t -t ) = 或 P( t t) = ,t 分布,图6-3 时单双侧界值的概率示意图,t 分布,从界值表可看出,(1)自由度相同时,界值越大其对应的值越小 (2)概率 相等时, 越大, 界值越小 (3) 值相等时,双侧概率为单侧概率的两倍 (4) 时, 界值即为 界值,t 分布,第三节 总体均数的估计,点估计(point estimation): 用样本均数估计总体均数。 区间估计(interval estimation): 按一定的概率(可信度,1 -)估计总 体均数所在范围亦称总体均数的可信区间。,参数估计:点估计、区间估计,总体均数的估计,可信区间通常由两个数值即两个可信限 (confidence limit,CL)表示: 较小者称为下限(lower limit,L) 较大者称为上限(upper limit,U),总体均数的估计,总体均数可信区间的计算,.当已知,服从标准正态分布,总体均数的估计,.当已知,总体均数的估计,图6-4 总体均数的双侧 可信区间,总体均数的估计,总体均数可信区间的计算,.未知但n足够大(n50),总体均数的估计,例6-3中,因n=120, , ,试求该地正常成年男性 血清胆固醇平均水平的95可信区间。,即(3.55,4.17)mmol/L,总体均数的估计,常用单双侧u值 单侧 双侧 0.10 1.282 1.645 0.05 1.645 1.960 0.02 2.054 2.326 0.01 2.326 2.578,同理,可推导出相对应的单侧可信区间,总体均数的估计,总体均数可信区间的计算,.当未知n 较小,总体均数的估计,同理,可推导出相对应的单侧可信区间,总体均数的估计,从总体中作随机抽样,每个样本可以算得一个可信区间。如95%可信区间意味着做100次抽样,算得100个可信区间,平均有95个估计正确。 可信区间的两个要素 一是准确度: 反映在可信度的大小 二是精密度: 反映在区间的长度,可信区间的涵义,总体均数的估计,图6-5 从N(0, 1)中随机抽样算得的100个95可信区间(n=10),总体均数的估计,1.标准差与标准误有什么区别与联系?,思考题,2.可信区间与参考值范围有什么不同?,第四节 二项分布与Poisson分布,在医学领域中,有一些随机事件是只具有两种互斥结果的离散型随机事件,如某种化验结果的阳性与阴性,接触某传染源的感染与未感染等。统计学上将这类只具有两种互斥结果的随机试验称为贝努利试验(Bernoulli trial)。,二项分布,【问题6-4】假设服用某药物后有10%的人出现过敏反应。若3人服药后,出现0、1、2或3个人过敏的概率分别是多少?,贝努利试验序列特点:,每次试验的结果只能是两种互斥结果中的一种; 各次试验的结果互不影响; 在相同试验条件下,各次试验中出现某一结果A 具有相同的概率。,一般地,在一个n重贝努利试验中,令X表示事件A发生的次数,则随机变量X所有可能的取值为0, 1, 2, , n,且其概率函数为:,贝努利试验序列中某一结果A出现次数的概率 分布称二项分布(binomial distribution), 记为:,n为独立的贝努利试验次数; 为阳性的概率; (1-)为阴性的概率; X为在n次贝努利试验中出现阳性的次数; 表示在n次试验中出现X的各种组合情况称二项系数 。,连续型分布:z分布、t分布和F分布等,离散型分布:二项分布和Poisson分布等,在二项分布中,参数 称为离散参数, 只能取正整数;参数 是事件A发生的 概率。,(1)二项分布的概率之和等于1,(2)单侧累积概率,至多有 例阳性的概率(下侧累积概率),(2)单侧累积概率,至少有 例阳性的概率(下侧累积概率),阳性结果发生数X的总体均数,总体方差,总体标准差,=0.3时, 不同n值对应的二项分布,【例6-5】已知某地新生儿先天性心脏病的发病率为9,试计算该地100名新生儿中有3人患先天性心脏病概率。 能否用前述二项分布进行计算? 是否有更为简便的计算方法?,【例6-5】若用二项分布:,Poisson分布,Poisson分布是一种重要的离散型概率分布,用于研究单位时间、单位人群、单位空间内,某罕见事件发生次数的分布。具有n很大而事件发生率很小的特点。,若随机变量X的可能取值为0,1,2, 且其概率分布为,则称X服从参数为的Poisson分布(Poissons distribution),记为,【例6-5】中:,是Poisson分布所依赖的唯一参数,值愈小分布愈不对称; 增大,Poisson分布趋于对称; ,Poisson分布接近于正态分布.,Poisson分布具有以下特征:,与 相等 具有可加性,第五节 总体率的估计,【例6-6】某市疾控中心对该市郊区200名小学生进行贫血的检测,结果发现有80名小学生贫血,则认为该市郊区小学生贫血率为40.0%。 【问题6-6】 这是什么资料? 该研究属于何种设计方案? 40.0%来代表该市郊区小学生贫血率是否合适? 怎样估计该市郊区小学生贫血率?,率的抽样误差与标准误,由于抽样而引起的样本率与总体率的差异称为率的抽样误差, 用率的标准误度量。,实际工作中,常用样本p作为的估计值,例6-6中:,总体率的估计,查表法: 正态分布法:,【例6-7】某医院应用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论