预防医学:第3节 均数的抽样误差和总体均数估计_第1页
预防医学:第3节 均数的抽样误差和总体均数估计_第2页
预防医学:第3节 均数的抽样误差和总体均数估计_第3页
预防医学:第3节 均数的抽样误差和总体均数估计_第4页
预防医学:第3节 均数的抽样误差和总体均数估计_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三节 均数的抽样误差和总体均数估计,参数估计 包括:点估计与区间估计 2. 假设检验,统计推断的两部分内容,统计推断:用样本信息推论总体的特征,推断inference,参数估计,一、均数的抽样误差与标准误,2009年某市18岁男生身高N(167.7, 5.32)的抽样示意图,将此100个样本均数看成新变量值,则这100个样本均数构成一新分布,绘制频数图,从正态分布总体N(167.7, 5.32)随机抽样所得样本均数分布,,各样本均数 未必等于总体均数; 各样本均数间存在差异; 样本均数的分布为中间多,两边少,左右基本对称。 样本均数的变异范围较之原变量的变异范围大大缩小。 可算得这100个样

2、本均数的均数为167.69cm、标准差为1.69cm,样本均数分布具有如下特点,从正态分布总体 中以固定 n 抽样时,样本均数 的分布仍服从正态分布 。 当样本含量 n 足够大时,即使从偏态分布总体中以固定 n 抽样,其样本均数的分布也近似服从正态分布,8,理论上可以证明,抽样误差,由个体变异产生的、抽样造成的样本统计量与总体参数的差别 原因:1)抽样 2)个体差异,由于变异的存在,抽样研究所造成的样本均数与总体均数的差异,以及各样本均数间的差异称为均数的抽样误差。 抽样误差在抽样研究中是不可避免的,但只要严格遵循随机化抽样的原则,就能估计抽样误差的大小,1.均数的抽样误差的概念,表示样本统计

3、量抽样误差大小的统计指标。 标准误:说明抽样误差的大小,总体计算公式,2、标准误(standard error, SE,实质:样本均数的标准差,若用样本标准差s 来估计 , (7-28,当样本例数n一定时,标准误与标准差呈正比 当标准差一定时,标准误与样本含量n的平方根呈反比,通过增加样本含量n来降低抽样误差,抽样调查150名3岁女孩的身高均数为92.79cm,标准差为4.61cm,则其标准误是多少,例子,1、反映样本均数的可靠性; 2、估计总体均数的置信区间; 3、用于均数的假设检验,标准误的应用,标准差和标准误的区别,16,二、t 分布,一)t分布概念,随机变量X N(m,s2,标准正态分

4、布 N(0,12,z变换,式中 为自由度(degree of freedom, df,3实际工作中,由于 未知,用 代替,则 不再服从标准正态分布,而服从t 分布,均数,标准正态分布 N(0,12,Student t分布 自由度:n-1,22,英国统计学家Gosset,二)t 分布的图形与特征,分布只有一个参数,即自由度,图 不同自由度下的t 分布图,t 分布与标准正态分布,25,26,1特征,2、 t界值表: 详见P312,可反映t分布曲线下的面积。 单侧概率或单尾概率:用 表示; 双侧概率或双尾概率:用 表示,由t界值表可知: 相同自由度时,t越大,概率P越 小。 相同t值时,双侧概率是单

5、侧概率的两倍。 =时,t 分布即为Z分布,故t界值表中最后一行是Z界值,t分布的分位数(双侧t界值,2,2,1,t/2,t/2,31,1,t,t分布的分位数(单侧t界值,32,举例,三、总体均数的置信区间估计 用样本统计量推断总体参数。 总体均数估计:用样本均数推断总体均数,点估计(point estimation,用相应样本统计量直接作为其总体参数的估计值。如用 估计、s估计 等。其方法虽简单,但未考虑抽样误差的大小,按预先给定的概率(1)所确定的包含未知总体参数的一个范围。 总体均数的区间估计:按预先给定的概率(1)所确定的包含未知总体均数的一个范围。 如给定=0.05,该范围称为参数的9

6、5%可信区间或置信区间; 如给定=0.01,该范围称为参数的99%可信区间或置信区间,2区间估计(interval estimation,计算总体均数可信区间 需考虑: (1)总体标准差是否已知, (2)样本含量n的大小 通常有两类方法: (1)t分布法 (2)z分布法,1.当未知且n 较小时,由于 服从 t分布,可按 t 分布原理估计总体均数的可信区间。 由于 即 故总体均数(1-)100%的可信区间为,38,2、当未知但n足够大时( n 100),t分布近似u分布,可以 u 界值代替 t 界值,估计总体均数的可信区间。 3、当已知时,可按正态分布的原理,估计总体均数的可信区间,39,例 某

7、地抽取正常成年人200名,测得其血清胆固醇的均数为3.64 mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数的95%可信区间,故该地正常成年人血清胆固醇均数的95%可信区间为(3.47, 3.81)mmolL,40,四、置信区间的确切涵义,41,1. 95%的可信区间的理解: (1)我们所估计的可信区间有95%的可能包含所要估计的总体参数。 (2)从正态总体中随机抽取100个样本,可算得100个样本均数和标准差,也可算得100个均数的可信区间,平均约有95个可信区间包含了总体均数 。 (3)但在实际工作中,只能根据一次试验结果估计可信区间,我们就认为该区间包含了总体

8、均数,42,2.可信区间的两个要素 (1)准确度:用可信度(1)表示:即区间包含总体均数 的理论概率大小 。 当然它愈接近1愈好,如99%的可信区间比95%的可信区间要好 。 (2)精确度:反映在区间的宽度上。 区间愈窄愈好,如95%的可信区间比99%的可信区间要好,43,当n确定时,上述两者互相矛盾。 提高准确度(可信度),则精确度降低(可信区间会变宽),势必降低可信区间的实际应用价值,故不能笼统认为99%可信区间比95%可信区间要好。 相反,在实际应用中,95%可信区间更为常用。 在可信度确定的情况下,增加样本含量可减小区间宽度,提高精确度,44,45,一、 假设检验的基本原理,第四节 t

9、检验,假设检验的基本原理,反证法: 当一件事情的发生只有两种可能A和B,为了肯定一种情况A,但又不能直接证实A,这时否定另一种可能B,则间接肯定了A。 概率论(小概率): 如果一件事情发生的概率很小,那么在一次试验时,我们说这个事件是”不会发生的”。从一般的常识可知,这句话在大多数情况下是正确的,但有犯错误的时候,因为概率小也是有可能发生的,假设检验的基本原理,假设检验是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。 问题实质上都是希望通过样本统计量与总体参数的差别,或两个样本统计量的差别,来推断

10、总体参数是否不同。这种识别的过程,就是本章介绍的假设检验(hypothesis test,例 15.13 根据大量调查,已知一般健康成年男子的脉搏均数为72次/min。某医生在某山区随机抽查100名健康成年男子,求得其脉搏均数为76.2次/min,标准差为4.0次/min,能否认为该山区的健康成年男子脉搏均数高于一般健康成年男子的脉搏均数,0=72次/min,山区健康成年男子,一般健康成年男子,假设检验的基本思想,据专业知识,有两种可能: 0或 0 直接证明是哪种结果都很困难,利用反证法。 假设 0 ,然后借助一定的分布,观察实测 样本情况是否属于小概率事件。 如果实测样本情况属于小概率事件,

11、则认为原先的假设是错的,拒绝这个假设; 如果实测样本情况不属于小概率事件,则不拒绝原来的假设,假设检验的一般步骤,一)建立检验假设(hypothesis under test), 确定检验水准 无效假设或零假设(null hypothesis) H0: 0 假定总体参数相同 备择假设或对立假设(alternative hypothesis) H1: 0或0( 0 ) 假定总体参数不相同,即差别不是由于抽样误差所致,注意,假设针对的是总体; H0和 H1是互斥的; 单侧、双侧的选择,样本均数所代表的未知总体均数与 已知总体均数0的比较 目的 双侧检验是否 单侧检验是否 是否 ,检验水准(size of test) 也称显著性水准(significance level),符号为,常取0.05或0.01,是小概率事件的概率标准,也是假设检验时发生第一类错误的概率,二)选定检验方法和计算检验统计量 根据资料类型、研究设计的类型及分析目的选用适当的检验方法,计算相应的检验统计量。 具体有t检验和u检验,三)确定P值,做出推断结论 用计算得的检验统计量与相应界值表中的界值比较,确定P值。 P值是指在H0所规定的总体中做随机抽样,获得等于及大于(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论