4-抽样误差与假设检验_第1页
4-抽样误差与假设检验_第2页
4-抽样误差与假设检验_第3页
4-抽样误差与假设检验_第4页
4-抽样误差与假设检验_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、抽样分布与参数估计,南昌大学公共卫生学院 李悦,?,抽样分布与抽样误差,抽样研究的目的是用样本信息推断总体特征,即用样本统计量推断总体参数。 常用的统计推断方法有:参数估计和假设检验,抽样误差:由抽样引起的样本统计量与总体参数间的差异。 两种表现形式: 样本统计量与总体参数间的差异 样本统计量间的差异,抽样误差,通过研究样本均数的分布来研究抽样误差的大小。,样本均数的抽样分布与抽样误差 假定某年某地所有13岁女学生身高服从总体均数 =155.4cm, 总体标准差 =5.3cm的正态分布。在这样一个有限的总体中作随机抽样,共抽100次,每次均抽取30例(ni = 30,i=1,2,100)组成一

2、份样本,可以算出每一份样本的平均身高。最终计算得到100个样本均数。现将这100个样本均数看成新的随机变量绘制频数分布表,如表所示 。,抽样分布,从正态总体N (155.4, 5.32)抽样得到的100个样本均数的频数分布(ni =30),抽样分布,理论上可以证明:若从正态总体 中,反复多次随机抽取样本含量固定为n 的样本,那么这些样本均数(随机变量)也服从正态分布,即总体均数仍为 ,样本均数的标准差为 。,抽样分布示意图,抽样分布,抽样分布,中心极限定理: 当样本含量很大的情况下,无论原始测量变量服从什么分布, 的抽样分布均近似正态分布。,抽样分布,抽样分布,抽样误差,三、标准误(Stand

3、ard Error) 样本均数的标准差称为标准误。样本均数的变异越小说明估计越精确,因此可以用标准误表示抽样误差的大小:,实际中总体标准差 往往未知,故只能求得样本均数标准误的估计值:,例4.1 试计算均数的标准误。在某地随机抽查成年男子140人,计算得红细胞均数4.771012/L,标准差0.38 1012/L ,,标准误是抽样分布的重要特征之一,可用于衡量抽样误差的大小,更重要的是可以用于参数的区间估计和对不同组之间的参数进行比较。,抽样误差,联系 都是变异指标。S反映个体观察值的变异; 反映统计量的变异。 当n不变时,标准差,标准误,标准差与标准误的联系和区别,标准差与标准误的联系和区别

4、,t分布,t分布的概念 从正态分布N(,2)抽得样本的均数也服从正态分布,记为N(, )。对正态变量 作变换 :,实际工作中,当 未知时,常用 来代替 对正态变量 采用的不是u变换, 而是t变换:,英国统计学家W.S.Gosset于1908年以“Student”笔名发表论文,证明 服从自由度 = n-1的t分布,即 t分布, = n-1 t分布又称Student t分布。实际上,t分布十分有用,它是总体均数的区间估计和假设检验的理论基础。,t分布,图4-2自由度分别为1、5、时的t分布,t 分布的图形,横轴为t值, 纵轴为t的概率密度函数f(t), 为自由度。,t分布为一簇单峰分布曲线 t分布

5、以0为中心,左右对称 t分布与自由度有关,自由度越小, t分布的峰越低,而两侧尾部翘得越高;自由度逐渐增大时, t分布逐渐逼近标准正态分布;当自由度无穷大时, t分布就是标准正态分布(u 分布)。,t 分布的特征,t分布分布函数,为应用方便,统计学家将t分布曲线下的尾部面积(概率P)与横轴t值间的关系,编制了不同自由度 下的t界值表(附表2)。 t界值表:横标目为自由度 ,纵标目为概率P。 t临界值:表中数字表示当 和P 确定时,对应的t值。 单侧概率对应的t临界值用符号t,表示;双侧概率则用t/2,表示。,同标准正态分布曲线一样,统计应用中最为关心的是,t分布曲线下的尾部面积(即概率P)与横

6、轴t值间的关系。,在t分布中,t值与、的大小有关,一定自由度和概率下的t值可通过查 t界值表获得;例如=9,单侧 =0.05 ,查附表得单侧 t0.05,9=1.833,而当 24 ,双侧=0.05 ,查表得t0.05/2,24=2.064,2.064即为两侧尾部概率各为0.025的t界值。,t分布,标准正态分布中u值大小只与尾部面积(概率)有关,以 u (单侧)和u/2(双侧)表示;例如单侧=0.05时 ,查附表最后一行得单侧 u0.05=1.65。当双侧=0.05时 ,查附表最后一行得双侧 u0.05=1.96。,u分布,从t界值表中可看出: 在相同自由度时,t值越大,概率P越小; 而在相

7、同t值时,双侧概率P为单侧概率P的两倍,即t0.05/2,15 = t0.025,15 =2.131。,参数估计的概念 参数估计:指用样本指标(统计量) 估计总体指标(参数)。 参数估计有: 点估计(point estimation) 区间估计(interval estimation),Jerzy Neyman (1894 1981) 美籍波兰裔统计学家,参数估计,现今最流行的一种区间估计理论是统计学家Jerzy Neyman在20世纪30年代建立起来的 。,点估计:直接用样本统计量作为总体参数的估计值 。,点估计,在实际问题中,总体参数往往是未知的,但它们是固定的值,并不是随机变量值。而样本

8、统计量随样本的不同而不同,属随机的。,如用27例健康成年男性血红蛋白量的样本均数作为总体均数的点估计值 。 该方法简单,但未考虑抽样误差的大小,无法评价估计值它与真值之间的差距。,按一定的概率或可信度(1- )用一个区间估计总体参数所在范围,这个范围称作可信度为1- 的可信区间(confidence interval, CI),又称置信区间,可信区间中较大值者记为CU,较小值者记为CL 。,可信度: 值一般取0.05或0.01,故1 为0.95或0.99。如果没有特别说明,一般作双侧的区间估计 。,区间估计,(一)正态分布法,可信区间的计算,当总体标准差已知时,正态总体N(, 2)的样本均数的

9、u变换结果,按标准正态分布的规律,有95%的u值在-1.96 和+1.96之间,即:,总体均数的(1- )可信区间一般计算式为 :,从而得到95%的可信区间:,样本均数的抽样分布,可信区间计算的原理,总体均数的(1- )可信区间:,需要注意:在小样本情况下,应用这一公式的条件是原始变量服从正态分布。,可信区间的计算,(二)t分布法,当总体标准差未知时,正态总体N(, 2)的样本均数的t变换结果服从t分布。计算可信区间的原理与正态分布法完全相同,仅仅是两侧概率的界值有些差别。即,(该公式最常用),当样本含量较大时,例如n100,t分布近似标准正态分布,此时可用标准正态分布代替t分布,作为可信区间

10、的近似计算。相应的100(1-)可信区间为:,可信区间的计算,(三)正态分布近似法,例4.2 某医生测得25名动脉粥样硬化患者血浆纤维蛋白原含量的均数为3.32g/L,标准差为0.57 g/L,试计算该种病人血浆纤维蛋白原含量总体均数的95%可信区间。,本例总体标准差未知,n25属于小样本,应用t分布法求可信区间。已知自由度=25-1=24,查t界值表得t0.05/2,24=2.064,则,可信区间的计算,上限:,下限:,即该种病人血浆纤维蛋白原含量总体均数的95可信区间为: 3.093.56(g/L)。若以此区间内任一值作为总体均数的近似值,其误差不会超过 ,这个误差估计的可信度为95。,例

11、4.3 某地120名12岁男孩身高均数为142.67cm,标准误为0.5477cm,计算该地12岁男孩身高总体均数90的可信区间。,本例总体标准差未知,但因n120100属于大样本,故可以用 标准正态分布代替t分布,u0.10=1.64,即该地12岁男孩平均身高的90可信区间为:141.77143.57(cm), 可认为该地12岁男孩平均身高在141.77143.57(cm)之间,作出这一 判断的可信的程度为90。,可信区间的计算,误差不会超过多少?,已知某地27名健康成年男子的血红蛋白量均数 =125g/L,标准差S=15g/L。试问该市地健康正常成年男子血红蛋白血清胆固醇平均含量的95%置

12、信区间和99%置信区间各是多少? 解:本例n =27, = 27-1=26,查t界值表, = 0.05时, 双侧 t0.05/2, 26=2.056, = 0.01时,t0.01/2, 26= 2.779;按公式计算得:,可信区间的计算,95%CL: 125 2.056 =(119.06,130.94) g /L 99%CL:125 2.779 =(116.98,133.02)g /L 该市健康成年男子血红蛋白平均含量: 95%置信区间为(119.06, 130.94)g /L,99%置信区间为(116.98, 133.02)g /L。,可靠性 反映为可信水平1- 的大小 精确性 用可信区间长

13、度CUCL衡量 两者关系: 样本含量一定时,两者是矛盾的; 可信水平1-一定时,增加样本量可提高可信 区间的精确度。,可信区间的两个要素,可信区间一旦形成,它要么包含总体参数,要么不包含总体参数, 二者必居其一,无概率可言。所谓95的可信度是针对可信区间的构建方法而言的。 以均数的95%可信区间为例,其涵义是:如果重复100次抽样,每次样本含量均为n,每个样本均按 构建可信区间,则在此100个可信区间内,理论上平均有95个包含总体均数,而有5个不包含总体均数。 在区间估计中,总体参数虽未知,但却是固定的值(且只有一个),而不是随机变量值 。,正确理解可信区间的涵义,模拟抽样成年男子红细胞数。设

14、定:,可信区间的模拟实验,产生100个随机样本,分别计算其95%的可信区间,结果用图示的方法表示。从图可以看出:绝大多数可信区间包含总体参数 ,只有6个可信区间没有包含总体参数(用星号标记)。,图4-2 模拟抽样成年男子红细胞数100次的95%可信区间示意图,可信区间的模拟实验,可信区间用于估计总体参数,总体参数只有一个 。 参考值范围用于估计变量值的分布范围,变量值可能很多甚至无限 。 95%的可信区间中的95%是可信度,即所求可信区间包含总体参数的可信程度为95% 95%的参考值范围中的95%是一个比例,即所求参考值范围包含了95%的正常人。,可信区间与参考值范围的区别,检 验 假 设,例

15、: 测得25例某病女性患者的血红蛋白(Hb),其均数为150(g/L),标准差为16.5(g/L)。而该地正常成年女性的Hb均数为132(g/L)。问该病女性患者的Hb含量是否与正常女性Hb含量不同?,0 =132(g/L),n=25,已知总体,未知总体,手头样本,目的:推断病人的平均血红蛋白(未知总体均数)与正常女性的平均血红蛋白(已知总体均数0)间有无差别? =0 ?,手头样本对应的未知总体均数等于已知总体均数0,差别仅仅是由于抽样误差所致; 除抽样误差外,病人与正常人存在本质上的差异 (即两总体均数不等)。,造成差异的原因有两个:,差异小认为由于抽样误差所致,差异大则认为由于来自不同的总

16、体所致。如何判断差异大还是小?即如何作出决策?用统一的标准假设检验来解决。,1. 建立假设和确定检验水准,零假设(null hypothesis),记为H0 H0: = 0 =132,病人与正常人的平均血红蛋白含量相等; 备择假设(alternative hypothesis),记为H1 H1: 0 =132 132,病人与正常人的平均血红蛋白含量 不等。,假设检验的基本步骤,建立两个假设,其中H0假设比较单纯、明确,在H0 下若能弄清抽样误差的分布规律,便有规律可循。而H1假设包含的情况比较复杂。因此,我们着重考察样本信息是否支持H0假设(因为单凭一份样本资料不可能去证明哪个假设是正确的,哪

17、一个不正确)。,假设检验的基本步骤,H0和H1两个假设是相互联系、对立的假设,缺一不可。H1的内容反映出检验的单双侧。,确定检验水准 (型错误概率的大小),设定检验水准的目的就是确定拒绝假设H0时的最大允许误差。医学研究中一般取=0.05 。 检验水准实际上确定了小概率事件的判断标准。,假设检验的基本步骤,2.选择检验方法计算检验统计量(计算样本与总体的偏离),统计量t表示,在标准误的尺度下,样本均数与总体均数0的偏离。这种偏离称为标准t离差。,假设检验的基本步骤,(标准化值),根据抽样误差理论,在H0假设前提下,统计量t服从自由度为n-1的t分布,即t值在0的附近的可能性大,远离0的可能性小

18、,离0越远可能性越小。 t值越小,越利于H0假设 t值越大,越不利于H0假设,假设检验的基本步骤,3.确定P值和作出统计推断结论,P值(与统计量t值对应的概率) :在H0成立的前提下,获得现有这么大的标准t离差以及更大离差的可能性。 P=P(|t|5.4545) ? 按 =25-1=24查附表2t界值表,假设检验的基本步骤,t0.05,24=2.064 , P =P ( |t| 2.064 )=0.05,P=P(|t|5.4545)=?,结论(根据小概率原理作出推断),在H0成立的前提下出现现有差别或更大差别的可能性 P(|t| 5.4545)小于0.05,是小概率事件,即现有样本信息不支持H0。 抉择的标准为: 当P 时,拒绝H0,接受H1 当P 时,不拒绝H0 本例P0.05,按 =0.05的水准,拒绝H0,接受H1,差别有统计学意义。认为该病女性患者的Hb含量高于正常女性的Hb含量。,假设检验的基本步骤,1.建立假设和确定检验水准 2.选择检验方法和计算检验统计量 3.确定P和作出结论 当P 时,拒绝H0,接受H1,差别有统计学意义。 当P 时,不拒绝H0,差别无统计学意义。 不管是拒绝H0,还是不拒绝H0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论