常用显著性检验_第1页
常用显著性检验_第2页
常用显著性检验_第3页
常用显著性检验_第4页
常用显著性检验_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、u 检验、 t 检验、 f 检验、 x2 检验常用显著性检验1.t 检验适用于计量资料、 正态分布、 方差具有齐性的两组间小样本比较。包括配对资料间、样本与均数间、两样本均数间比较三种,三者的计算公式不能混淆。2.t检验应用条件与 t 检验大致相同, 但 t检验用于两组间方差不齐时,t检验的计算公式实际上是方差不齐时t 检验的校正公式。3.u 检验应用条件与 t 检验基本一致,只是当大样本时用u 检验,而小样本时则用t检验, t 检验可以代替 u 检验。4.方差分析用于正态分布、 方差齐性的多组间计量比较。 常见的有单因素分组的多样本均数比较及双因素分组的多个样本均数的比较,方差分析首先是比较

2、各组间总的差异,如总差异有显著性,再进行组间的两两比较,组间比较用q 检验或 lst检验等。5.x2 检验是计数资料主要的显著性检验方法。用于两个或多个百分比(率)的比较。常见以下几种情况: 四格表资料、配对资料、多于2 行*2 列资料及组内分组 x2 检验。6.零反应检验用于计数资料。是当实验组或对照组中出现概率为0 或 100时, x2 检验的一种特殊形式。属于直接概率计算法。7.符号检验、秩和检验和ridit 检验三者均属非参数统计方法,共同特点是简便、快捷、实用。可用于各种非正态分布的资料、 未知分布资料及半定量资料的分析。其主要缺点是容易丢失数据中包含的信息。所以凡是正态分布或可通过

3、数据转换成正态分布者尽量不用这些方法。8.hotelling 检验用于计量资料、正态分布、两组间多项指标的综合差异显著性检验。计量经济学检验方法讨论计量经济学中的检验方法多种多样,而且在不同的假设前提之下, 使用的检验统计量不同,在这里我论述几种比较常见的方法。在讨论不同的检验之前, 我们必须知道为什么要检验, 到底检验什么?如果这个问题都不知道, 那么我觉得我们很荒谬或者说是很模式化。检验的含义是要确实因果关系,计量经济学的核心是要说因果关系是怎么样的。那么如果两个东西之间没有什么因果联系, 那么我们寻找的原因就不对。 那么这样的结果是没有什么意义的,或者说是意义不大的。 那么检验对于我们确

4、认结果非常的重要,也是评价我们的结果是否拥有价值的关键因素。所以要做统计检验。t 检验,t 检验主要是检验单个ols 估计值或者说是参数估计值的显著性,什么是显著性?也就是给定一个容忍程度, 一个我们可以犯错误的限度, 错误分为两类:1、本来是错的但是我们认为是对的。2、本来是对的我们认为是错的。统计的检验主要是针对第一种错误而言的。 一般的计量经济学中的这个容忍程度是5%,也就是说可以容忍我们范第一类错误的概率是5%。这样说不准确,但是比较好理解。t-stastic 是类似标准正态化的正态分布两一样,也就是估计值减去假设值除以估计值得标准差,一般假设值是0,这一点不难理解,如果是0 ,那么也

5、就意味着没有因果关系。这个t-static 在经典假设之下服从t 分布。t 分布一般是和正态分布差不多, 尤其是当样本的量足够大的时候,一般的经验认为在样本数量大于 120 的时候,就可以看成是正态分布的。f-statistc :f 检验是属于联合检验比较重要的一种,主要的目的是用于对于一系列的原因的是否会产生结果这样一个命题做出的检验。f 统计量主要的产生来源是 ssrsstsse 三个量。但是这个检验有一个缺点是必须在经典假设之下才能有效。lm 检验:这个检验的性质和f 检验的性质是一样的,都是检验联合显著性的,不同的是 f 统计量符合 f 分布,但是 lm 统计量服从卡方分布。卡方分布是

6、正态分布的变量的平方和, 而 f 分布是卡方分布的商, 并且分子和分布必须独立,这就是为什么 f 检验适用范围受限的原因。lm=n*ssr 、或者是 lm=n-ssr 。至于其他的 white 检验、 brusch-pagan 检验(异方差的检验方法)、还有序列相关的 t 检验、 dw 检验基本原来是相同的。关于异方差检验、序列相关的检验其中存在不同的地方, 但是思想基本是相同的。关于异方差检验的讨论:1、brusch-pagan 检验:这个检验的思路比较简单,主要是要研究残查和x 之间的关系,给定这样的一个方程:u=b0+b1*x1+ +bn*xn+u 的回归,其中进行 f 检验和 lm 检

7、验。如果检验通过那么不存在异方差,如果不通过那么存在异方差。2、white 检验:这个检验也是对异方差的检验,但是这个检验不同的是不仅对于 x 的一次方进行回归,而且考虑到残查和x 的平方还有 xi*xj 之间的关系。给定如下方程: u=b0+b1*y+b2*y2+u。也是用 f 和 lm 联合检验来检验显著性。如果通过那么不存在异方差,否则存在。序列相关的检验方法的讨论:对于时间序列的问需要知道一个东西,也就是一介自回归过程, 也就是一般在教科书中说到的: ar(1)过程,其中的道理主要是说在当期的变量主要是取决于过去一个时期的变量和一个随机误差项。表示如下:ut=p*u(t-1)+et 。

8、在这里我要说到几个概念问题, i(1)(一阶积整)、 i(0)(零阶积整)。其中的一介自回归过程 ar(1)就属于零阶积整过程, 而一阶积整过程实际上是随机游动和飘移的随机游动过程。随机游动过程:ut=u(t-1)+et 。也就是在 ar(1) 的过程之下,其中的p是等于 1的。 飘移的随机游动过程: ut=a+u(t-1)+et 。 其中随机游动过程和ar(1)过程中的不同点在于一个弱相依性的强弱问题,实际上我们在时间序列问题中,我们可以认为任何一个过程是弱相依的,但是问题的关键是我们不知道到底有多弱?或者更加直观地说,我们想知道p 到底是多大,如果p 是 0.9 或者是一个比较接近于 1

9、得数,那么可能我们可以认为这个时间序列有高度持久性,这个概念表示当期的变量却绝于一个很早的时期的变量,比如一阶积整过程,实际上et 是一个独立统分布的变量,而且条件数学期望等于0,没有异方差性。那么实际上这个序列的数学期望是和期数没有什么关系的。那么也就意味着从第0 期开始,u 的数学期望值就是和很久以后的u 的数学期望值一样的。但是方差就不同了,方差随着时间的增加不断扩大。我们知道了, 这种不同的概念就可以讨论在一阶自回归的条件之下的检验问题,但是我们说一介自回归的过程是参差序列的特征而已,其他的变量的特征问题我们不谈。在讨论检验的问题以前, 我有必要交待一下时间序列在ols 估计的时候我们

10、应该注意什么。实际上解决序列自相关问题最主要的问题就是一个差分的方法。因为如果是长期持久的序列或者是不是长期持久的序列,那么一定的差分就可以解除这种问题。1、t 检验。如果我们知道这个变量是一个一介自回归的过程,如果我们知道自回归过程是 ar(1)的。那么我们就可以这样作,首先我们做ols 估计,得到的参差序列我们认为是一阶自相关的。那么为了验证这种情况,那么我们可以做ut和 u(t-1)的回归,当然这里可以包含一个截距项。那么我们验证其中的参数的估计是不是显著的,就用t 检验。t 检验与 f 检验有什么区别1.检验有单样本 t 检验,配对 t 检验和两样本 t 检验。单样本 t 检验:是用样

11、本均数代表的未知总体均数和已知总体均数进行比较,来观察此组样本与总体的差异性。配对 t 检验:是采用配对设计方法观察以下几种情形,1,两个同质受试对象分别接受两种不同的处理;2,同一受试对象接受两种不同的处理;3,同一受试对象处理前后。f 检验又叫方差齐性检验。在两样本t 检验中要用到 f 检验。从两研究总体中随机抽取样本,要对这两个样本进行比较的时候, 首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t 检验,若不等,可采用t检验或变量变换或秩和检验等方法。 其中要判断两总体方差是否相等,就可以用 f 检验。2.t 检验和方差分析的前提条件及应用误区用于比较均值的t 检验

12、可以分成三类,第一类是针对单组设计定量资料的;第二类是针对配对设计定量资料的;第三类则是针对成组设计定量资料的。后两种设计类型的区别在于事先是否将两组研究对象按照某一个或几个方面的特征相似配成对子。无论哪种类型的t 检验,都必须在满足特定的前提条件下应用才是合理的。若是单组设计, 必须给出一个标准值或总体均值,同时,提供一组定量的观测结果,应用 t 检验的前提条件就是该组资料必须服从正态分布;若是配对设计,每对数据的差值必须服从正态分布;若是成组设计, 个体之间相互独立, 两组资料均取自正态分布的总体,并满足方差齐性。之所以需要这些前提条件, 是因为必须在这样的前提下所计算出的t 统计量才服从

13、 t 分布,而 t 检验正是以 t 分布作为其理论依据的检验方法。值得注意的是,方差分析与成组设计t 检验的前提条件是相同的,即正态性和方差齐性。t 检验是目前医学研究中使用频率最高,医学论文中最常见到的处理定量资料的假设检验方法。 t 检验得到如此广泛的应用,究其原因,不外乎以下几点:现有的医学期刊多在统计学方面作出了要求,研究结论需要统计学支持; 传统的医学统计教学都把 t 检验作为假设检验的入门方法进行介绍,使之成为广大医学研究人员最熟悉的方法; t 检验方法简单,其结果便于解释。简单、熟悉加上外界的要求,促成了 t 检验的流行。但是,由于某些人对该方法理解得不全面,导致在应用过程中出现

14、不少问题, 有些甚至是非常严重的错误, 直接影响到结论的可靠性。将这些问题归类,可大致概括为以下两种情况:不考虑 t 检验的应用前提,对两组的比较一律用t 检验;将各种实验设计类型一律视为多个单因素两水平设计,多次用 t 检验进行均值之间的两两比较。以上两种情况, 均不同程度地增加了得出错误结论的风险。而且,在实验因素的个数大于等于 2 时,无法研究实验因素之间的交互作用的大小。u 检验和 t 检验区别与联系u 检验和 t 检验可用于样本均数与总体均数的比较以及两样本均数的比较。理论上要求样本来自正态分布总体。但在实用时,只要样本例数n 较大,或 n 小但总体标准差已知时,就可应用u 检验;n

15、 小且总体标准差未知时,可应用t检验, 但要求样本来自正态分布总体。 两样本均数比较时还要求两总体方差相等。一、样本均数与总体均数比较比较的目的是推断样本所代表的未知总体均数与已知总体均数0 有无差别。通常把理论值、标准值或经大量调查所得的稳定值作为0.根据样本例数 n 大小和总体标准差是否已知选用 u 检验或 t 检验。(一)u 检验用于已知或未知但 n 足够大 用样本标准差 s 作为的估计值,代入式( 19.6)时。以算得的统计量 u,按表 19-3 所示关系作判断。表 19-3 u 值、p 值与统计结论t值p 值统计结论0.05 双侧单侧1.96 1.645 0.05 不拒绝 h0,差别

16、无统计学意义0.05 双侧单侧 1.96 1.645 0.05 拒绝 h0,接受 h1,差别有统计学意义0.01 双侧单侧 2.58 2.33 0.01 拒绝 h0,接受 h1,差别有高度统计学意义例 19.3 根据大量调查,已知健康成年男子脉搏均数为72 次/分,标准差为 6.0次/分。某医生在山区随机抽查25 名健康成年男子,求得其脉搏均数为74.2 次/分,能否据此认为山区成年男子的脉搏高于一般?据题意,可把大量调查所得的均数72 次/分与标准差 6.0 次/分看作为总体均数0 和总体标准差,样本均数 x 为 74.2 次/分,样本例数 n 为 25.h0: = 0h1: 0 =0.05

17、(单侧检验)算得的统计量 u=1.833 1.645,p0.05,按 =0.05 检验水准拒绝 h0,可认为该山区健康成年男子的脉搏高于一般。(二) t 检验用于未知且 n 较小时。以算得的统计量 t,按表 19-4 所示关系作判断。表 19-4 t值、 p 值与统计结论t值p 值统计结论0.05 t0.05(v) 0.05 不拒绝 h0,差别无统计学意义0.05 t0.05(v) 0.05 拒绝 h0,接受 h1,差别有统计学意义0.01 t0.01(v) 0.01 拒绝 h0,接受 h1,差别有高度统计学意义例 19.4 若例 19.3 中总体标准差未知,但样本标准差已求出,s=6.5 次

18、/分,余数据同例 19.3.据题意,与例 19.3 不同之处在于未知,可用 t 检验。h0: = 0h1: 0 =0.05(单侧检验)本例自由度 v=25-1=24 ,查 t 界值表(单侧)(附表 19-1 )得 t0.05(24)=1.711.算得的统计量 t=1.692 1.711 ,p0.05,按 =0.05 检验水准不拒绝 h0,尚不能认为该山区成年男子的脉搏高于一般。二、配对资料的比较在医学研究中, 常用配对设计。 配对设计主要有四种情况: 同一受试对象处理前后的数据;同一受试对象两个部位的数据; 同一样品用两种方法 (仪器等)检验的结果; 配对的两个受试对象分别接受两种处理后的数据

19、。情况的目的是推断其处理有无作用;情况、的目的是推断两种处理(方法等)的结果有无差别。公式( 19.8)式中,0 为差数年总体均数,因为假设处理前后或两法无差别,则其差数的均数应为 0,d 为一组成对数据之差d(简称差数)的均数,其计算公式同式 (18.1 );sd 为差数均数的标准误, sd 为差数年的标准差,计算公式同式(18.3);n 为对子数。因计算的统计量是t,按表 19-4 所示关系作判断。例 19.5 应用某药治疗 9 例高血压病人, 治疗前后舒张压如表19-5,试问用药前后舒张压有无变化?表 19-5 高血压病人用某药治疗前后的舒张压(kpa )病人编号治疗前治疗后差数 d d

20、2 1 12.8 11.7 1.0 1.21 2 13.1 13.1 0.0 0.00 3 14.9 14.4 0.5 0.25 4 14.4 13.6 0.8 0.64 5 13.6 13.1 0.5 0.25 6 13.1 13.3 -0.2 0.04 7 13.3 12.8 0.5 0.25 8 14.1 13.6 0.5 0.25 9 13.3 12.3 1.0 1.00 合计4.7 3.89 h0:该药治疗前后的舒张压无变化,即 d=0h1:该药治疗前后的舒张压有变化,即 d 0 =0.05自由度 v=n-1=8 , 查 t 界值表得 t0.05 (8) =2.306, t0.01

21、(8) =3.355, 本例 t=3.714t0.01(8),p0.01,按 =0.05 检验水准拒绝 h0,接受 h1,可认为治疗前后舒张压有变化,即该药有降压作用。三、完全随机设计的两样本均数的比较亦称成组比较。目的是推断两样本各自代表的总体均数1 与 2 是否相等。根据样本含量 n 的大小,分 u 检验与 t 检验。(一) u 检验可用于两样本含量n1、n2、均足够大时,如均大于50 或 100.公式( 19.9)算得的统计量为 u 值,按表 19-3 所示关系作出判断。例 19.6 某地抽样调查了部分健康成人红细胞数,其中男性 360 人, 均数为 4.660 1012/l ,标准差为

22、 0.575 1012/l ;女性 255 人,均数为 4.178 1012/l ,标准差为 0.291 1012/l ,试问该地男、女红细胞数的均数有无差别?h0: = 0h1: 0 =0.05今 x1=4.660 1012/l ,s1=0.575 1012/l ,n1=360;x2=4.1781012/l ,s2=0.2911012/l ,n2=255.算得的 u=13.63 2.58,p0.01,按 =0.05 检验水准拒绝 h0,接受 h1,可认为该地男女红细胞数的均数不同,男性高于女性。(二) t 检验可用于两样本含量n1、n2 较小时,且要求两总体方差相等,即方差齐(homosce

23、dasticity )。若被检验的两样本方差相差较大且差别有统计学意义则需用 t 检验。公式( 19.10 )公式( 19.11 )公式( 19.12 )式中 sx1x2,为两样本均数之差的标准误,s2c 为合并估计方差(combinedestimatevariance )。算得的统计量为 t,按表 19-4 所示关系作出判断。例 19.7 某医生统广西瑶族和侗族正常妇女骨盆x 线测量资料各 50 例。骨盆入口前后径:瑶族的均数为12.002 (cm),标准差 0.948(cm),侗族相应的为11.456 (cm)和 1.215 (cm)。问两族妇女的骨盆入口前后径是否有差别?h0: 1= 2

24、h1: 1 2 =0.05已知 n1=n2=50 , x1=12.002 (cm),s1=0.948 (cm);x2=11.456 (cm),s2=1.215 (cm)。本例自由度 v =n1+n2-2=98 , 查 t 界值表表内自由度一栏无98, 可用内插法(从略)或用 v =100 估计.t0.05 (100 )=1948,t0.01(100)=2.626 ,今 t=2.505t0.05(1000,p0.05,按 =0.05 检验水准拒绝 h0,接受 h1,可认为广西瑶族和侗族妇女骨盆入口前后径不同,前者大于后者。四、完全随机设计的两样本几何均数比较医学上有些资料为等比资料或正态分布资料

25、,宜用几何均数表示其平均水平。 比较两样本几何均数的目的是推断它们分别代表的总体几何均数是否相等。此种情况下,应先把原始数据x 进行对数变换,用变换后的数据代入式(19.10)、(19.11)、( 19.12)计算 t 值。例 19.8 将 20 名钩端螺旋体病人的血清随机分为两组,分别用标准株或水生株作凝溶试验,测得稀释倍数如下,问两组的平均效价有无差别?x1:标准株( 11 人)100,200,400,400,400,400 ,800,1600,1600 ,1600,3200x2:水生珠( 9 人)100,100,100,200,200,200,200,400,400h0: 1= 2h1:

26、 1 2 =0.05将两组数据分别取对数,以对数作为新变量x1 和 x2.x1:2.000,2.301 ,2.602,2.602 ,2.602,2.602 ,2.903,3.204 ,3.204 ,3.204,3.505x2: 2.000,2.000 ,2.000,2.301,2.301 ,2.301,2.301 ,2.602,2.602用变换后的数据计算x1, s12;x2, s22 再代入式(19.10 )、 (19.11 ) 、 (19.12 )计算 t 值。x1=2.794 ,s12=0.2043 ;x2=2.268 ,s22=0.0554自由度 v=11+9-2=18 ,查 t 界值

27、表得 t0.01(18)=2.878 ,今 t=3.150 2.878 ,p0.01,按 =0.05 检验水准拒绝 h0,接受 h1,可认为两组平均效价不同,标准株高于水生株。t 检验及其与方差分析的区别假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来推断他们相应的总体参数是否相同。t 检验:1.单因素设计的小样本( n50)计量资料2.样本来自正态分布总体3.总体标准差未知4.两样本均数比较时,要求两样本相应的总体方差相等? 根据研究设计 t 检验可由三种形式:单个样本的 t 检验配对样本均数 t 检验(非独立两样本均数 t 检验)两个独立样本均数 t 检验(1)单个

28、样本 t 检验? 又称单样本均数 t 检验(one sample ttest),适用于样本均数与已知总体均数 0的比较 ,其比较目的是检验样本均数所代表的总体均数 是否与已知总体均数 0有差别。? 已知总体均数 0 一般为标准值、 理论值或经大量观察得到的较稳定的指标值。? 单样 t 检验的应用条件是总体标准s 未知的小样本资料 ( 如 n50),且服从正态分布。(2)配对样本均数 t 检验? 配对样本均数t检验简称配对t检验(pairedttest),又称非独立两样本均数t检验,适用于配对设计计量资料均数的比较,其比较目的是检验两相关样本均数所代表的未知总体均数是否有差别。? 配对设计 (p

29、aired design) 是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。? 应用配对设计可以减少实验的误差和控制非处理因素,提高统计处理的效率。? 配对设计处理分配方式主要有三种情况:两个同质受试对象分别接受两种处理,如把同窝、同性别和体重相近的动物配成一对,或把同性别和年龄相近的相同病情病人配成一对;同一受试对象或同一标本的两个部分,随机分配接受两种不同处理,如例5.2资料;自身对比 (self-contrast) 。即将同一受试对象处理(实验或治疗)前后的结果进行比较,如对高血压患者治疗前后、 运动员体育运动前后的某一生理指标进行比较。(3)两独立样本

30、 t 检验两独立样本 t 检验(two independentsamples t-test),又称成组t 检验。? 适用于完全随机设计的两样本均数的比较,其目的是检验两样本所来自总体的均数是否相等。? 完全随机设计是将受试对象随机地分配到两组中,每组对象分别接受不同的处理,分析比较处理的效应。或分别从不同总体中随机抽样进行研究。? 两独立样本 t 检验要求两样本所代表的总体服从正态分布n( 1, 12)和 n( 2, 22),且两总体方差 12、 22 相等,即方差齐性(homogeneityof variance,homoscedasticity) 。? 若两总体方差不等 ,即方差不齐,可采

31、用t检验 ,或进行变量变换 ,或用秩和检验方法处理。t 检验中的注意事项1. 假设检验结论正确的前提作假设检验用的样本资料,必须能代表相应的总体,同时各对比组具有良好的组间均衡性,才能得出有意义的统计结论和有价值的专业结论。这要求有严密的实验设计和抽样设计,如样本是从同质总体中抽取的一个随机样本 ,试验单位在干预前随机分组,有足够的样本量等。2. 检验方法的选用及其适用条件,应根据分析目的、研究设计、资料类型、样本量大小等选用适当的检验方法。t 检验是以正态分布为基础的, 资料的正态性可用正态性检验方法检验予以判断。 若资料为非正态分布, 可采用数据变换的方法,尝试将资料变换成正态分布资料后进

32、行分析。3. 双侧检验与单侧检验的选择需根据研究目的和专业知识予以选择。单侧检验和双侧检验中的 t 值计算过程相同,只是t 界值不同,对同一资料作单侧检验更容易获得显著的结果。单双侧检验的选择,应在统计分析工作开始之前就决定,若缺乏这方面的依据,一般应选用双侧检验。4. 假设检验的结论不能绝对化假设检验统计结论的正确性是以概率作保证的,作统计结论时不能绝对化。在报告结论时,最好列出概率p 的确切数值或给出p 值的范围,如写成 0.02p0.05, 同时应注明采用的是单侧检验还是双侧检验,以便读者与同类研究进行比较。当p 接近临界值时,下结论应慎重。5正确理解 p 值的统计意义p 是指在无效假设

33、h0 的总体中进行随机抽样 ,所观察到的等于或大于现有统计量值的概率。其推断的基础是小概率事件的原理,即概率很小的事件在一次抽样研究中几乎是不可能发生的,如发生则拒绝h0。因此,只能说明统计学意义的“显著” 。6假设检验和可信区间的关系假设检验用以推断总体均数间是否相同,而可信区间则用于估计总体均数所在的范围,两者既有联系又有区别。t 检验属于均值分析,它是用来检验两类母体均值是否相等。均值分析是来考察不同样本之间是否存在差异, 而方差分析则是评估不同样本之间的差异是否由某个因素起主要作用。t 检验: 是假设检验的一种常用方法,当方差未知时, 可以用来检验一个正态总体或两个正态总体的均值检验假

34、设问题,也可以用来检验成对数据的均值假设问题。具体内容可以参考概率论与数理统计。可以用来判断两组数倨差异是否有显著意义,也就是结果有没有统计学意义。方差分析 :它是处理实验研究资料时重要的分析方法之一,代表数据是否具有统计意义 , 一般一组数据代表某个条件或因素,方差分析可以判断你选取的这个因素是否有意义,是不是影响因素如果你做统计为了找到事物相关性,而方差结果显示数据无统计学差异,很可能代表实验失败或设计有问题在对均值进行假设检验时,一般有两种参数检验方法,即t 检验与方差分析。 t检验仅用在单因素两水平设计 (包括配对设计和成组设计)和单组设计 (给出一组数据和一个标准值的资料) 的定量资

35、料的均值检验场合; 而方差分析用在单因素 k 水平设计( k 3)和多因素设计的定量资料的均值检验场合。应当进一步说明的是,方差分析有十几种, 不同的方差分析取决于不同的设计类型。很多人习惯于用 t 检验取代一切方差分析。不能用 t 检验取代方差分析的情况单因素 k(k 3)水平设计时的情形 。为了便于理解,举例说明。实例研究单味中药对小鼠细胞免疫机能的影响,把40 只小鼠随机均分为4 组,每组 10 只,雌雄各半,用药 15d 后测定 e-玫瑰结成率( %),结果如下,试比较各组总体均值之间的差别有无显著性意义?对照组:14 10 12 16 13 14 12 10 13 9 党参组:21

36、24 18 17 22 19 18 23 20 18 黄芪组:24 20 22 18 17 21 18 22 19 23 淫羊藿组:35 27 23 29 31 40 35 30 28 36 处理本例资料,通常人们错误的做法是,重复运用成组设计资料的t 检验对 4 个组的均值进行 6 次两两比较;而正确的做法是,先进行单因素4 水平设计资料的方差分析,若 4 个总体均值之间的差别有显著性意义,再用q 检验等方法进行多个均值之间的两两比较。 下面将从多个方面来说明上述两种分析方法之间的差异(表 1)。表 1 用 t 检验与方差分析处理 实例资料的区别比较的内容资料的利用率对原实验设计的影响犯假阳

37、性错误的概率结论的可靠性t 检验 低: 每次仅用两组残:割裂了整体设计大:1- (1-0.05 ) 6 = 0.265 低:统计量的自由度小( =18)方差分析加 q 检验 高:每次要用全部数据全:与原实验设计相呼应小:0.05(假定=0.05)高:统计量的自由度大( =36)注:自由度大,所对应的统计量的可靠性就高,它相当于“权重”,也类似于产生“代表”的基数,基数越大,所选出的“代表”就越具有权威性。多因素设计时的情形 。为了便于理解,仍举例说明(表2)。表 2 注射氯化锂或烟碱后不同时间大鼠体温的下降值使用氯化锂与否使用烟碱与否第二次注射后不同时间体温下降值(摄氏度)0.7 1.5 3

38、5 - - 0.0 0.4 0.2 0.5 0.1 0.4 0.3 0.5 + - 0.7 0.5 0.1 0.5 0.1 0.6 0.2 0.5 - + 1.2 0.8 0.1 0.6 0.4 0.5 0.4 0.3 + + 1.7 0.6 0.7 0.6 0.3 0.6 0.1 0.5 显然,表 2 中涉及到的 3 个实验因素 (即”使用氯化锂与否”、“使用烟碱与否”、“药物在体内作用时间”)。这些因素之间一般都存在不同程度的交互作用,应当选用与设计类型(本例为具有一个重复测量的三因素设计)相对应的方差分析方法。然而,对于处置复杂的实验设计问题,人们常犯的错误是在;其一,将多因素各水平的不

39、同组合(本例中共有 16 种不同的组合,相当于 16 种不同的实验条件) 、简单地看作单因素的多个水平(即视为单因素16 水平),混淆了因素与水平之间的区别,从而错误地确定了实验设计类型;其二,分析资料时,常错误用单因素多水平设计或仍采用多次t 检验进行两两比较。误用这两种方法的后果是,不仅无法分析因素之间的交互作用的大小,而且,由于所选用的数学模型与设计不匹配,易得出错误的结论。答:t 检验适用于两个变量均数间的差异检验,多于两个变量间的均数比较要用方差分析。用于比较均值的t 检验可以分成三类,第一类是针对url=单组/url设计定量资料的; 第二类是针对配对设计定量资料的;第三类则是针对成

40、组设计定量资料的。后两种设计类型的区别在于事先是否将两组研究对象按照某一个或几个方面的特征相似配成对子。无论哪种类型的t 检验,都必须在满足特定的前提条件下应用才是合理的。若是单组设计,必须给出一个标准值或总体均值,同时,提供一组定量的观测结果,应用t 检验的前提条件就是该组资料必须服从正态分布;若是配对设计,每对数据的差值必须服从正态分布;若是成组设计,个体之间相互独立, 两组资料均取自正态分布的总体,并满足方差齐性。 之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t 统计量才服从 t 分布,而 t 检验正是以 t 分布作为其理论依据的检验方法。值得注意的是,方差分析与成组设计t

41、 检验的前提条件是相同的,即正态性和方差齐性。t 检验是目前医学研究中使用频率最高, 医学论文中最常见到的处理定量资料的假设检验方法。 t 检验得到如此广泛的应用,究其原因,不外乎以下几点:现有的医学期刊多在统计学方面作出了要求,研究结论需要统计学支持; 传统的医学统计教学都把 t 检验作为假设检验的入门方法进行介绍,使之成为广大医学研究人员最熟悉的方法; t 检验方法简单,其结果便于解释。简单、熟悉加上外界的要求,促成了 t 检验的流行。但是,由于某些人对该方法理解得不全面,导致在应用过程中出现不少问题, 有些甚至是非常严重的错误,直接影响到结论的可靠性。 将这些问题归类,可大致概括为以下两

42、种情况:不考虑t 检验的应用前提,对两组的比较一律用 t 检验;将各种实验设计类型一律视为多个单因素两水平设计,多次用 t 检验进行均值之间的两两比较。以上两种情况,均不同程度地增加了得出错误结论的风险。 而且,在实验因素的个数大于等于2 时,无法研究实验因素之间的交互作用的大小。u 检验(u test)以服从 u 分布的统计量检验统计假设的方法。均值的检验。一个正态总体:当 0: 0 2 2 已知时,用检验统计量:其中, 0、 02 为已知正态总体的均值与方差,x 为样本平均数, n 为样本含量。当总体分布未知但样本含量较大时,用检验统计量:两个正态总体:h0: 12 当两个总体方差 12、

43、 22 已知时,用检验统计量:当总体分布未知但样本含量较大时,用检验统计量:总体率的检验(适用于大样本)。一个总体: h0 : 0 用检验统计量:两个总体:h0: 12 用检验统计量:其中,为两样本率的加权平均数, m1、m2 分别为两样本中某事件出现的频数。u 检验的判断结论:对给定的显著性水平,查正态分布表,当0.05、 0.01 时, 临界值分别为 1.96、2.58。当 u1.96 时,p0.05,不拒绝 h0,差异不具显著性;当1.96u 2.58 时, p 0.05, 拒绝 h0, 差异具显著性;当 u 2. 58 时, p 0.01,拒绝 h0,差异具高度显著性。只要u 检验的条

44、件满足,如正态总体 02 已知或是大样本,都可使用该方法, 如某一运动队通过一段时间的训练后成绩是否有所提高,可以进行 u 检验。皮尔逊 x2 检验和卡方检验一样吗?皮尔逊x2 检验是检验实际频数和理论频数是否较为接近,统计学家卡尔?皮尔逊 1900 年提出了如下检验统计量:x2=【(实际频数 -理论频数的) 2】/理论频数 它近似服从自由度为v =组格数估计参数个数 1 的 分布。式中,n 是样本量,理论频数是由样本量乘以由理论分布确定的组格概率计算的。求和项数为组格数目。皮尔逊 统计量的直观意义十分显然:是各组格的实际观测频数与理论期望频数的相对平方偏差的总和,若值充分大,则应认为样本提供

45、了理论分布与统计分布不同的显著证据,即假设的总体分布与总体的实际分布不符,从而应否定所假定的理论分布。所以,应当在 分布密度曲线图的右尾部建立拒绝域。卡方检验有很多种, 跟他们叫卡方检验是因为构造的统计量服从或近似服从卡方分布,然后再根据卡方分布建立检验规则,比如检验正态总体方差的是否为某定值的卡方检验构造的统计量是那样的这个统计量服从 n-1 的卡方分布,所以这个检验也叫卡方检验。t 检验(t test)什么是 t 检验t 检验是用于小样本(样本容量小于30)的两个平均值差异程度的检验方法。它是用 t 分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。t 检验是戈斯特为了观测酿

46、酒质量而发明的。戈斯特在位于都柏林的健力士酿酒厂担任统计学家,基于claude guinness 聘用从牛津大学和剑桥大学出来的最好的毕业生以将生物化学及统计学应用到健力士工业程序的创新政策。戈特特于 1908 年在 biometrika 上公布 t 检验, 但因其老板认为其为商业机密而被迫使用笔名(学生)。实际上,戈斯特的真实身份不只是其它统计学家不知道,连其老板也不知道。t 检验的步骤1、 建立虚无假设 h0: 1= 2, 即先假定两个总体平均数之间没有显著差异;2、计算统计量 t 值,对于不同类型的问题选用不同的统计量计算方法;1)如果要评断一个总体中的小样本平均数与总体平均值之间的差异

47、程度,其统计量 t 值的计算公式为:2)如果要评断两组样本平均数之间的差异程度,其统计量t 值的计算公式为:3、根据自由度 df=n-1,查 t 值表,找出规定的 t 理论值并进行比较。理论值差异的显著水平为0.01 级或 0.05 级。不同自由度的显著水平理论值记为t(df)0.01 和 t(df)0.054、比较计算得到的 t 值和理论 t 值,推断发生的概率,依据下表给出的t值与差异显著性关系表作出判断。t 值与差异显著性关系表tp 值差异显著程度t 0.05 差异非常显著差异显著差异不显著5、根据是以上分析,结合具体情况,作出结论。t 检验举例说明例如,t 检验可用于比较药物治疗组与安

48、慰剂治疗组病人的测量差别。理论上,即使样本量很小时,也可以进行t 检验。(如样本量为10,一些学者声称甚至更小的样本也行),只要每组中变量呈正态分布,两组方差不会明显不同。如上所述,可以通过观察数据的分布或进行正态性检验估计数据的正态假设。方差齐性的假设可进行f 检验,或进行更有效的levenes 检验。如果不满足这些条件,只好使用非参数检验代替t 检验进行两组间均值的比较。t 检验中的 p 值是接受两均值存在差异这个假设可能犯错的概率。在统计学上,当两组观察对象总体中的确不存在差别时,这个概率与我们拒绝了该假设有关。一些学者认为如果差异具有特定的方向性,我们只要考虑单侧概率分布,将所得到 t

49、-检验的 p 值分为两半。另一些学者则认为无论何种情况下都要报告标准的双侧 t 检验概率。1、数据的排列为了进行独立样本t 检验,需要一个自(分组)变量(如性别:男女)与一个因变量(如测量值)。根据自变量的特定值,比较各组中因变量的均值。用t 检验比较下列男、女儿童身高的均值。性别身高对象 1 对象 2 对象 3 对象 4 对象 5男性男性男性女性女性111 110 109 102 104男性身高均数= 110 女性身高均数= 103t 统计量 (t-statistic) 和 t 检验(t-test)是一回事吗?如何不是,它们之间有什么关系?相关,但不是一件事。 t-test 是指用 t-st

50、atistic 来做假设检验(hypothesistesting), 而 t-statistic 是根据 model 计算的, 用来做检验的统计量。正常 t-statistic 应该在 0 假设(null hypothesis) 为真时,服从 t 分布(t-distribution) 。t-test 时根据 t-statistic 值的大小计算 p-value ,决定是接受还是拒绝假设。参数估计和假设估计的区别和联系参数估计 :指的是用样本中的数据估计总体分布的某个或某几个参数,比如给定一定样本容量的样本,要求估计总体的均值、方差等。假设检验 :通过样本分布,检验某个参数的属于某个区间范围的概

51、率。参数估计分两种: 一种是点估计,另一种是区间估计。其中,区间估计与假设检验可以看作同一个问题的不同表述方式。统计学方法包括描述统计和推断统计两种方法,其中,推断统计又包括参数估计和假设检验。1.参数估计就是用样本统计量去估计总体的参数,它的方法有点估计和区间估计两种。点估计是用估计量的某个取值直接作为总体参数的估计值。点估计的缺陷是没法给出估计的可靠性,也没法说出点估计值与总体参数真实值接近的程度。区间估计是在点估计的基础上给出总体参数估计的一个估计区间,该区间通常是由样本统计量加减估计误差得到的。在区间估计中, 由样本估计量构造出的总体参数在一定置信水平下的估计区间称为置信区间。统计学家

52、在某种程度上确信这个区间会包含真正的总体参数。在区间统计中置信度越高,置信区间越大。置信水平为1-a, a 为小概率事件或者不可能事件,常用的置信水平值为99%,95%,90% ,对应的 a 为0.01, 0.05, 0.1置信区间是一个随机区间, 它会因样本的不同而变化, 而且不是所有的区间都包含总体参数。一个总体参数的区间估计需要考虑总体是否为正态分布,总体方差是否已知, 用于估计的样本是大样本还是小样本等(1) 来自正态分布的样本均值, 不论抽取的是大样本还是小样本,均服从正态分布(2) 总体不是正态分布, 大样本的样本均值服从正态分布,小样本的服从 t 分布(3) 不论已判断是正态分布

53、还是t 分布,如果总体方差未知时,都按t 分布来处理(4) t 分布要比标准正态分布平坦,那么要比标准正态分布离散,随着自由度的增大越接近(5) 样本均数服从的正态分布为n(u a2/n)远远小于原变量离散程度n (u a2)2. 假设检验是推断统计的另一项重要内容,它与参数估计类似,但角度不同,参数估计是利用样本信息推断未知的总体参数,而假设检验则是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立。检验的基本思想:先提出假设,然后根据资料的特点,计算相应的统计量,来判断假设是否成立, 如果成立的可能性是一个小概率的话,就拒绝该假设, 因此称小概率的反证法。 最重要的是看能否通

54、过得到的概率去推翻原定的假设,而不是去证实它统计学中假设检验的基本步骤:(1)建立假设,确定检验水准假设有零假设( h0)和备择假设( h1)两个,零假设又叫作无效假设或检验假设。h0 和 h1 的关系是互相对立的,如果拒绝h0,就要接受 h1,根据备择假设不同,假设检验有单、 双侧检验两种。 检验水准用表示,通常取 0.05 或 0.10,检验水准说明了该检验犯第一类错误的概率。(2)根据研究目的和设计类型选择适合的检验方法这里的检验方法,是指参数检验方法,有u 检验、 t 检验和方差分析三种,对应于不同的检验公式。(3)确定 p 值并作出统计结论u 检验得到的是 u 统计量或称 u 值,t

55、 检验得到的是 t 统计量或称 t 值。方差分析得到的是 f 统计量或称 f 值。将求得的统计量绝对值与界值相比,可以确定p值。当0.05 时,u 值要和 u 界值 1.96 相比较,确定 p 值。如果 u1.96,则p0.05.反之,如 u1.96,则 p0.05.t 值要和某自由度的t 界值相比较, 确定p 值。如果 t 值t 界值,故 p0.05.反之,如 tt 界值,则 p0.05。相同自由度的情况下,单侧检验的t 界值要小于双侧检验的t 界值,因此有可能出现算得的 t 值大于单侧 t 界值,而小于双侧 t 界值的情况,即单侧检验显著,双侧检验未必就显著,反之,双侧检验显著,单侧检验必

56、然会显著。即单侧检验更容易出现阳性结论。当p0.05 时,接受零假设,认为差异无统计学意义,或者说二者不存在质的区别。当p0.05 时,拒绝零假设,接受备择假设,认为差异有统计学意义,也可以理解为二者存在质的区别。但即使检验结果是p0.01甚至 p0.001 ,都不说明差异相差很大,只表示更有把握认为二者存在差异。3 参数估计与假设检验之间的联系与区别:(1) 主要联系:a、都是根据样本信息推断总体参数;b、都以抽样分布为理论依据,建立在概率论基础之上的推断;c、二者可相互转换,形成对偶性。(2) 主要区别:a、参数估计是以样本资料估计总体参数的真值,假设检验是以样本资料检验对总体参数的先验假

57、设是否成立;b、区间估计求得的是求以样本估计值为中心的双侧置信区间,假设检验既有双侧检验,也有单侧检验;c、区间估计立足于大概率,假设检验立足于小概率。区间估计:1、单个正态总体均值的区间估计:法 1:打开数据文件: descriotivestatistics explore:dsplay 中选 statistics ,在 dependentlist 中输入所求的变量名statistics 对话框中选择 descriptives ,并在 confidenceinterval for means 中输入数值, 作为置信度 .得统计量描述表中 lower bound 为置信区间的下限 , uppe

58、r bound 为置信区间的上限法 2:利用单个样本 t 检验过程求均值的置信区间comparemeans one_samplet test,在 test variables 中输入所求的变量名,在test value中输入所假设的均值,打开option 对话框中 confidenceinterval 输入置信度 . 2、两个正态总体均值的区间估计:打开数据文件: comparemeans independent_samplet test, 在test variables 中输入所求的变量名,在groupingvariabli 中输入两个正态总体变量名,打开 define groups 对话框

59、,在 group 1 中输入第一个正态总体变量名, group 2 中输入第二个正态总体变量名,打开option 对话框中confidenceinterval 输入置信度 . 得两个独立样本在方差齐和方差不齐两种情况下均值差的置信区间三、假设检验:1、单个正态总体均值的假设检验打开数据文件:comparemeans one_samplet test,在 test variables 中输入所求的变量名,在test value 中输入总体的均值,打开option 对话框中confidenceinterval 输入置信度( 1-a)missing values 中选择缺失值的处理方式:exclud

60、ecases analysis by analysis :在需要分析的数据中剔除含有缺失值的个案excludecases:删除所有数据中含有缺失值的个案数据统计量表中列出:n 变量的数据个数; mean 均值; std.deviation标准离差 ;std.errormean 均值的标准误差 ; 成果表中列出:test vaule 检验值; t t 值;df 自由度; sig.(2_tailed)双尾显著性概率;mean difference均值差;confidenceinterval of mean difference均值差的置信区间 ; 当显著性概率大于a,认为样本的均值与总体的均值没有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论