常用显著性检验.

上传人：简*** IP属地：湖北上传时间：2020-04-13 格式：DOC 页数：48 大小：157KB 积分：9.6 举报 版权申诉

已阅读5页，还剩43页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

常用显著性检验常用显著性检验 1 t 检验适用于计量资料正态分布方差具有齐性的两组间小样本比较包括配对资料间样本与均数间两样本均数间比较三种三者的计算公式不能混淆 2 t 检验应用条件与 t 检验大致相同但 t 检验用于两组间方差不齐时 t 检验的计算公式实际上是方差不齐时 t 检验的校正公式 3 U 检验应用条件与 t 检验基本一致只是当大样本时用 U 检验而小样本时则用 t 检验 t 检验可以代替 U 检验 4 方差分析用于正态分布方差齐性的多组间计量比较常见的有单因素分组的多样本均数比较及双因素分组的多个样本均数的比较方差分析首先是比较各组间总的差异如总差异有显著性再进行组间的两两比较组间比较用 q 检验或 LST 检验等 5 X2检验是计数资料主要的显著性检验方法用于两个或多个百分比率的比较常见以下几种情况四格表资料配对资料多于2行 2列资料及组内分组 X2检验 6 零反应检验用于计数资料是当实验组或对照组中出现概率为0或100 时 X2检验的一种特殊形式属于直接概率计算法 7 符号检验秩和检验和 Ridit 检验三者均属非参数统计方法共同特点是简便快捷实用可用于各种非正态分布的资料未知分布资料及半定量资料的分析其主要缺点是容易丢失数据中包含的信息所以凡是正态分布或可通过数据转换成正态分布者尽量不用这些方法 8 Hotelling 检验用于计量资料正态分布两组间多项指标的综合差异显著性检验计量经济学检验方法讨论计量经济学检验方法讨论计量经济学中的检验方法多种多样而且在不同的假设前提之下使用的检验统计量不同在这里我论述几种比较常见的方法在讨论不同的检验之前我们必须知道为什么要检验到底检验什么如果这个问题都不知道那么我觉得我们很荒谬或者说是很模式化检验的含义是要确实因果关系计量经济学的核心是要说因果关系是怎么样的那么如果两个东西之间没有什么因果联系那么我们寻找的原因就不对那么这样的结果是没有什么意义的或者说是意义不大的那么检验对于我们确认结果非常的重要也是评价我们的结果是否拥有价值的关键因素所以要做统计检验 t 检验 t 检验主要是检验单个 ols 估计值或者说是参数估计值的显著性什么是显著性也就是给定一个容忍程度一个我们可以犯错误的限度错误分为两类 1 本来是错的但是我们认为是对的 2 本来是对的我们认为是错的统计的检验主要是针对第一种错误而言的一般的计量经济学中的这个容忍程度是5 也就是说可以容忍我们范第一类错误的概率是5 这样说不准确但是比较好理解 t stastic 是类似标准正态化的正态分布两一样也就是估计值减去假设值除以估计值得标准差一般假设值是0 这一点不难理解如果是0 那么也就意味着没有因果关系这个 t static 在经典假设之下服从 t 分布 t 分布一般是和正态分布差不多尤其是当样本的量足够大的时候一般的经验认为在样本数量大于120 的时候就可以看成是正态分布的 F statistc F 检验是属于联合检验比较重要的一种主要的目的是用于对于一系列的原因的是否会产生结果这样一个命题做出的检验 F 统计量主要的产生来源是 SSR SST SSE 三个量但是这个检验有一个缺点是必须在经典假设之下才能有效 LM 检验这个检验的性质和 F 检验的性质是一样的都是检验联合显著性的不同的是 F 统计量符合 F 分布但是 LM 统计量服从卡方分布卡方分布是正态分布的变量的平方和而 F 分布是卡方分布的商并且分子和分布必须独立这就是为什么 F 检验适用范围受限的原因 LM n SSR 或者是 LM n SSR 至于其他的 White 检验 Brusch pagan 检验异方差的检验方法还有序列相关的 t 检验 DW 检验基本原来是相同的关于异方差检验序列相关的检验其中存在不同的地方但是思想基本是相同的关于异方差检验的讨论 1 Brusch pagan 检验这个检验的思路比较简单主要是要研究残查和 X 之间的关系给定这样的一个方程 u b0 b1 x1 bn xn u 的回归其中进行 F 检验和 LM 检验如果检验通过那么不存在异方差如果不通过那么存在异方差 2 White 检验这个检验也是对异方差的检验但是这个检验不同的是不仅对于 X 的一次方进行回归而且考虑到残查和 x 的平方还有 Xi Xj 之间的关系给定如下方程 u b0 b1 y b2 y 2 u 也是用 F 和 LM 联合检验来检验显著性如果通过那么不存在异方差否则存在序列相关的检验方法的讨论对于时间序列的问需要知道一个东西也就是一介自回归过程也就是一般在教科书中说到的 AR 1 过程其中的道理主要是说在当期的变量主要是取决于过去一个时期的变量和一个随机误差项表示如下 Ut p U t 1 et 在这里我要说到几个概念问题 I 1 一阶积整 I 0 零阶积整其中的一介自回归过程 AR 1 就属于零阶积整过程而一阶积整过程实际上是随机游动和飘移的随机游动过程随机游动过程 Ut U t 1 et 也就是在 AR 1 的过程之下其中的 P 是等于1的飘移的随机游动过程 Ut a U t 1 et 其中随机游动过程和 AR 1 过程中的不同点在于一个弱相依性的强弱问题实际上我们在时间序列问题中我们可以认为任何一个过程是弱相依的但是问题的关键是我们不知道到底有多弱或者更加直观地说我们想知道 P 到底是多大如果 P 是0 9或者是一个比较接近于1得数那么可能我们可以认为这个时间序列有高度持久性这个概念表示当期的变量却绝于一个很早的时期的变量比如一阶积整过程实际上 et 是一个独立统分布的变量而且条件数学期望等于0 没有异方差性那么实际上这个序列的数学期望是和期数没有什么关系的那么也就意味着从第0期开始 U 的数学期望值就是和很久以后的 U 的数学期望值一样的但是方差就不同了方差随着时间的增加不断扩大我们知道了这种不同的概念就可以讨论在一阶自回归的条件之下的检验问题但是我们说一介自回归的过程是参差序列的特征而已其他的变量的特征问题我们不谈在讨论检验的问题以前我有必要交待一下时间序列在 ols 估计的时候我们应该注意什么实际上解决序列自相关问题最主要的问题就是一个差分的方法因为如果是长期持久的序列或者是不是长期持久的序列那么一定的差分就可以解除这种问题 1 t 检验如果我们知道这个变量是一个一介自回归的过程如果我们知道自回归过程是 AR 1 的那么我们就可以这样作首先我们做 OLS 估计得到的参差序列我们认为是一阶自相关的那么为了验证这种情况那么我们可以做 Ut 和 U t 1 的回归当然这里可以包含一个截距项那么我们验证其中的参数的估计是不是显著的就用 t 检验 t t 检验与检验与 F F 检验有什么区别检验有什么区别 1 检验有单样本 t 检验配对 t 检验和两样本 t 检验单样本 t 检验是用样本均数代表的未知总体均数和已知总体均数进行比较来观察此组样本与总体的差异性配对 t 检验是采用配对设计方法观察以下几种情形 1 两个同质受试对象分别接受两种不同的处理 2 同一受试对象接受两种不同的处理 3 同一受试对象处理前后 F 检验又叫方差齐性检验在两样本 t 检验中要用到 F 检验从两研究总体中随机抽取样本要对这两个样本进行比较的时候首先要判断两总体方差是否相同即方差齐性若两总体方差相等则直接用 t 检验若不等可采用 t 检验或变量变换或秩和检验等方法其中要判断两总体方差是否相等就可以用 F 检验 2 t 检验和方差分析的前提条件及应用误区用于比较均值的 t 检验可以分成三类第一类是针对单组设计定量资料的第二类是针对配对设计定量资料的第三类则是针对成组设计定量资料的后两种设计类型的区别在于事先是否将两组研究对象按照某一个或几个方面的特征相似配成对子无论哪种类型的 t 检验都必须在满足特定的前提条件下应用才是合理的若是单组设计必须给出一个标准值或总体均值同时提供一组定量的观测结果应用 t 检验的前提条件就是该组资料必须服从正态分布若是配对设计每对数据的差值必须服从正态分布若是成组设计个体之间相互独立两组资料均取自正态分布的总体并满足方差齐性之所以需要这些前提条件是因为必须在这样的前提下所计算出的 t 统计量才服从 t 分布而 t 检验正是以 t 分布作为其理论依据的检验方法值得注意的是方差分析与成组设计 t 检验的前提条件是相同的即正态性和方差齐性 t 检验是目前医学研究中使用频率最高医学论文中最常见到的处理定量资料的假设检验方法 t 检验得到如此广泛的应用究其原因不外乎以下几点现有的医学期刊多在统计学方面作出了要求研究结论需要统计学支持传统的医学统计教学都把 t 检验作为假设检验的入门方法进行介绍使之成为广大医学研究人员最熟悉的方法 t 检验方法简单其结果便于解释简单熟悉加上外界的要求促成了 t 检验的流行但是由于某些人对该方法理解得不全面导致在应用过程中出现不少问题有些甚至是非常严重的错误直接影响到结论的可靠性将这些问题归类可大致概括为以下两种情况不考虑 t 检验的应用前提对两组的比较一律用 t 检验将各种实验设计类型一律视为多个单因素两水平设计多次用 t 检验进行均值之间的两两比较以上两种情况均不同程度地增加了得出错误结论的风险而且在实验因素的个数大于等于2时无法研究实验因素之间的交互作用的大小 u u 检验和检验和 t t 检验区别与联系检验区别与联系 u 检验和 t 检验可用于样本均数与总体均数的比较以及两样本均数的比较理论上要求样本来自正态分布总体但在实用时只要样本例数 n 较大或 n 小但总体标准差已知时就可应用 u 检验 n 小且总体标准差未知时可应用 t 检验但要求样本来自正态分布总体两样本均数比较时还要求两总体方差相等一样本均数与总体均数比较比较的目的是推断样本所代表的未知总体均数与已知总体均数 0有无差别通常把理论值标准值或经大量调查所得的稳定值作为 0 根据样本例数 n 大小和总体标准差是否已知选用 u 检验或 t 检验一 u 检验用于已知或未知但 n 足够大用样本标准差 s 作为的估计值代入式 19 6 时以算得的统计量 u 按表19 3所示关系作判断表表19 319 3 u u 值值 P P 值与统计结论值与统计结论 t 值 P 值统计结论 0 05 双侧单侧 1 96 1 645 0 05 不拒绝 H0 差别无统计学意义 0 05 双侧单侧 1 96 1 645 0 05 拒绝 H0 接受 H1 差别有统计学意义 0 01 双侧单侧 2 58 2 33 0 01 拒绝 H0 接受 H1 差别有高度统计学意义例19 3根据大量调查已知健康成年男子脉搏均数为72次分标准差为6 0次分某医生在山区随机抽查25名健康成年男子求得其脉搏均数为74 2次分能否据此认为山区成年男子的脉搏高于一般据题意可把大量调查所得的均数72次分与标准差6 0次分看作为总体均数 0和总体标准差样本均数 x 为74 2次分样本例数 n 为25 H0 0 H1 0 0 05 单侧检验算得的统计量 u 1 833 1 645 P 0 05 按 0 05检验水准拒绝 H0 可认为该山区健康成年男子的脉搏高于一般二 t 检验用于未知且 n 较小时以算得的统计量 t 按表19 4所示关系作判断表表19 419 4 t t 值值 P P 值与统计结论值与统计结论 t 值 P 值统计结论 0 05 t0 05 v 0 05 不拒绝 H0 差别无统计学意义 0 05 t0 05 v 0 05 拒绝 H0 接受 H1 差别有统计学意义 0 01 t0 01 v 0 01 拒绝 H0 接受 H1 差别有高度统计学意义例19 4 若例19 3中总体标准差未知但样本标准差已求出 s 6 5次分余数据同例19 3 据题意与例19 3不同之处在于未知可用 t 检验 H0 0 H1 0 0 05 单侧检验本例自由度 v 25 1 24 查 t 界值表单侧附表19 1 得 t0 05 24 1 711 算得的统计量 t 1 692 1 711 P 0 05 按 0 05检验水准不拒绝 H0 尚不能认为该山区成年男子的脉搏高于一般二配对资料的比较在医学研究中常用配对设计配对设计主要有四种情况同一受试对象处理前后的数据同一受试对象两个部位的数据同一样品用两种方法仪器等检验的结果配对的两个受试对象分别接受两种处理后的数据情况的目的是推断其处理有无作用情况的目的是推断两种处理方法等的结果有无差别公式 19 8 式中 0为差数年总体均数因为假设处理前后或两法无差别则其差数的均数应为0 d 为一组成对数据之差 d 简称差数的均数其计算公式同式 18 1 Sd 为差数均数的标准误 sd 为差数年的标准差计算公式同式 18 3 n 为对子数因计算的统计量是 t 按表19 4所示关系作判断例19 5 应用某药治疗9例高血压病人治疗前后舒张压如表19 5 试问用药前后舒张压有无变化表表19 519 5 高血压病人用某药治疗前后的舒张压高血压病人用某药治疗前后的舒张压 kPakPa 病人编号治疗前治疗后差数 d D2 1 12 8 11 7 1 0 1 21 2 13 1 13 1 0 0 0 00 3 14 9 14 4 0 5 0 25 4 14 4 13 6 0 8 0 64 5 13 6 13 1 0 5 0 25 6 13 1 13 3 0 2 0 04 7 13 3 12 8 0 5 0 25 8 14 1 13 6 0 5 0 25 9 13 3 12 3 1 0 1 00 合计 4 7 3 89 H0 该药治疗前后的舒张压无变化即 d 0 H1 该药治疗前后的舒张压有变化即 d 0 0 05 自由度 v n 1 8 查 t 界值表得 t0 05 8 2 306 t0 01 8 3 355 本例 t 3 714 t0 01 8 P 0 01 按 0 05检验水准拒绝 H0 接受 H1 可认为治疗前后舒张压有变化即该药有降压作用三完全随机设计的两样本均数的比较亦称成组比较目的是推断两样本各自代表的总体均数 1与 2 是否相等根据样本含量 n 的大小分 u 检验与 t 检验一 u 检验可用于两样本含量 n1 n2 均足够大时如均大于50 或100 公式 19 9 算得的统计量为 u 值按表19 3所示关系作出判断例19 6某地抽样调查了部分健康成人红细胞数其中男性360人均数为4 660 1012 L 标准差为0 575 1012 L 女性255人均数为 4 178 1012 L 标准差为0 291 1012 L 试问该地男女红细胞数的均数有无差别 H0 0 H1 0 0 05 今 x1 4 660 1012 L s1 0 575 1012 L n1 360 x2 4 1781012 L s2 0 2911012 L n2 255 算得的 u 13 63 2 58 P 0 01 按 0 05检验水准拒绝 H0 接受 H1 可认为该地男女红细胞数的均数不同男性高于女性二 t 检验可用于两样本含量 n1 n2较小时且要求两总体方差相等即方差齐 homoscedasticity 若被检验的两样本方差相差较大且差别有统计学意义则需用 t 检验公式 19 10 公式 19 11 公式 19 12 式中 sx1 x2 为两样本均数之差的标准误 s2c 为合并估计方差 combined estimate variance 算得的统计量为 t 按表19 4所示关系作出判断例19 7某医生统广西瑶族和侗族正常妇女骨盆 X 线测量资料各50例骨盆入口前后径瑶族的均数为12 002 cm 标准差0 948 cm 侗族相应的为11 456 cm 和1 215 cm 问两族妇女的骨盆入口前后径是否有差别 H0 1 2 H1 1 2 0 05 已知 n1 n2 50 x1 12 002 cm s1 0 948 cm x2 11 456 cm s2 1 215 cm 本例自由度 v n1 n2 2 98 查 t 界值表表内自由度一栏无98 可用内插法从略或用 v 100估计 T0 05 100 1948 t0 01 100 2 626 今 t 2 505 t0 05 1000 P 0 05 按 0 05检验水准拒绝 H0 接受 H1 可认为广西瑶族和侗族妇女骨盆入口前后径不同前者大于后者四完全随机设计的两样本几何均数比较医学上有些资料为等比资料或正态分布资料宜用几何均数表示其平均水平比较两样本几何均数的目的是推断它们分别代表的总体几何均数是否相等此种情况下应先把原始数据 X 进行对数变换用变换后的数据代入式 19 10 19 11 19 12 计算 t 值例19 8 将20名钩端螺旋体病人的血清随机分为两组分别用标准株或水生株作凝溶试验测得稀释倍数如下问两组的平均效价有无差别 X1 标准株 11人 100 200 400 400 400 400 800 1600 1600 1600 3200 X2 水生珠 9人 100 100 100 200 200 200 200 400 400 H0 1 2 H1 1 2 0 05 将两组数据分别取对数以对数作为新变量 X1和 X2 X1 2 000 2 301 2 602 2 602 2 602 2 602 2 903 3 204 3 204 3 204 3 505 X2 2 000 2 000 2 000 2 301 2 301 2 301 2 301 2 602 2 602 用变换后的数据计算 x1 s12 x2 s22再代入式 19 10 19 11 19 12 计算 t 值 x1 2 794 s12 0 2043 x2 2 268 s22 0 0554 自由度 v 11 9 2 18 查 t 界值表得 t0 01 18 2 878 今 t 3 150 2 878 P 0 01 按 0 05检验水准拒绝 H0 接受 H1 可认为两组平均效价不同标准株高于水生株 dda html 方差分析与两样本方差分析与两样本 T T 检验区别检验区别方差分析与两样本 T 检验 1 首先可以看到方差分析 ANOVA 包含两样本 T 检验把两样本 T 检验作为自己的特例因为 ANOVA 可以比较多个总体的均值当然包含两个总体作为特例实际上 T 的平方就是 F 统计量 m 个自由度的 T 分布之平方恰为自由度为 1 m 的 F 分布因此这时候二者检验效果完全相同 T 检验和 ANOVA 检验对于所要求的条件也相同 1 各个组的样本数据内部要相互独立 2 各组皆要正态分布 3 各总体的方差相等上述这3个条件完全相同 2 如果说要指出差别则区别仅在下列一点上用 ANOVA 检验两总体均值相等性时只限于这样的双侧检验问题即 H0 mu1 MU2 Ha mu1 not mu2 而两样本的 T 检验则可以比上述情况更广泛对立假设可以是下面3种中的任何一种 Ha mu1 mu2 Ha mu1 mu2 Ha mu1 not mu2 这样说来两样本均值相等性检验虽然可以用 ANOVA 做但这没有任何好处反而使得对立假设受到限制因而还是 T 检验更好其他表述 t 检验与方差分析主要差异在于 t 检验一般使用在单样本或双样本的检验方差分析用于2个样本以上的总体均值的检验同样双样本也可以使用方差分析多样本也可以使用 t 检验不过 t 检验只能是所有总体两两检验而已两种方法与样本量没有直接关系而是与数据的分布有关系如果数据是正态分布的那不管是小样本或大样本利用莱维林德伯格中心极限定理的原理都是可以用的如果数据非正态分布那只能使用大样本利用李雅普诺夫中心极限定理的原理进行2t 检验此时不能利用方差分析因为方差分析三个条件之一就是正态分布 T T 检验及其与方差分析的区别检验及其与方差分析的区别假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来推断他们相应的总体参数是否相同 t 检验检验 1 单因素设计的小样本 n 50 计量资料 2 样本来自正态分布总体 3 总体标准差未知 4 两样本均数比较时要求两样本相应的总体方差相等根据研究设计 t 检验可由三种形式单个样本的 t 检验配对样本均数 t 检验非独立两样本均数 t 检验两个独立样本均数 t 检验 1 1 单个样本单个样本 t 检验检验又称单样本均数 t 检验 one sample t test 适用于样本均数与已知总体均数 0的比较其比较目的是检验样本均数所代表的总体均数是否与已知总体均数 0有差别已知总体均数 0一般为标准值理论值或经大量观察得到的较稳定的指标值单样 t 检验的应用条件是总体标准 s 未知的小样本资料如 n 50 且服从正态分布 2 2 配对样本均数配对样本均数 t 检验检验配对样本均数 t 检验简称配对 t 检验 paired t test 又称非独立两样本均数 t 检验适用于配对设计计量资料均数的比较其比较目的是检验两相关样本均数所代表的未知总体均数是否有差别配对设计 paired design 是将受试对象按某些重要特征相近的原则配成对子每对中的两个个体随机地给予两种处理应用配对设计可以减少实验的误差和控制非处理因素提高统计处理的效率配对设计处理分配方式主要有三种情况两个同质受试对象分别接受两种处理如把同窝同性别和体重相近的动物配成一对或把同性别和年龄相近的相同病情病人配成一对同一受试对象或同一标本的两个部分随机分配接受两种不同处理如例5 2资料自身对比 self contrast 即将同一受试对象处理实验或治疗前后的结果进行比较如对高血压患者治疗前后运动员体育运动前后的某一生理指标进行比较 3 3 两独立样本两独立样本 t 检验检验两独立样本 t 检验 two independent samples t test 又称成组 t 检验适用于完全随机设计的两样本均数的比较其目的是检验两样本所来自总体的均数是否相等完全随机设计是将受试对象随机地分配到两组中每组对象分别接受不同的处理分析比较处理的效应或分别从不同总体中随机抽样进行研究两独立样本 t 检验要求两样本所代表的总体服从正态分布 N 1 12 和 N 2 22 且两总体方差 12 22相等即方差齐性 homogeneity of variance homoscedasticity 若两总体方差不等即方差不齐可采用 t 检验或进行变量变换或用秩和检验方法处理 t 检验中的注意事项检验中的注意事项 1 假设检验结论正确的前提作假设检验用的样本资料必须能代表相应的总体同时各对比组具有良好的组间均衡性才能得出有意义的统计结论和有价值的专业结论这要求有严密的实验设计和抽样设计如样本是从同质总体中抽取的一个随机样本试验单位在干预前随机分组有足够的样本量等 2 检验方法的选用及其适用条件应根据分析目的研究设计资料类型样本量大小等选用适当的检验方法 t 检验是以正态分布为基础的资料的正态性可用正态性检验方法检验予以判断若资料为非正态分布可采用数据变换的方法尝试将资料变换成正态分布资料后进行分析 3 双侧检验与单侧检验的选择需根据研究目的和专业知识予以选择单侧检验和双侧检验中的 t 值计算过程相同只是 t 界值不同对同一资料作单侧检验更容易获得显著的结果单双侧检验的选择应在统计分析工作开始之前就决定若缺乏这方面的依据一般应选用双侧检验 4 假设检验的结论不能绝对化假设检验统计结论的正确性是以概率作保证的作统计结论时不能绝对化在报告结论时最好列出概率 P 的确切数值或给出 P 值的范围如写成0 02 P 0 05 同时应注明采用的是单侧检验还是双侧检验以便读者与同类研究进行比较当 P 接近临界值时下结论应慎重 5 正确理解 P 值的统计意义 P 是指在无效假设 H0 的总体中进行随机抽样所观察到的等于或大于现有统计量值的概率其推断的基础是小概率事件的原理即概率很小的事件在一次抽样研究中几乎是不可能发生的如发生则拒绝 H0 因此只能说明统计学意义的显著 6 假设检验和可信区间的关系假设检验用以推断总体均数间是否相同而可信区间则用于估计总体均数所在的范围两者既有联系又有区别 T 检验属于均值分析它是用来检验两类母体均值是否相等均值分析是来考察不同样本之间是否存在差异而方差分析则是评估不同样本之间的差异是否由某个因素起主要作用 T T 检验及其与方差分析的区别检验及其与方差分析的区别假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来推断他们相应的总体参数是否相同 t 检验检验 1 单因素设计的小样本 n 50 计量资料 2 样本来自正态分布总体 3 总体标准差未知 4 两样本均数比较时要求两样本相应的总体方差相等根据研究设计 t 检验可由三种形式单个样本的 t 检验配对样本均数 t 检验非独立两样本均数 t 检验两个独立样本均数 t 检验 1 1 单个样本单个样本 t 检验检验又称单样本均数 t 检验 one sample t test 适用于样本均数与已知总体均数 0的比较其比较目的是检验样本均数所代表的总体均数是否与已知总体均数 0有差别已知总体均数 0一般为标准值理论值或经大量观察得到的较稳定的指标值单样 t 检验的应用条件是总体标准 s 未知的小样本资料如 n 50 且服从正态分布 2 2 配对样本均数配对样本均数 t 检验检验配对样本均数 t 检验简称配对 t 检验 paired t test 又称非独立两样本均数 t 检验适用于配对设计计量资料均数的比较其比较目的是检验两相关样本均数所代表的未知总体均数是否有差别配对设计 paired design 是将受试对象按某些重要特征相近的原则配成对子每对中的两个个体随机地给予两种处理应用配对设计可以减少实验的误差和控制非处理因素提高统计处理的效率配对设计处理分配方式主要有三种情况两个同质受试对象分别接受两种处理如把同窝同性别和体重相近的动物配成一对或把同性别和年龄相近的相同病情病人配成一对同一受试对象或同一标本的两个部分随机分配接受两种不同处理如例5 2资料自身对比 self contrast 即将同一受试对象处理实验或治疗前后的结果进行比较如对高血压患者治疗前后运动员体育运动前后的某一生理指标进行比较 3 3 两独立样本两独立样本 t 检验检验两独立样本 t 检验 two independent samples t test 又称成组 t 检验适用于完全随机设计的两样本均数的比较其目的是检验两样本所来自总体的均数是否相等完全随机设计是将受试对象随机地分配到两组中每组对象分别接受不同的处理分析比较处理的效应或分别从不同总体中随机抽样进行研究两独立样本 t 检验要求两样本所代表的总体服从正态分布 N 1 12 和 N 2 22 且两总体方差 12 22相等即方差齐性 homogeneity of variance homoscedasticity 若两总体方差不等即方差不齐可采用 t 检验或进行变量变换或用秩和检验方法处理 t 检验中的注意事项检验中的注意事项 1 假设检验结论正确的前提作假设检验用的样本资料必须能代表相应的总体同时各对比组具有良好的组间均衡性才能得出有意义的统计结论和有价值的专业结论这要求有严密的实验设计和抽样设计如样本是从同质总体中抽取的一个随机样本试验单位在干预前随机分组有足够的样本量等 2 检验方法的选用及其适用条件应根据分析目的研究设计资料类型样本量大小等选用适当的检验方法 t 检验是以正态分布为基础的资料的正态性可用正态性检验方法检验予以判断若资料为非正态分布可采用数据变换的方法尝试将资料变换成正态分布资料后进行分析 3 双侧检验与单侧检验的选择需根据研究目的和专业知识予以选择单侧检验和双侧检验中的 t 值计算过程相同只是 t 界值不同对同一资料作单侧检验更容易获得显著的结果单双侧检验的选择应在统计分析工作开始之前就决定若缺乏这方面的依据一般应选用双侧检验 4 假设检验的结论不能绝对化假设检验统计结论的正确性是以概率作保证的作统计结论时不能绝对化在报告结论时最好列出概率 P 的确切数值或给出 P 值的范围如写成0 02 P 0 05 同时应注明采用的是单侧检验还是双侧检验以便读者与同类研究进行比较当 P 接近临界值时下结论应慎重 5 正确理解 P 值的统计意义 P 是指在无效假设 H0 的总体中进行随机抽样所观察到的等于或大于现有统计量值的概率其推断的基础是小概率事件的原理即概率很小的事件在一次抽样研究中几乎是不可能发生的如发生则拒绝 H0 因此只能说明统计学意义的显著 6 假设检验和可信区间的关系假设检验用以推断总体均数间是否相同而可信区间则用于估计总体均数所在的范围两者既有联系又有区别 T 检验属于均值分析它是用来检验两类母体均值是否相等均值分析是来考察不同样本之间是否存在差异而方差分析则是评估不同样本之间的差异是否由某个因素起主要作用 t t 检验是假设检验的一种常用方法当方差未知时可以用检验是假设检验的一种常用方法当方差未知时可以用来检验一个正态总体或两个正态总体的均值检验假设问题也可以来检验一个正态总体或两个正态总体的均值检验假设问题也可以用来检验成对数据的均值假设问题具体内容可以参考用来检验成对数据的均值假设问题具体内容可以参考概率论与概率论与数理统计数理统计可以用来判断两组数倨差异是否有显著意义也就是结可以用来判断两组数倨差异是否有显著意义也就是结果有没有统计学意义果有没有统计学意义方差分析它是处理实验研究资料时重要的分析方法之一代表方差分析它是处理实验研究资料时重要的分析方法之一代表数据是否具有统计意义数据是否具有统计意义一般一组数据代表某个条件或因素一般一组数据代表某个条件或因素方差分析可以判断你选取的这个方差分析可以判断你选取的这个因素是否有意义因素是否有意义是不是影响因素是不是影响因素如果你做统计为了找到事物相关性如果你做统计为了找到事物相关性而方差结果显示数据无统计学差而方差结果显示数据无统计学差异异很可能代表实验失败或设计有问题很可能代表实验失败或设计有问题在对均值进行假设检验时一般有两种参数检验方法即 t 检验与方差分析 t 检验仅用在单因素两水平设计包括配对设计和成组设计和单组设计给出一组数据和一个标准值的资料的定量资料的均值检验场合而方差分析用在单因素 k 水平设计 k 3 和多因素设计的定量资料的均值检验场合应当进一步说明的是方差分析有十几种不同的方差分析取决于不同的设计类型很多人习惯于用 t 检验取代一切方差分析不能用不能用 t t 检验取代方差分析的情况检验取代方差分析的情况单因素单因素 k k k 3k 3 水平设计时的情形水平设计时的情形为了便于理解举例说明实例研究单味中药对小鼠细胞免疫机能的影响把40只小鼠随机均分为4组每组10只雌雄各半用药15d 后测定 E 玫瑰结成率结果如下试比较各组总体均值之间的差别有无显著性意义对照组 14 10 12 16 13 14 12 10 13 9 党参组 21 24 18 17 22 19 18 23 20 18 黄芪组 24 20 22 18 17 21 18 22 19 23 淫羊藿组 35 27 23 29 31 40 35 30 28 36 处理本例资料通常人们错误的做法是重复运用成组设计资料的 t 检验对4个组的均值进行6次两两比较而正确的做法是先进行单因素4水平设计资料的方差分析若4个总体均值之间的差别有显著性意义再用 q 检验等方法进行多个均值之间的两两比较下面将从多个方面来说明上述两种分析方法之间的差异表1 表1 用 t 检验与方差分析处理实例资料的区别比较的内容比较的内容资料的利用率资料的利用率对原实验设计的影响对原实验设计的影响犯假阳性错误的概犯假阳性错误的概率结论的可靠性率结论的可靠性 t 检验低每次仅用两组残割裂了整体设计大 1 1 0 05 6 0 265 低统计量的自由度小 18 方差分析加 q 检验高每次要用全部数据全与原实验设计相呼应小 0 05 假定 0 05 高统计量的自由度大 36 注注自由度大所对应的统计量的可靠性就高它相当于权重也类似于产生代表的基数基数越大所选出的代表就越具有权威性多因素设计时的情形多因素设计时的情形为了便于理解仍举例说明表2 表2 注射氯化锂或烟碱后不同时间大鼠体温的下降值使用氯化锂与否使用烟碱与否第二次注射后不同时间体温下降值摄氏度 0 7 1 5 3 5 0 0 0 4 0 2 0 5 0 1 0 4 0 3 0 5 0 7 0 5 0 1 0 5 0 1 0 6 0 2 0 5 1 2 0 8 0 1 0 6 0 4 0 5 0 4 0 3 1 7 0 6 0 7 0 6 0 3 0 6 0 1 0 5 显然表2中涉及到的3个实验因素即使用氯化锂与否使用烟碱与否药物在体内作用时间这些因素之间一般都存在不同程度的交互作用应当选用与设计类型本例为具有一个重复测量的三因素设计相对应的方差分析方法然而对于处置复杂的实验设计问题人们常犯的错误是在其一将多因素各水平的不同组合本例中共有16种不同的组合相当于16种不同的实验条件简单地看作单因素的多个水平即视为单因素16水平混淆了因素与水平之间的区别从而错误地确定了实验设计类型其二分析资料时常错误用单因素多水平设计或仍采用多次 t 检验进行两两比较误用这两种方法的后果是不仅无法分析因素之间的交互作用的大小而且由于所选用的数学模型与设计不匹配易得出错误的结论答 t 检验适用于两个变量均数间的差异检验多于两个变量间的均数比较要用方差分析用于比较均值的 t 检验可以分成三类第一类是针对单组设计定量资料的第二类是针对配对设计定量资料的第三类则是针对成组设计定量资料的后两种设计类型的区别在于事先是否将两组研究对象按照某一个或几个方面的特征相似配成对子无论哪种类型的 t 检验都必须在满足特定的前提条件下应用才是合理的若是单组设计必须给出一个标准值或总体均值同时提供一组定量的观测结果应用 t 检验的前提条件就是该组资料必须服从正态分布若是配对设计每对数据的差值必须服从正态分布若是成组设计个体之间相互独立两组资料均取自正态分布的总体并满足方差齐性之所以需要这些前提条件是因为必须在这样的前提下所计算出的 t 统计量才服从 t 分布而 t 检验正是以 t 分布作为其理论依据的检验方法值得注意的是方差分析与成组设计 t 检验的前提条件是相同的即正态性和方差齐性 t 检验是目前医学研究中使用频率最高医学论文中最常见到的处理定量资料的假设检验方法 t 检验得到如此广泛的应用究其原因不外乎以下几点现有的医学期刊多在统计学方面作出了要求研究结论需要统计学支持传统的医学统计教学都把 t 检验作为假设检验的入门方法进行介绍使之成为广大医学研究人员最熟悉的方法 t 检验方法简单其结果便于解释简单熟悉加上外界的要求促成了 t 检验的流行但是由于某些人对该方法理解得不全面导致在应用过程中出现不少问题有些甚至是非常严重的错误直接影响到结论的可靠性将这些问题归类可大致概括为以下两种情况不考虑 t 检验的应用前提对两组的比较一律用 t 检验将各种实验设计类型一律视为多个单因素两水平设计多次用 t 检验进行均值之间的两两比较以上两种情况均不同程度地增加了得出错误结论的风险而且在实验因素的个数大于等于2时无法研究实验因素之间的交互作用的大小 u 检验 u test 以服从 u 分布的统计量检验统计假设的方法均值的检验一个正态总体当 0 0 2 2已知时用检验统计量其中 0 02为已知正态总体的均值与方差 X 为样本平均数 n 为样本含量当总体分布未知但样本含量较大时用检验统计量两个正态总体 H0 1 2 当两个总体方差 12 22已知时用检验统计量当总体分布未知但样本含量较大时用检验统计量总体率的检验适用于大样本一个总体 H0 0用检验统计量两个总体 H0 1 2 用检验统计量其中为两样本率的加权平均数 m1 m2分别为两样本中某事件出现的频数 u 检验的判断结论对给定的显著性水平查正态分布表当 0 05 0 01时临界值分别为 1 96 2 58 当 u 1 96时 P 0 05 不拒绝 H0 差异不具显著性当1 96 u 2 58时 P 0 05 拒绝 H0 差异具显著性当 u 2 58时 P 0 01 拒绝 H0 差异具高度显著性只要 u 检验的条件满足如正态总体 02已知或是大样本都可使用该方法如某一运动队通过一段时间的训练后成绩是否有所提高可以进行 u 检验皮尔逊 x2检验和卡方检验一样吗皮尔逊 x2检验是检验实际频数和理论频数是否较为接近统计学家卡尔皮尔逊1900年提出了如下检验统计量 X 2 实际频数理论频数的 2 理论频数它近似服从自由度为 V 组格数估计参数个数 1 的分布式中 n 是样本量理论频数是由样本量乘以由理论分布确定的组格概率计算的求和项数为组格数目皮尔逊统计量的直观意义十分显然是各组格的实际观测频数与理论期望频数的相对平方偏差的总和若值充分大则应认为样本提供了理论分布与统计分布不同的显著证据即假设的总体分布与总体的实际分布不符从而应否定所假定的理论分布所以应当在分布密度曲线图的右尾部建立拒绝域卡方检验有很多种跟他们叫卡方检验是因为构造的统计量服从或近似服从卡方分布然后再根据卡方分布建立检验规则比如检验正态总体方差的是否为某定值的卡方检验构造的统计量是那样的这个统计量服从 n 1的卡方分布所以这个检验也叫卡方检验 T T 检验检验 T Test 什么是什么是 T T 检验检验 T T 检验检验是用于小样本样本容量小于30 的两个平均值差异程度的检验方法它是用 T 分布理论来推断差异发生的概率从而判定两个平均数的差异是否显著 T 检验是戈斯特为了观测酿酒质量而发明的戈斯特在位于都柏林的健力士酿酒厂担任统计学家基于 Claude Guinness 聘用从牛津大学和剑桥大学出来的最好的毕业生以将生物化学及统计学应用到健力士工业程序的创新政策戈特特于1908年在 Biometrika 上公布 T 检验但因其老板认为其为商业机密而被迫使用笔名学生实际上戈斯特的真实身份不只是其它统计学家不知道连其老板也不知道 T T 检验的步骤检验的步骤 1 建立虚无假设 H0 1 2 即先假定两个总体平均数之间没有显著差异 2 计算统计量 T 值对于不同类型的问题选用不同的统计量计算方法 1 如果要评断一个总体中的小样本平均数与总体平均值之间的差异程度其统计量 T 值的计算公式为 2 如果要评断两组样本平均数之间的差异程度其统计量 T 值的计算公式为 3 根据自由度 df n 1 查 T 值表找出规定的 T 理论值并进行比较理论值差异的显著水平为0 01级或0 05级不同自由度的显著水平理论值记为 T df 0 01和 T df 0 05 4 比较计算得到的 t 值和理论 T 值推断发生的概率依据下表给出的 T 值与差异显著性关系表作出判断 T T 值与差异显著性关值与差异显著性关系表系表 T P 值差异显著程度 T 0 05 差异非常显著差异显著差异不显著 5 根据是以上分析结合具体情况作出结论 T T 检验举例说明检验举例说明例如 T 检验可用于比较药物治疗组与安慰剂治疗组病人的测量差别理论上即使样本量很小时也可以进行 T 检验如样本量为10 一些学者声称甚至更小的样本也行只要每组中变量呈正态分布两组方差不会明显不同如上所述可以通过观察数据的分布或进行正态性检验估计数据的正态假设方差齐性的假设可进行 F 检验或进行更有效的 Levene s 检验如果不满足这些条件只好使用非参数检验代替 T 检验进行两组间均值的比较 T 检验中的 P 值是接受两均值存在差异这个假设可能犯错的概率在统计学上当两组观察对象总体中的确不存在差别时这个概率与我们拒绝了该假设有关一些学者认为如果差异具有特定的方向性我们只要考虑单侧概率分布将所得到 t 检验的 P 值分为两半另一些学者则认为无论何种情况下都要报告标准的双侧 T 检验概率 1 1 数据的排列数据的排列为了进行独立样本 T 检验需要一个自分组变量如性别男女与一个因变量如测量值根据自变量的特定值比较各组中因变量的均值用 T 检验比较下列男女儿童身高的均值性性别别身高身高对男 111 象1 对象 2 对象 3 对象 4 对象 5 性男性男性女性女性 110 109 102 104 男性身高均数 110 女性身高均数 103 T T 统计量统计量 T statistic T statistic 和和 T T 检验检验 T test T test 是一回事吗如何不是一回事吗如何不是

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

常用显著性检验.

文档简介

温馨提示

最新文档

评论

常用显著性检验.

文档简介

温馨提示

最新文档

评论

相关文档