《差异显著性检验》PPT课件.ppt_第1页
《差异显著性检验》PPT课件.ppt_第2页
《差异显著性检验》PPT课件.ppt_第3页
《差异显著性检验》PPT课件.ppt_第4页
《差异显著性检验》PPT课件.ppt_第5页
已阅读5页,还剩130页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

兽医统计学,第五章 差异显著性检验,统计方法,描述统计,推断统计,参数估计,第五章 差异显著性检验,第一节 统计推断的意义和原理,一、统计推断的意义和内容,统计推断(statistical inference):就是根据统计量的分布和概率理论,由样本统计量来推断总体的参数。,统计推断,假设检验(hypothesis test) 参数估计(parametric estimate),第一节 统计推断的意义和原理,统计假设检验又称显著性检验(significance test),它是根据某种实际需要,对未知的或不完全知道的总体参数提出一些假设,然后根据样本的实际结果和统计量的分布规律,通过一定的计算,作出在一定概率意义下应当接受哪种假设的方法。统计假设检验的假设是对总体提出的,由于最后检验的结论只有两种,即与要比较的总体参数间存在显著差异和不存在显著差异两种。,第一节 统计推断的意义和原理,参数估计包括两个方面: 一是参数的点估计(point estimation) 直接用样本的统计量数值估计相应总体的参数; 二是参数的区间估计(interval estimation) 在一定的概率保证下(一般为95%或99%),由样本统计量的分布,计算出总体参数可能出现的数值范围或区间,用该区间来估计总体参数所在位置。,学 习 目 标,了解假设检验的基本思想 掌握假设检验的步骤 能对实际问题作假设检验 利用置信区间进行假设检验 利用P - 值进行假设检验,第一节 假设检验的一般问题,假设检验的概念 假设检验的步骤 假设检验中的小概率原理 假设检验中的两类错误 双侧检验和单侧检验,假设检验的概念与思想,什么是假设?, 对总体参数的一种看法 总体参数包括总体均值、比例、方差等 分析之前必需陈述,我认为该企业生产的零件的平均长度为4厘米!,概念 事先对总体参数或分布形式作出某种假设 然后利用样本信息来判断原假设是否成立 类型 参数假设检验 非参数假设检验 特点 采用逻辑上的反证法 依据统计上的小概率原理,假设检验的概念与思想,假设检验的基本思想,. 因此我们拒绝假设 = 50,样本均值,m,= 50,抽样分布,H0,假设检验的过程 (提出假设抽取样本作出决策),问题的提出 例 :某猪场称该场的猪在体重为100kg时的平均背膘厚度为9mm。 问题:此说法是否正确?有4种可能性(假设) 1)正确: 9 2)不正确: 9(| 9| 0) 3)不正确: 9 三对假设: 9 vs 9, 9 vs 9,假设检验的概念与思想,假设检验的基本原理,如何回答 随机抽取一个样本 计算该样本的平均数 比较样本平均数与9mm 难题 存在抽样误差 当样本平均数与9mm之差达到多大时可否定 9,假设检验的基本原理,解决的思路 针对要回答的问题提出一对对立的假设,并对其中的一个进行检验 找到一个样本统计量,它与提出的假设有关,其抽样分布已知 根据这个统计量观察值出现的概率,利用小概率事件原理对假设是否成立做出推断,这个过程称为假设检验 (hypothesis testing),提出无效假设和备择假设, 什么是无效假设?(Null Hypothesis) 1. 待检验的假设,又称“0假设” 2. 如果错误地作出决策会导致一系列后果 3. 总是有等号, 或 4. 表示为 H0 H0: 某一数值 指定为 = 号,即 或 例如, H0: 3190(克), 什么是备择假设?(Alternative Hypothesis) 1. 与原假设对立的假设 2. 总是有不等号: , 或 3. 表示为 H1 H1: 某一数值,或 某一数值 例如, H1: 3910(克),或 3910(克),提出无效假设和备择假设, 什么检验统计量? 1. 用于假设检验问题的统计量 2. 选择统计量的方法与参数估计相同,需考虑 是大样本还是小样本 总体方差已知还是未知 检验统计量的基本形式为,确定适当的检验统计量,规定显著性水平, 什么显著性水平? 1. 是一个概率值 2. 无效假设为真时,拒绝无效假设的概率 被称为抽样分布的拒绝域 3. 表示为 (alpha) 常用的 值有0.01, 0.05, 0.10 4. 由研究者事先确定,作出统计决策,计算检验的统计量 根据给定的显著性水平,查表得出相应的临界值t或t/2 将检验统计量的值与 水平的临界值进行比较 得出接受或拒绝原假设的结论,假设检验中的小概率原理, 什么小概率? 1. 在一次试验中,一个几乎不可能发生的事件发生的概率 2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设 3. 小概率由研究者事先确定,第一节 统计推断的意义和原理,某猪场10头长白猪和10头大白猪经产母猪的产仔数,能否仅凭这两个平均数的差值 - =1.8头,立即得出长白与大白两品种经产母猪产仔数不同的结论呢?,例,造成这种差异可能有两种原因,一是品种造成的差异,即是长白猪与大白猪本质不同所致,另一可能是试验误差(或抽样误差)。对两个样本进行比较时,必须判断样本间差异是抽样误差造成的,还是本质不同引起的。如何区分两类性质的差异?怎样通过样本来推断总体?这正是显著性检验要解决的问题。,第一节 统计推断的意义和原理,两个总体间的差异如何比较? 一种方法是研究整个总体,即由总体中的所有个体数据计算出总体参数进行比较。这种研究整个总体的方法是很准确的,但常常是不可能进行的,因为总体往往是无限总体,或者是包含个体很多的有限总体。 另一种方法,即研究样本,通过样本研究其所代表的总体。,第一节 统计推断的意义和原理,由于抽样的原因,两样本平均数之差( ),即表面效应,或实得差异中一定包含有抽样误差造成的部分,同时也可能包含有由于处理不同造成的总体平均数不等的部分。,第一节 统计推断的意义和原理,无偏估计:如果一个统计量的抽样分布的均值等于相应的总体参数,此时这个统计量就是此参数的无偏估计值;否则,就是有偏估计值 如果两个统计量的抽样分布有相同的均值,那么方差较小的那个统计量称为此均值的有效估计量,第二节 显著性检验的基本原理,通过试验测定得到的每个观测值 每个观测值决定于: 被测个体所属总体的特征 个体差异和诸多无法控制的随机因素。 所以观测值 可以看作由两部分组成,即,为总体平均数,反映了总体特征,说明样本平均数并非等于总体平均数,它还包含试验误差的成分,第二节 显著性检验的基本原理,第二节 显著性检验的基本原理,上例中两个品种猪的产子数的样本均值分别可表示为:,对 显著性检验:就是分析试验的表面效应 主要由处理效应 引起的 ,还是主要由试验 误差 所造成。,第二节 显著性检验的基本原理,显著性检验的意义,上式表明:试验的表面效应包括处理效应与误差效应。,因此,仅凭样本均值间的表面差异就对总体平均数间的差异作出判断(有差异或者没有差异) 是不可靠的。只有通过显著性检验,才能从作出科学的结论。,第二节 显著性检验的基本原理,虽然处理效应 未知,但试验的表面效应 是可以计算的,借助数理统计方法可以对试验误差 作出估计。所以,可从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在,这就是显著性检验的基本思想。,第二节 显著性检验的基本原理,二、显著性检验的基本步骤,(一) 首先对试验样本所在的总体作假设,(二) 在无效假设成立的前提下,构造并计算合适的统计量,(三) 给定小概率值(风险水分、显著平准),根据自由度查 表获取理论临界值,(四) 依据样本计算得到的统计量与理论临界值的比较, 对相关检验作出判断。,这里假设 或 ,即假设长白猪和大白猪两品种经产母猪产仔数的总体平均数相等,其意义是试验的表面效应: 头是试验误差,处理无效,这种假设称为无效假设, 简记作 : 或,第二节 显著性检验的基本原理,(一) 首先对试验样本所在的总体作假设,第二节 显著性检验的基本原理,(一) 首先对试验样本所在的总体作假设,无效假设是被检验的假设,通过检验可能被接受,也可能被否定 提出无效假设的同时,相应地提出一对应相反假设,称为备择假设,简记 备择假设是在无效假设被否定时准备接受的假设,上面例子的备择假设是 : 即假设长白猪与大白猪两品种经产母猪产仔数的总体平均数不相等或两个均值之差不等于零,亦即存在处理效应,其意义是指试验的表面效应,除包含试验误差外,还含有处理效应在内。,第二节 显著性检验的基本原理,(一) 首先对试验样本所在的总体作假设,或,第二节 显著性检验的基本原理,(二) 在无效假设成立的前提下,构造并计算合适的统计量,计算得到一个 t 统计量:,其中:,均数差异标准误,两样本的含量,第二节 显著性检验的基本原理,(二) 在无效假设成立的前提下,构造并计算合适的统计量,所得的统计量 t 服从自由度 df =(n1-1)+(n2-1)的 t 分布。,根据两个样本的数据,计算得:,第二节 显著性检验的基本原理,(三) 给定小概率值(风险水分、显著平准),根据自由度查 表获取理论临界值,设定风险水平(显著水平) ,其值通常取为0.01与0.05,计算自由度 df,上例中, df =(n1-1)+(n2-1)=9+9=18,查附表X,得两尾临界概率值:,第一节 显著性检验的基本原理,如果: 则接受无效假设 HO,(四) 依据样本计算得到的统计量与理论临界值的比较, 对相关检验作出判断。,如果: 则接受备择假设 HA,如果: 则接受备择假设 HA,两样本均值所代表的总体均值间差异不显著,两样本均值所代表的总体均值间差异显著,两样本均值所代表的总体均值间差异极显著,第二节 显著性检验的基本原理,(四) 依据样本计算得到的统计量与理论临界值的比较, 对相关检验作出判断。,第二节 显著性检验的基本原理,若t0.05 (df) |t| t0.01 (df) ,则说明试验的表面效应属于试验误差的概率P在0.010.05 之间,即0.01 P0.05,表明:表面效应属于试验误差的可能性较小,应否定无效假设,接受备择假设。 统计学上把这一检验结果表述为:“两个总体平均数之间差异显著”,在计算所得的 t 值的右上方标记“*”即t *。,第二节 显著性检验的基本原理,若|t|t0.01,则说明试验的表面效应属于试验误差的概率P不超过0.01,即P 0.01,表面效应属于试验误差的可能性更小 ,应否定无效假设,接受备择假设。 统计学上把这一检验结果表述为:“两个总体平均数之间差异极显著”,在计算所得的t值的右上方标记“* *”即t* *。,第二节 显著性检验的基本原理,前面的实例中,如果: 则接受备择假设 HA,第二节 显著性检验的基本原理,统计推断结果的理解,小概率事件在一次试验中看成是实际上不可能发生的事件,称为小概率事件实际不可能原理。 根据这一原理,当试验的表面效应是试验误差的概率小于0.05时 ,可以认为在一次试验中试验表面效应是试验误差实际上是不可能的,因而否定原先所作的无效假设HO,接受备择假设HA,即认为试验的处理效应是存在的。 当试验的表面效应是试验误差的概率大于0.05时, 则说明 无效假设HO 成立的可能性大 ,不能被否定,因而也就不能接受备择假设HA 。,第二节 显著性检验的基本原理,统计推断结果的理解,综上所述,显著性检验,从提出无效假设与备择假设到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应用所谓“概率性质的反证法”对试验样本所属总体所作的无效假设的统计推断。,第二节 显著性检验的基本原理,三、显著水平与两种类型的错误,在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”。 用来确定否定或接受无效假设的概率标准叫显著 水平,记作。 在生物学研究中常取=0.05 或=0.01。,第二节 显著性检验的基本原理,三、显著水平与两种类型的错误,区间 和 称为水平上的否定域, 区间 则称为水平上的接受域。,第二节 显著性检验的基本原理,实际应用中到底选如何选取显著水平? 应根据试验的要求或试验结论的重要性而定。如果试验中难以控制的因素较多,试验误差可能较大,则显著水平可选低些,即值取大些。反之,如试验耗费较大,对精确度的要求较高,不容许反复,或者试验结论的应用事关重大,则所选显著水平应高些,即值应该小些。 显著水平对假设检验的结论是有直接影响的,所以它应在试验开始前即确定下来。,第二节 显著性检验的基本原理,显著性检验是根据 “小概率事件实际不可能性原理”来否定或接受无效假设的, 所以不论是接受还是否定无效假设,都没有 100% 的把握。也就是说,在检验无效假设时可能犯两类错误,即型错误 和 型错误。,假设检验中的两类错误,1. 第一类错误(弃真错误) 原假设为真时拒绝原假设 会产生一系列后果 第一类错误的概率为 被称为显著性水平 2. 第二类错误(纳伪错误) 原假设为假时接受原假设 第二类错误的概率为 (Beta),第二节 显著性检验的基本原理,型错误也叫第一类错误,是真实情况为H0成立,通过假设检验,却否定了它,犯了“弃真”错误,就是把非真实差异错判为真实差异,即H0为真,却接受了HA 型错误也叫第二类错误,是H0不成立,却接受了它,犯了“纳伪”错误,就是把真实差异错判为非真实差异,即HA为真,却接受了H0,H0: 无罪,假设检验中的两类错误 (决策结果),假设检验就好像一场审判过程,统计检验过程, 错误和 错误的关系, 错误和 错误的关系,接受H0,拒绝H0,第二节 显著性检验的基本原理,基于 “小概率事件实际不可能性原理”来否定H0, 但在一次试验中 小概率事件 并不是绝对不会发生的。如果我们抽得一个样本,它虽然来自与H0 对应的抽样总体,但计算所得的统计量t却落入了否定域中,因而否定了H0,于是犯了型错误。但犯这类错误的概率不会超过a。,第二节 显著性检验的基本原理,型错误值的大小较难确切估计, 它只有与特定的备择假设结合起来才有意义。 一般与显著水平、原总体的标准差、样本含量n、 以及相互比较的两样本所属总体平均数之差大小等因素有关。 在其它因素确定时, 型错误值越小, 型错误值越大;反之, 型错误值越大, 型错误值越小; 样本含量及样本均数差异越大, 型错误与型错误值越小。,第二节 显著性检验的基本原理,由于型错误值的大小与型错误值的大小有关,所以在选用检验的显著水平时应考虑到犯、型错误所产生后果严重性的大小,还应考虑到试验的难易及试验结果的重要程度。,第二节 显著性检验的基本原理,若一个试验耗费大,可靠性要求高,不允许反复,那么型错误值应取小些; 当一个试验结论的使用事关重大,容易产生严重后果,如药物的毒性试验,型错误值亦应取小些; 对于一些试验条件不易控制,试验误差较大的试验,可将型错误值放宽到0.1,甚至放宽到0.25,在上述显著性检验中, 无效假设H0: 备择假设HA: 此时 ,备择假设中包括了 或 两种可能。 这个假设的目的在于判断有无差异, 而不考虑谁大谁小。如比较长白猪与大白猪两品种猪经产母猪的产仔数,长白猪可能高于大白猪, 也可能低于大白猪。,第二节 显著性检验的基本原理,四、双侧检验与单侧检验,第二节 显著性检验的基本原理,四、双侧检验与单侧检验,在水平上否定域为 和 ,对称地分配在 t分布曲线的两侧尾部,每侧的概率为/2,这种利用两尾概率进行的检验叫双侧检验,也叫双尾检验。,第二节 显著性检验的基本原理,H0的否定域在t分布曲线的右尾。在水平上否定域为 ,右侧的概率为,这种利用一尾概率进行的检验叫单侧检验,也叫单尾检验,双侧检验显著,单侧检验一定显著;但单侧检验显著,双侧检验未必显著,第二节 显著性检验的基本原理,显著性水平与拒绝域,第二节 显著性检验的基本原理,在有些情况下, 双侧检验不一定符合实际情况。 如采用某种新的配套技术措施以期提高鸡的产蛋量,已知此种配套技术的实施不会降低产蛋量。此时,若进行新技术与常规技术的比较试验,则无效假设应为 ,即假设新技术与常规技术产蛋量是相同的 ,备择假设应为 ,即新配套技术的实施使产蛋量有所提高。,第二节 显著性检验的基本原理,显著性水平与拒绝域,第二节 显著性检验的基本原理,显著性水平与拒绝域,第二节 显著性检验的基本原理,五、显著性检验中应注意的问题,(一)、为了保证试验结果的可靠及正确,要有严密合理的试验或抽样设计,保证各样本是从相应同质总体中随机抽取的。并且处理间要有可比性,即除比较的处理外,其它影响因素应尽可能控制相同或基本相近。否则,任何显著性检验的方法都不能保证结果的正确。,第二节 显著性检验的基本原理,五、显著性检验中应注意的问题,(二)、选用的显著性检验方法应符合其应用条件 。上面我们所举的例子属于“非配对设计两样本平均数差异显著性检验” 。由于研究变量的类型、问题的性质、条件、试验设计方法、样本大小等的不同,所用的显著性检验方法也不同,因而在选用检验方法时 , 应认真考虑其适用条件,不能滥用。,第二节 显著性检验的基本原理,五、显著性检验中应注意的问题,(三)、要正确理解差异显著或极显著的统计意义。显著性检验结论中的“差异显著”或“差异极显著”不应该误解为相差很大或非常大,也不能认为在专业上一定就有重要或很重要的价值。“显著”或“极显著”是指表面上如此差别的不同样本来自同一总体的可能性小于0.05或0.01,已达到了可以认为它们有实质性差异的显著水平。有些试验结果虽然差别大,但由于试验误差大,也许还不能得出“差异显著”的结论,而有些试验的结果间的差异虽小,但由于试验误差小,反而可能推断为“差异显著”。,第二节 显著性检验的基本原理,五、显著性检验中应注意的问题,显著水平的高低只表示下结论的可靠程度的高低,即在 0.01 水平下否定无效假设的可靠程度为99,而在 0.05水平下否定无效假设的可靠程度为95%。,第二节 显著性检验的基本原理,五、显著性检验中应注意的问题,“差异不显著”是指表面上的这种差异在同一总体中出现的可能性大于统计上公认的概率水平0.05,不能理解为试验结果间没有差异。 “差异不显著” 客观上存在两种可能: 一是本质上有差异,但被试验误差所掩盖,表现不出差异的显著性来。如果减小试验误差或增大样本含量,则可能表现出差异显著性; 二是可能确无本质上差异。显著性检验只是用来确定无效假设能否被推翻,而不能证明无效假设是正确的。,第二节 显著性检验的基本原理,五、显著性检验中应注意的问题,(四)合理建立统计假设 ,正确计算检验统计量。,第二节 显著性检验的基本原理,五、显著性检验中应注意的问题,(五)、结论不能绝对化。经过显著性检验最终是否 否定无效假设 则由被研究事物有无本质差异、 试验误差的大小及选用显著水平的高低决定的。 同样一种试验,试验本身差异程度的不同,样本含量大小的不同,显著水平高低的不同,统计推断的结论可能不同。 否定 H0时可能犯型错误,接受H0时可能犯型错误。尤其在P 接近时,下结论应慎重, 有时应用重复试验来证明。总之,具有实用意义的结论要从多方面综合考虑,不能单纯依靠统计结论。,第二节 显著性检验的基本原理,五、显著性检验中应注意的问题,此外,报告结论时应列出,由样本算得的检验统计量值(如 t 值),注明是单侧检验还是双侧检验,并写出 P 值的确切范围,如 0.01P0.05,以便读者结合有关资料进行对比分析。,第三节 样本平均数与总体平均数差异显著性检验,在实际工作中我们往往需要检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本是否来自某一总体。已知的总体平均数一般为一些公认的理论数值、经验数值或期望数值,如畜禽正常生理指标、怀孕期、家禽出雏日龄以及生产性能指标等,都可以用样本平均数与之比较,检验差异显著性。,检验的基本步骤是:,第一步: 提出无效假设与备择假设设 , 第二步:计算t统计量值,计算公式为: 第三步:给出显著平准,并根据自由度查临界t值, 第四步:作出统计推断,第三节 样本平均数与总体平均数差异显著性检验,第三节 样本平均数与总体平均数差异显著性检验,实例 母猪的怀孕期为114天,今抽测10头母猪的怀孕期分别为 116、 115、113、 112、 114、 117、 115、 116、 114、 113(天),试检验所得样本平均数与总体平均数114天有无显著差异? 根据题意,本例应进行双侧t检验。,第三节 样本平均数与总体平均数差异显著性检验,第一步:提出无效假设与备择假设,即无效假设认为样本所在总体与已知总体间没有差异,备择假设认为样本所在总体与已知总体间没有差异。如果用 表示样本所在总体的均值。用 表示已知总体的均值,在无效假设与备择假设可以简单表示为:,第三节 样本平均数与总体平均数差异显著性检验,第二步,计算t值 经计算得:,第三节 样本平均数与总体平均数差异显著性检验,第三步,给出显著平准,自由度,查表得到理论临界值 给出显著平准 0.05 与 0.01 本题的自由度为 df=n-1=10-1=9,第三节 样本平均数与总体平均数差异显著性检验,第四步,对样本统计量值与理论临界值进行比较,如果: 则接受无效假设 HO,t=1.000t0.05(9),样本所在总体与已知总体间没有差异,第三节 单个平均数的假设检验,犊牛和成年母牛间血液中总蛋白含量无显著差异;,犊牛和成年母牛间血液中总蛋白含量存在显著差异。,vs,统计假设检验否定 ,接受 ,可以得出结论:犊牛和成年母牛间血液中总蛋白含量存在极显著差异。,第三节 单个平均数的假设检验,二、总体方差未知时单个平均数的假设检验 当总体方差 未知时,应用t分布计算实得差异由抽样误差造成的概率。 【例4-2】 某屠宰场收购了一批商品猪,一位有经验的收购人员估计这批猪的平均体重为100 kg,现随机抽测10头猪进行称重,得体重数据如下:115,98,105,95,90,110,104,108,92,118(kg),试检验此收购人员的估计是否正确?,第三节 单个平均数的假设检验,本例总体方差 未知,且样本很小,用t 检验。,vs,接受 ,该收购人员的估计基本正确。,第三节 单个平均数的假设检验,【例4-3】正常情况下成年男子的脉搏数为72次/min,现随机检查25名慢性胃炎所至脾虚男病人的平均脉搏数为75.2次/min,标准差为6.54次/min,问此类脾虚男病人脉搏数是否显著地高于正常情况下测定的成年男子脉搏数?,第三节 单个平均数的假设检验,否定,即此类脾虚男病人的脉搏数已属异常。,第三节 单个平均数的假设检验,第四节 成组资料的两个平均数的假设检验,该类型的比较其实质是检验两独立样本所属总体平均数间是否存在显著差异。即检验第一个样本的平均值 和其总体平均值 与第二个样本的平均值 和其总体平均值 间差异是否显著。它经常用于生物学研究中比较两种不同处理其效应的差异显著性。,一、总体方查已知时两平均值 u 检验,当两样本所属总体方差 和 为已知,或 和 虽未知,但两样本均为大样本时,平均数差数的分布呈正态分布,因而可采用u 检验法检验两组平均值的差异显著性。适用条件分别如下:,当 和 已知时,u 检验的u值计算如下:,第四节 成组资料的两个平均数的假设检验,当 和 未知,但 、 均较大时, 可以用 、 近似代替 和 ,计算 ,来代替,因为统计假设检验均是在假设 成立的前提下进行的,故u值计算公式可简化成:,第四节 成组资料的两个平均数的假设检验,【例4-4】发酵法生产兽用青霉素的两个工厂,其产品收率的方差分别为 、 ,测得甲工厂25个数据, g/L,乙工厂30个数据, g/L。问这两个工厂兽用青霉素的收率是否有显著差异?,接受 。,实得差异由抽样误差造成,应认为两工厂兽用青霉素的收率无显著差异。,第四节 成组资料的两个平均数的假设检验,【例4-5】测定了31头犊牛和48头成年母牛血液中血糖的含量,得犊牛的平均血糖含量为81.23,标准差为15.64。成年母牛的平均血糖含量为70.43,标准差为12.07。犊牛和成年母牛间血糖含量有无显著差异?,否定 ,接受 。犊牛和成年母牛血液中血糖含量存在极显著差异。,第四节 成组资料的两个平均数的假设检验,二、方差未知但相等( )时两平均数的t 检验,在实际研究中u检验的情况较少见,一般情况是总体方差 和 未知。当两样本所属总体虽未知但方差相等 ,且两样本为小样本时,两样本平均值差异显著性检验可用t检验法。,当两样本容量均较小时,应将要比较的两样本合并,增大样本容量,以增加对总体变异程度(误差)估计的准确性,从而增加估计 的准确性。合并的前提是 成立,即两独立随机样本来自同一个总体 。,第四节 成组资料的两个平均数的假设检验,两样本合并后计算得到的方差叫合并均方,用 表示。它是用两个样本的方差 和 以各自的自由度为权计算得到的两均方的加权平均值。计算公式如下:,由以上公式可知,合并均方的分子、分母仍然是平方和与自由度,其分子是两样本离均差平方和之和,分母是自由度之和。这一原则适用于多个样本的合并。,第四节 成组资料的两个平均数的假设检验,样本平均值差数标准误计算公式 中,用估计总体方差准确性更高的合并均方 替代 和,第四节 成组资料的两个平均数的假设检验,t检验t值计算公式如下:,t 分布的自由度:,第四节 成组资料的两个平均数的假设检验,【例4-6】 研究两种不同中药添加剂饲料对香猪生长的影响,随机选择了12头香猪并随机分成两组,一组喂甲种饲料,另一组喂乙种饲料。饲养6周后增重(kg)结果如下:甲种饲料:6.65,6.35,7.05,7.90,8.04,4.45;乙种饲料:5.34,7.00,7.89,7.05,6.74,7.28。设两样本所属总体服从正态分布,且方差相等,试比较两种不同饲料对香猪生长的影响是否有显著差异。,本例总体方差未知,但 ,两样本含量相等且均较小,用合并均方计算t 值。,第四节 成组资料的两个平均数的假设检验,,接受 。,两种不同的饲料对香猪生长的影响无显著差异。,第四节 成组资料的两个平均数的假设检验,【例4-7】 测定金华猪与长白猪肌内脂肪含量(%),金华猪共10头,平均值为3.93,标准差为0.4;长白猪4头,其平均值为2.56,标准差为0.4。试检验两品种猪的肌内脂肪含量是否存在显著差异。,=,第四节 成组资料的两个平均数的假设检验,根据 查t的临界值,得,两品种猪的肌内脂肪含量存在极显著差异。,第四节 成组资料的两个平均数的假设检验,三、两总体方差不齐( )时两平均值的t 检验,1总体方差齐性检验 两样本平均值的t检验主要适用于小样本,且总体方差同质的资料,当两样本所属总体方差不相等时,其平均值的显著性检验方法和上述方法有所不同。抽自正态总体的两独立样本的方差 和 的比率服从F分布,所以两样本所属总体方差是否有显著差异用F检验。 检验步骤如下:,第四节 成组资料的两个平均数的假设检验,( 的自由度为 , 的自由度为 ),这里 为较大的样本均方, 为较小的样本均方,因此,F值是大均方为分子,小均方为分母,F 值恒大于1。,推断:查附表得 ,如 ,则否定 ,接受 ,即 。,方差不齐时,两样本平均数比较是一种近似检验,一般只有 在显著水平 上被否定时才采用。另外在试验设计时,尽量使 ,这样可减少误差。,第四节 成组资料的两个平均数的假设检验,2两总体方差不齐时两平均值差异显著性检验,第四节 成组资料的两个平均数的假设检验,式中 是 的 值, 是 的 值。若 ,则否定 ;否则接受 。由于 的取值在 间,故只有在实得 值在 之间时才需要计算 。,第四节 成组资料的两个平均数的假设检验,【例4-8】 某猪场随机抽测了甲、乙两品种猪血液中白细胞的密度,测得甲品种13头猪白细胞数的平均值为10.73103/mm3,标准差为1.28103/mm3,乙品种15头猪白细胞数的平均值为16.40103/mm3,标准差为3.44103/mm3。两品种猪的白细胞数是否有显著的差异。,第四节 成组资料的两个平均数的假设检验,因两品种方差悬殊,甲品种为 ,乙品种为 ,故先进行方差齐性检验. 方法如下:,,由于 ,故否定 接受 ,即两样本所属总体方差存在极显著差异。,第四节 成组资料的两个平均数的假设检验,因为本例 ,故用Cochran-cox检验法,在 时,查t临界值表得 ,t检验的临界值为:,第四节 成组资料的两个平均数的假设检验,=2.1497,, ,故否定 ,接受 。两品种猪的白细胞数有显著差异。,第四节 成组资料的两个平均数的假设检验,第五节 配对资料两平均值检验,两个样本所属总体均值的统计假设检验叫成组比较,要求两个样本是相互独立的,或者说样本是完全随机分组后随机施加处理得到的,它只适用于试验单元(一般为试验动物个体)较为一致的情况。由于试验单元相对一致,误差小,误差估计准确,所以容易鉴别处理效应。但如果试验单元变异较大,如试验动物的年龄、性别、体重等相差较大,若仍采用上述设计方法,就可能增大试验误差的估计值,从而夸大或缩小了试验处理的效应。为了排除试验单元的不一致对试验结果的影响,准确地估计试验处理效应,降低试验误差,提高试验的准确性和精确度,应采用配对试验设计。,一、配对试验设计的设计方法 配对试验设计,是先将试验条件尽可能相同的试验单元配成一对,然后将每一个对内的两个试验单元独立随机地接受两个处理中的一种。 配对设计的要求是: 配成对子的两个试验单元的初始条件应尽可能一致; 不同试验对间的初始条件允许存在差异 每一对就是试验的一次重复。这种将试验单元配成对的方式就叫配对试验设计。 配对的目的是为了把同一重复内二个试验单位的初始条件的差异减至最低限度,使试验处理效应不致被试验单位间的差异所掩盖。,第五节 配对资料两平均值检验,配对的方式有以下几种: 1同源配对 可以将同窝或有一定亲缘关系的同性别、体重接近的两头动物配成一对,若干对这样的动物组成的配对叫同源配对,又称亲缘配对。 2条件配对 实际工作中,如达不到亲缘配对要求,也可将具有相近条件的试验单位配成对,若干对这样的动物组成的配对叫条件配对。如动物可按同种属、同性别、同年龄、同体重进行配对。 3自身配对 自身配对是指同一试验单位接受试验处理前后的两次测定值构成的配对;也可以是同一个动物个体对称的两个器官、组织、部位等构成的配对;同一份样品分成两半,一份接受一种处理,另一份接受另一种处理构成的配对。,第五节 配对资料两平均值检验,二、配对设计资料的假设检验 配对数据统计假设检验方法为取每对测定值的差为统计对象,即由每一配对数据差组成的单个样本所属总体的均值是否为0的统计假设检验。即:,令, , 。然后对 作单个总体均值检验,检验的 为 。,表4-1 成 对 比 较 数 据 模 式,第五节 配对资料两平均值检验,差数平均数的标准误为:,我们的任务是判定 是由抽样误差造成的,还是由两个不同处理的效应差异造成的。如果是由抽样误差造成的,则 成立,处理间无显著差异,如果不是由抽样误差造成,则处理间的确存在效应差别,此时 成立。由于 的分布在 总体方差未知时服从t分布,故可以采用 条件下的t检验考察 是否成立。因此,t 值计算如下:,第五节 配对资料两平均值检验,此t服从自由度为 的t分布。,【例4-9】 在研究日粮 含量与肝中 储量的关系时,随机选择8窝试验用小白鼠,每窝选择性别、体重相近的两只小白鼠进行配对,每对小白鼠中的一只随机接受正常饲料,另一只接受 缺乏饲料。经过一段时间后,测定小白鼠肝中 的储量,结果如下表,试检验不同 含量的日粮对肝中 的储量是否有显著的影响。,第五节 配对资料两平均值检验,表4-2 不同VE含量的饲料肝小白鼠中VA含量(IUg-1),本例是配对试验资料,根据专业知识我们并不知道 正常供给与否是增加还是减少肝中 的储量,故应用两尾检验。,第五节 配对资料两平均值检验,说明两种不同日粮对试验动物肝中 的储量存在极显著差异。用正常日粮饲养的小白鼠肝中的 含量极显著地高于 缺乏日粮小白鼠肝中的 含量。,第五节 配对资料两平均值检验,第六节 率的假设检验,一、率的抽样误差 在实际工作中,我们所得到的率一般都是样本率,如死亡率、治愈率、阳性率等,而样本率与总体率间总存在着一定的差异。这种差异我们称之为抽样误差。率的抽样误差一般用率的标准误来表示,即:,p为率的标准误,p为总体率,n为样本容量,对率进行抽样,其研究的目的是希望用样本率 来估计总体率 ,从而对于样本所在总体的情况作出推断,而总体率一般为未知。因此,可用样本率 来代替总体率 ,从而计算出率的标准误 的估计值 ,即:,其中: 为样本率的标准误, 为样本率,n为样本含量, 。,率的标准误大小 说明了用样本率估计总体率的准确性的好坏。,第六节 率的假设检验,二、率的假设检验 率服从二项分布,当试验次数n 较大时,二项分布接近正态分布,所以可以将服从二项分布的百分率资料近似地用正态分布来处理,即采用u 检验,即 时的t检验。适于u 检验所需的二项分布样本容量 与 值见表4-3。,表4-3 适于u检验的二项分布的n与np值,第六节 率的假设检验,1样本率与总体率的比较 验证某个样本率与一个已知的总体率间是否存在差异,即这个样本率是否来自这一总体。 采用的公式为:,【例4-10】 某地乳牛的隐性乳房炎患病率为 ,该地某牛场对560头乳牛进行检测,其中148头牛检测结果为阳性,问该牛场的隐性乳房炎是否与该地平均患病率相同。,第六节 率的假设检验,仅需比较该牛场与本地的平均患病率间有无差异。因此:,接受 。即该牛场的乳牛隐性乳房炎患病率与该地的平均患病率间无显著差异。,第六节 率的假设检验,2两个样本率的比较 设有两个样本,一个样本率为 ,事件总次数为 ,另一个样本率为 ,事件总次数为 ,我们希望知道这两个样本所来自的总体率间有否差异,也可以这样理解,这两个样本率是否来自同一个总体率。,假设这两个样本各自的总体率分别为 和 。则这两个样本率差的标准误为:,式中 分别为两个样本的总次数。,第六节 率的假设检验,当两总体率相等,即 时,上式可写为:,这是在两总体率已知的情况下两样本率差的标准误,在很多情况下,总体率为未知,这时我们可以假设两样本率所在的两总体率相等,即 。则可以用两样本率的加权平均率 来估计两总体率。即 :,称为样本合并百分率。,第六节 率的假设检验,此时两样本率差的标准误为:,在假设 的情况下:,N(0,1),在两样本 与 很大时,可用u 检验来检验两样本所在总体率的差异。,第六节 率的假设检验,【例4-11】 检验鸡痢疾菌苗对鸡白痢的免疫效果。试验组接种了345羽鸡,结果有51羽发生鸡白痢,对照组(未注射鸡痢疾菌苗组)420羽鸡有79羽发生了鸡白痢。问痢疾菌苗对鸡白痢是否有免疫效果?,由于本例样本较大,因此用u检验,计算u值。,免疫组鸡发生鸡白痢的发病率为:,未接种痢疾菌苗的对照组发病率为:,第六节 率的假设检验,两样本合并发病率为:,接受 。即用痢疾菌苗免疫鸡白痢,其免疫效果与对照组无显著差异。我们有95%的把握认为痢疾菌苗对鸡白痢无显著免疫效果。,第六节 率的假设检验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论