非参数检验PPT课件_第1页
非参数检验PPT课件_第2页
非参数检验PPT课件_第3页
非参数检验PPT课件_第4页
非参数检验PPT课件_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

0,非参数检验,1,非参数检验,2,参数统计(parametric statistics):以样本来自已知分布(如正态分布)的总体为假设基础,对未知总体参数进行估计或检验的方法,如 t 检验、u 检验和方差分析等;非参数统计(nonparametric statistics):总体分布不易确定,或分布呈明显偏态、方差不齐又无适当的变量转换方法以满足参数统计条件。,3,非参数检验(nonparametric test),对总体分布不作严格假定,又称任意分布检验(distribution-free test)。先将变量按照数值由小到大,或等级由弱到强转换成秩后,再计算检验统计量。非参数检验的基础:比较总体分布是否相同,而不是比较总体参数是否相等。特点:假设检验的结果对总体分布的形状差别不敏感,只对总体分布的位置差别敏感。,4,非参数检验的优点与缺点,优点: 适用范围广,不受总体分布的限制; 对数据的要求不严,如某些指标难以准确测定,只能以严重程度、优劣等级、先后次序等表示的资料 也可应用; 方法简便,易于理解和掌握。缺点: 如果对符合参数检验的资料应用非参数检验,因不能充分利用资料提供的信息,会使检验效能低于参数检验;若要使检验效能相同往往需要更大的样本含量。,5,本章主要内容,1 Wilcoxon 符号秩和检验2 Wilcoxon 两样本比较法3 完全随机设计多样本比较的 Kruskal-Wallis 检验4 随机区组设计的Friedman检验,6,第一节 Wilcoxon符号秩和检验,Wilcoxon符号秩和检验(Wilcoxon signed rank sum test)是推断其差值是否来自中位数为零的总体的方法,可用于:配对设计的两样本的比较单一样本与总体中位数的比较,7,一、配对设计的两样本的比较,例7.1 某医院用中草药“抗苯一号”治疗9例苯中毒患者,其治疗前后的白细胞总数如表7-1,问该药是否对患者的白细胞总数有影响?,8,查表法:1建立检验假设,确定检验水准 H0 : Md=0 H1: Md0 = 0.052计算检验统计量T 值(1) 求各对的差值 (2) 编秩 按差值的绝对值由小到大编秩,依差值的正负给秩次冠以正负号。编秩时,若差值为0,舍去不计;若差值的绝对值相等,则取其平均秩次。,配对设计两样本比较,9,(3) 求秩和并确定统计量T 分别求出正、负秩次之和,正秩和以T+表示,负秩和以T-表示,可任取正秩和或负秩和为统计量T。 T+T- = n(n+1)/2,n为不等于0的对子数。 3确定P值,做出推断结论 当n25时,以T值查“附表10 T界值表”(配对设计用),若检验统计量T值在T界值范围内,则P值大于相应的概率水平;若T值在T界值范围外或等于界值,则P值小于或等于相应的概率水平。,配对设计两样本比较,10,Wilcoxon符号秩和检验的基本思想,T分布以均数为中心,均数处频数最多,左右对称,向两侧逐渐减少。当H0 成立时,从总体随机抽取的一个样本,所得T值在均数附近的概率最大,而T值远离均数的概率较小。随着n增大,T分布逐渐逼近正态分布,当n25时,T分布较好地近似正态分布。假定从一总体中,随机抽取 n =5的样本,按上述步骤,可以求出T+、T-。当重复抽取所有可能组合的样本,秩和T+的分布见下表。配对设计符号秩和检验,n必须大于5。,11,12,正态近似法:若n 25,超出附表的范围,用正态近似法作u 检验:若相同秩次较多时(不包括差值为0者),计算校正uc: 其中tj为第j(j = 1,2)组相同秩次的个数。,配对设计两样本比较,13,二、单一样本与总体中位数的比较,例7.2 已知某地正常人尿氟含量的中位数为2.15 mmol/L。今在该地某厂随机抽取12名工人,测得尿氟含量如表。问该厂工人的尿氟含量是否高于当地正常人?,14,1建立检验假设,确定检验水准 H0: M = 2.15 H1: M 2.15 单侧=0.052计算检验统计量 (1) 求差值 差值为各观察值与已知总体中位数之差。 (2) 编秩次 方法同配对设计。 (3) 求秩和并确定统计量 本例T+=62.5,T-=3.5, 取T=3.5。3确定P 值,做出推断结论 本例n =11,T =3.5,查T界值表,得P0.005,按=0.05检验水准,拒绝H0,接受H1,可认为,单一样本与总体中位数比较,15,第二节 成组设计两样本比较的秩和检验,成组设计两样本比较的秩和检验 (Wilcoxon两样本比较法, Wilcoxon two-Sample test),研究目的是推断两样本分别代表的总体分布是否相同。原始数据的两样本比较频数表资料(或等级资料)的两样本比较,16,一、原始数据的两样本比较,例7.3 某医师为研究血铁蛋白与肺炎的关系,随机抽查了10名肺炎患者和16名正常志愿者,测得血铁蛋白(g/L)见表7-3,问肺炎患者与正常人血铁蛋白含量有无差别? 1建立检验假设,确定检验水准 H0: 肺炎患者与正常人的血清铁蛋白总体分布相同 H1: 肺炎患者与正常人的血清铁蛋白总体分布不同 =0.05,成组设计两样本比较的秩和检验,17,18,2计算统计量T 值(1)编秩次 将2组数据由小到大统一编秩。遇有相同数据且不同组时取平均秩次。(2)求秩和并确定统计量T 2组秩次分别相加,其对应的秩和分别为183.5和167.5。若2组例数相等,则任取一组的秩和为统计量;若2组例数不等,以样本例数较小者为n1,其对应的秩和为统计量T。 3确定P值,做出推断结论 以n1、(n2-n1)和检验统计量T 值查“附表11 T界值表”确定 P值:若T 值在界值范围内,则P 值大于相应的概率;若T 值在界值范围外或等于界值,则P 值小于或等于相应概率。 本例0.01P0.02,,成组设计两样本比较的秩和检验原始数据的两样本比较,19,若n1 或n2-n1 超出了附表11 T 界值表的范围,可用正态近似法: 式中N = n1+n2 ,0.5为连续性校正数。若相同秩次较多(如超过25%)时应进行校正, ,其中 tj为第j个相同秩次的个数。,成组设计两样本比较的秩和检验原始数据的两样本比较,正态近似法:,20,二、频数表资料(或等级资料)的两样本比较,例7.4 用某药治疗不同病型的老年慢性支气管炎病人,疗效见表7-4,试比较该药对2种病型的疗效?,21,1建立检验假设,确定检验水准 H0: 两种病型的病人疗效总体分布相同 H1: 两种病型的病人疗效总体分布不同=0.052计算检验统计量(1) 编秩 本例为等级资料,先计算各等级的合计人数,再确定各等级的秩次范围,并计算其平均秩次。(2) 求秩和并检验统计量 以各等级的平均秩次分别乘以两组相应等级的例数,再分别求秩和得到T1、T2。,成组设计两样本比较的秩和检验频数表或等级资料的两样本比较,22,23,本例T1=8780.5,T2=12955.5,n1=82,n2=126,故检验统计量T=8780.5。因n1=82,需用u检验;又因该等级资料的相同秩次过多,需进行校正: 3确定P值,做出推断结论 uc=0.54130.5,按=0.05检验水准,不拒绝H0,尚不能认为该药对两种病型支气管病人的疗效分布不同。,成组设计两样本比较的秩和检验频数表或等级资料的两样本比较,24,基本思想,分别有n1与n2的两个样本,来自同一总体或分布相同的两个总体(即检验假设 H0 成立),则n1样本的秩和T与平均秩和n1(N+1)/2一般相差不大,也就是u;若T与平均秩和n1(N+1)/2相差悬殊,即uu/2,P,则表示抽得现有样本统计量T值得概率很小,因而拒绝检验假设H0。,成组设计两样本比较的秩和检验,25,第三节 成组设计多样本比较的秩和检验,KruskalWallis检验。该法是由Kruskal和Wallis在Wilcoxon 秩和检验的基础上扩展的方法,亦称为K-W检验或H检验。研究目的是推断各样本分别代表的总体分布有无差别。原始数据的比较频数表资料的比较,26,基本思想:,若0成立,第i 组的秩和Ti 的期望与方差分别为:,其检验统计量为:,27,一、原始数据的比较,例7.5 某院外科用3种手术方法治疗肝癌患者15例,每组5例,每例术后生存月数如表7-5。试问3种不同手术方法治疗肝癌的效果有无不同?,28,1建立检验假设,确定检验水准H0:3个总体的分布位置相同H1:3个总体的分布位置不同或不全相同 0.052计算统计量H值(1) 编秩 将各组数据统一由小到大编秩,如遇有相等数值且不在同组者取平均秩次。(2) 求秩和并计算检验统计量 分别将各组秩次相加,得出各组的秩和Ti ;计算H值: Ti为各组的秩和,ni为各组例数,N=ni。,成组设计多样本比较的秩和检验原始数据的比较,29,3确定P 值,做出推断结论 以N =15,n1n2n35查附表12.1 H界值表,得0.01P0.05,按0.05检验水准,拒绝H0,接受H1,可认为3种手术方法术后生存月数不同。 当组数k=2,每组例数ni10;或k=3,ni5时,H分布 近似服从于=k-1的x2分布,查x2界值表,确定P值。 当相同秩次较多时(如超过25%),应计算校正值HC: HC=H/C,式中C=1-(tj3-tj)/(N3-N)。,成组设计多样本比较的秩和检验原始数据的比较,30,二、频数表资料的比较,例7.6 某医院在研究胎盘过早剥离者的出血情况时,将妊娠时间分为早、中、晚3个阶段,用来分析不同妊娠阶段时胎盘过早剥离的失血量,资料见表7-6。问妊娠妇女在不同阶段时胎盘过早剥离的出血量有无差别?,31,1建立检验假设,确定检验水准 H0:3个妊娠阶段胎盘过早剥离时失血量总体分布相同。 H1:3个阶段总体的分布位置不同或不全相同。=0.052计算统计量H (1) 编秩 同“频数表资料的两样本比较”; (2) 求秩和并计算检验统计量 求秩和的方法同“频数表资料的两样本比较”;计算检验统计量 H 值:,成组设计多样本比较的秩和检验频数表资料的比较,32,因相同秩次较多,须进行校正。 3确定 P 值,做出推断结论 因本例组数k =3,=k-1=2,近似服从=2 的x2 分布, 查附表9 x2界值表,得0.10P0.25;按= 0.05检验水准,不拒绝 H0,尚不能认为妊娠妇女在不同阶段时胎盘过早剥离的出血量的差别有统计学意义。,成组设计多样本比较的秩和检验频数表资料的比较,33,三、多个样本间两两比较的秩和检验,当经多样本的H检验拒绝H0时,只能得出各组的总体分布位置不同或不全相同的结论,常需进一步作组间的多重比较,以推断哪两个总体分布不同。可用扩展了的 t 检验,各组例数相等或不相等时均适用。 式中, 、 和nA、nB分别为任2个对比组(A、B)的平均秩和与样本含量, ,k为处理组数,N为各处理组的总例数,H为秩和检验中算得的统计量H值或Hc 值。,34,例7.7 对例7.5资料作两两比较。,成组设计多样本比较的秩和检验多个样本间两两比较,35,1建立检验假设,确定检验水准 H0:3个处理组中任两个总体的分布相同 H1:任2个总体的分布不同 0.052计算统计量 t 值如1组与2组比较3确定P值,做出推断结论 以Nk 和各对比组的t 值,查t 界值表得P 值。,成组设计多样本比较的秩和检验多个样本间两两比较,36,37,第四节 随机区组设计资料的秩和检验,Friedman检验,该法由M. Friedman在符号检验的基础上提出来的,也称M检验。用于配伍组设计资料的比较。各处理组间总的比较多个样本间两两比较的秩和检验。,38,一、原始数据的比较,例7.8 不同种系雌性大白鼠注射不同剂量雌激素后子宫重量(g)如下表,试比较4组雌性大白鼠子宫重量的差别有无统计学意义。,39,1建立检验假设,确定检验水准 H0:3种剂量雌激素注射后子宫重量总体分布相同 H1:3个总体分布不同或不全相同 =0.052计算统计量M 值 (1) 编秩 先将各配伍组内数据由小到大编秩,相同数值者取平均秩次。 (2) 求秩和并计算检验统计量 计算各处理组的秩和Ti ;(3) 计算检验统计量M: , ,k 为处理组数,随机区组设计资料的秩和检验原始数据的比较,40,3确定P值,做出推断结论以处理组数 k 和配伍组数 b 查附表12.2 M 界值表,得出P值。本例,k =3,b = 4,查 M 界值表,M0.05(3,4)=26,M =180.05,按=0.05检验水准不拒绝H0,尚不能认为,随机区组设计资料的秩和检验原始数据的比较,本例,,41,当处理组数 k 或配伍组数 b 超出 M 界值表的范围时,可采用近似 x2 分布法: 式中,k为处理组数,b为配伍组数,Ti为第i个处理组的秩和。 当各区组间相同的秩次较多时,须进行校正: C=1-(tj3-tj)/bk (k2-1)。式中,t 为各区组内第j 个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论