版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、学习(xux)目标 了解非参检验的优缺点及应用范围;了解非参检验的优缺点及应用范围; 熟息非参数检验几种基本类型和检验的基本方法;熟息非参数检验几种基本类型和检验的基本方法; 掌握编秩基本步骤掌握编秩基本步骤(bzhu)(bzhu),平均秩的计算及相等秩的校正。,平均秩的计算及相等秩的校正。 配对及单样本秩和检验;配对及单样本秩和检验; 两组样本比较的秩和检验;两组样本比较的秩和检验; 多组样本比较的秩和检验及两两比较;多组样本比较的秩和检验及两两比较; 等级分组资料的非参数检验;等级分组资料的非参数检验; 随机区组设计资料比较的秩和检验及两两比较。随机区组设计资料比较的秩和检验及两两比较。第
2、1页/共71页第一页,共72页。概述(i sh) 比较两个总体间的差异,我们比较熟悉的是可依据总体方差是否已知,比较两个总体间的差异,我们比较熟悉的是可依据总体方差是否已知,选择使用正态选择使用正态Z Z检验或检验或t t检验法。但如果有明显的证据表明,这些参数检验法。但如果有明显的证据表明,这些参数型检验法不能使用时又该如何呢?非参数检验法对此提供了解决方案。型检验法不能使用时又该如何呢?非参数检验法对此提供了解决方案。 作为参数检验的一种推广,非参数检验有何特点?它的使用有什么样作为参数检验的一种推广,非参数检验有何特点?它的使用有什么样的要求?本章首先对非参数检验进行概述,接着按照和参数
3、检验对应的要求?本章首先对非参数检验进行概述,接着按照和参数检验对应的原则分别的原则分别(fnbi)(fnbi)介绍用于两组比较的非参数检验法、用于多组比介绍用于两组比较的非参数检验法、用于多组比较的非参数检验法以及等级相关检验(秩相关)。较的非参数检验法以及等级相关检验(秩相关)。 第2页/共71页第二页,共72页。概述(i sh) 参数检验是在已知总体分布的条件下(一般要求总体服从正态分布)参数检验是在已知总体分布的条件下(一般要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验,有时还要求某些总体
4、参数满足一定条件。如独立样本的检验和验,有时还要求某些总体参数满足一定条件。如独立样本的检验和方差分析不仅要求总体符合方差分析不仅要求总体符合(fh)(fh)正态分布,还要求各总体方差齐性。正态分布,还要求各总体方差齐性。 非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一般性假设(如总体分布的位置是否相同,总体而是针对总体的某些一般性假设(如总体分布的位置是否相同,总体分布是否正态)进行检验。分布是否正态)进行检验。第3页/共71页第三页,共72页。概述(i sh) 非参数检验方法简便,不依赖于总体分布
5、的具体形式因而适用性强,但灵敏度和精非参数检验方法简便,不依赖于总体分布的具体形式因而适用性强,但灵敏度和精确度不如参数检验。一般而言,非参数检验适用于以下三种情况:顺序类型的数确度不如参数检验。一般而言,非参数检验适用于以下三种情况:顺序类型的数据资料,这类数据的分布形态一般是未知的;虽然是连续数据,但总体分布形态据资料,这类数据的分布形态一般是未知的;虽然是连续数据,但总体分布形态未知或者非正态,这和卡方检验一样,称自由分布检验;总体分布虽然正态,数未知或者非正态,这和卡方检验一样,称自由分布检验;总体分布虽然正态,数据也是连续类型,但样本容量极小,如据也是连续类型,但样本容量极小,如10
6、10以下(虽然检验被称为小样本统计方以下(虽然检验被称为小样本统计方法,但样本容量太小时,代表性毕竟很差,最好不要用要求较严格的参数检验法)。法,但样本容量太小时,代表性毕竟很差,最好不要用要求较严格的参数检验法)。因为这些特点,加上非参数检验法一般原理和计算比较简单,因此常用于一些为正因为这些特点,加上非参数检验法一般原理和计算比较简单,因此常用于一些为正式研究进行探路的预备性研究的数据统计中。当然式研究进行探路的预备性研究的数据统计中。当然(dngrn)(dngrn),由于非参数检验许,由于非参数检验许多牵涉不到参数计算,对数据中的信息利用不够,因而其统计检验力相对参数检验多牵涉不到参数计
7、算,对数据中的信息利用不够,因而其统计检验力相对参数检验也差得多。也差得多。第4页/共71页第四页,共72页。单组资料(zlio)的符号及符号秩和检验 单样本资料与已知总体符号秩和检验的检验步骤如下:单样本资料与已知总体符号秩和检验的检验步骤如下: 求差值:求样本资料中单个个体数据与总体中位数的差值。求差值:求样本资料中单个个体数据与总体中位数的差值。 检验假设检验假设 H0H0:差值的总体中位数等于零,即:差值的总体中位数等于零,即 H1H1:差值的总体中位数不等于零,即:差值的总体中位数不等于零,即 编秩按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号。编秩时,编秩按差值的绝对值
8、由小到大编秩,并按差值的正负给秩次加上正负号。编秩时,若差值为若差值为0 0,舍去不计;若差值的绝对值相等,这时取平均秩次。,舍去不计;若差值的绝对值相等,这时取平均秩次。 求秩和,并确定统计量求秩和,并确定统计量T T将所排的秩次冠以原差数的符号,分别将所排的秩次冠以原差数的符号,分别(fnbi)(fnbi)求出正、求出正、负差值秩次之和,分别负差值秩次之和,分别(fnbi)(fnbi)以以T+T+和和 T- T-表示。表示。0dM0dM第5页/共71页第五页,共72页。单组资料(zlio)的符号及符号秩和检验编秩按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号。编秩时,若差值为编
9、秩按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号。编秩时,若差值为0 0,舍去不,舍去不计;若差值的绝对值相等,这时取平均计;若差值的绝对值相等,这时取平均(pngjn)(pngjn)秩次。秩次。求秩和,并确定统计量求秩和,并确定统计量T T将所排的秩次冠以原差数的符号,分别求出正、负差值秩次之和,分别以将所排的秩次冠以原差数的符号,分别求出正、负差值秩次之和,分别以T+T+和和 T-T-表示。表示。第6页/共71页第六页,共72页。单组资料的符号(fho)及符号(fho)秩和检验 在在H0H0成立时,如果当观察例数比较多,正差值的秩和与负差值的秩成立时,如果当观察例数比较多,正差
10、值的秩和与负差值的秩和理论上应相等,即使有些差别,也只能是一些随机因素造成的。和理论上应相等,即使有些差别,也只能是一些随机因素造成的。换句话说,如果换句话说,如果H0H0成立,一份随机样本中成立,一份随机样本中“不太可能不太可能”出现正差值出现正差值的秩和与负差值的秩和相差悬殊的情形;如果样本的正差值的秩和的秩和与负差值的秩和相差悬殊的情形;如果样本的正差值的秩和与负差值的秩和差别太大,我们有理由拒绝与负差值的秩和差别太大,我们有理由拒绝H0H0,接受,接受(jishu)H1(jishu)H1,即认为两种处理效应不同;反之,没有理由拒绝即认为两种处理效应不同;反之,没有理由拒绝H0H0,还不
11、能认为两,还不能认为两种处理效应不同。种处理效应不同。第7页/共71页第七页,共72页。单组资料(zlio)的符号及符号秩和检验双侧检验时,以绝对值较小者为统计量双侧检验时,以绝对值较小者为统计量T T值,即值,即T=min(T+,T-)T=min(T+,T-);单侧检验时,任取正差值的秩和或负差值的秩和为统计量单侧检验时,任取正差值的秩和或负差值的秩和为统计量T T。记。记正、负差值的总个数为正、负差值的总个数为n n (即(即n n为差值不等于为差值不等于(dngy)0(dngy)0的对的对子数),则子数),则T+T+与与T-T-之和为之和为n(n+1)/2n(n+1)/2。确定确定P P
12、值和作出推断结论值和作出推断结论查表法(时)查查表法(时)查T T界值表,若检验统计量界值表,若检验统计量T T值在上、下界值范围值在上、下界值范围内,其内,其P P值大于相应的概率水平;若值大于相应的概率水平;若T T值在上、下界值上或范围值在上、下界值上或范围外,则外,则P P值小于相应的概率水平。值小于相应的概率水平。第8页/共71页第八页,共72页。单组资料的符号(fho)及符号(fho)秩和检验 正态近似法(正态近似法(n50n50时)这时可利用秩和分布的正态近似法作出判断。已知时)这时可利用秩和分布的正态近似法作出判断。已知H0H0成立成立(chngl)(chngl)时,近似地有时
13、,近似地有 其中,其中, 统计量的计算公式为:统计量的计算公式为:),(2TTNT第9页/共71页第九页,共72页。例题(lt)单样本 已知某地正常人尿氟含量的中位数为已知某地正常人尿氟含量的中位数为45.30 45.30 。今在该地某厂随机抽取。今在该地某厂随机抽取(chu q)12(chu q)12名工人,测得尿氟含量。名工人,测得尿氟含量。问该厂工人的尿氟含量是否高于当地正常人的尿氟含量?问该厂工人的尿氟含量是否高于当地正常人的尿氟含量?第10页/共71页第十页,共72页。配对(pi du)设计资料的非参数检验 配对设计有两种情况:一种是同对的两个受试对象分别给予两种处理,配对设计有两种
14、情况:一种是同对的两个受试对象分别给予两种处理,目的是推断两种处理的效果有无目的是推断两种处理的效果有无(yu w)(yu w)差别。如取同窝别、体重相差别。如取同窝别、体重相近的近的2 2只动物配对。临床试验疗效比较时,常将病种、病型、病情及其只动物配对。临床试验疗效比较时,常将病种、病型、病情及其它影响疗效的主要因素一致的病人配成对子,以构成配对的研究样本。它影响疗效的主要因素一致的病人配成对子,以构成配对的研究样本。另一种是同一受试对象处理前后的比较,目的是推断该处理有无另一种是同一受试对象处理前后的比较,目的是推断该处理有无(yu (yu w)w)作用。例如观察某指标的变化,用同一组病
15、人治疗前后作比较;作用。例如观察某指标的变化,用同一组病人治疗前后作比较;用同一批动物处理前后作比较;或用同一批受试对象的不同部位、不用同一批动物处理前后作比较;或用同一批受试对象的不同部位、不同器官作比较等,也属于配比试验。同器官作比较等,也属于配比试验。第11页/共71页第十一页,共72页。配对设计(shj)资料的非参数检验 配对设计资料一般采用配对配对设计资料一般采用配对t t检验方法进行分析,但若配对数据差数的分布非正态分布,但其总体分布基本检验方法进行分析,但若配对数据差数的分布非正态分布,但其总体分布基本(jbn)(jbn)对称,则可采用符号秩检验作为配对对称,则可采用符号秩检验作
16、为配对t t检验的替代方法。符号秩检验功效很高,在数据满足配对检验的替代方法。符号秩检验功效很高,在数据满足配对t t检检验的要求时,符号秩检验的功效可达配对验的要求时,符号秩检验的功效可达配对t t检验功效的检验功效的95%95%。第12页/共71页第十二页,共72页。配对设计(shj)资料的非参数检验配对设计资料的检验步骤为:配对设计资料的检验步骤为:求差值求各对数据求差值求各对数据 的差值的差值 ;检验假设检验假设H0H0:差值的总体中位数等于零,即:差值的总体中位数等于零,即 H1H1:差值的总体中位数不等于零,即:差值的总体中位数不等于零,即编秩按差值的绝对值由小到大编秩,并按差值的
17、正负给秩次加上正负号。编秩按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号。编秩时,若差值为编秩时,若差值为0 0,舍去不计;若差值的绝对值相等,舍去不计;若差值的绝对值相等(xingdng)(xingdng),取,取平均秩次。平均秩次。求秩和并确定统计量求秩和并确定统计量T T将所排的秩次冠以原差数的符号,分别求出正、负将所排的秩次冠以原差数的符号,分别求出正、负差值秩次之和,分别以差值秩次之和,分别以T+T+和和 T- T-表示。表示。),(iiyxiiyxd0dM0dM第13页/共71页第十三页,共72页。配对(pi du)设计资料的非参数检验 在在H0H0成立时,如果当观察例
18、数比较多,正差值的秩和与负差值的成立时,如果当观察例数比较多,正差值的秩和与负差值的秩和理论上应相等,即使有些差别,也只能是一些随机因素造成秩和理论上应相等,即使有些差别,也只能是一些随机因素造成的。换句话说,如果的。换句话说,如果H0H0成立,一份随机样本中成立,一份随机样本中“不太可能不太可能“出现出现正差值的秩和与负差值的秩和相差悬殊的情形正差值的秩和与负差值的秩和相差悬殊的情形(qng xing)(qng xing);如果;如果样本的正差值的秩和与负差值的秩和差别太大,我们有理由拒绝样本的正差值的秩和与负差值的秩和差别太大,我们有理由拒绝H0H0,接受,接受H1H1,即认为两种处理效应
19、不同;反之,没有理由拒绝,即认为两种处理效应不同;反之,没有理由拒绝H0H0,还不能认为两种处理效应不同。,还不能认为两种处理效应不同。第14页/共71页第十四页,共72页。配对(pi du)设计资料的非参数检验统计量统计量双侧检验时,以绝对值较小者为统计量双侧检验时,以绝对值较小者为统计量T T值,即值,即T=min(T+T=min(T+,T-)T-);单侧检验时,任取正差值的秩和或负;单侧检验时,任取正差值的秩和或负差值的秩和为统计量差值的秩和为统计量T T。记正、负差值的总个数为。记正、负差值的总个数为n n (即(即n n为差值不等于为差值不等于(dngy)0(dngy)0的对子数),
20、则的对子数),则T+T+与与T-T-之和为之和为n(n+1)/2n(n+1)/2。确定确定P P值和作出推断结论。值和作出推断结论。第15页/共71页第十五页,共72页。例题配对(pi du)设计 对对1212份血清分别用原方法(检测时间份血清分别用原方法(检测时间2020分钟)和新方法(检测时间分钟)和新方法(检测时间1010分钟)测谷分钟)测谷- -丙转氨酶。问两法所得丙转氨酶。问两法所得(su d)(su d)结果有无差别?结果有无差别?第16页/共71页第十六页,共72页。成组设计(shj)资料的非参数检验 WilcoxonWilcoxon秩和检验,用于推断计量资料或等级秩和检验,用于
21、推断计量资料或等级(dngj)(dngj)资料的两个样本所资料的两个样本所来自的两个总体分布是否有差别。在理论上假设来自的两个总体分布是否有差别。在理论上假设H0H0应为两个总体分布相同,应为两个总体分布相同,即两个样本来自同一总体。由于秩和检验对于两个总体分布的形状差别不敏即两个样本来自同一总体。由于秩和检验对于两个总体分布的形状差别不敏感,对于位置相同、形状不同但类似的两个总体分布,推断不出两个总体分感,对于位置相同、形状不同但类似的两个总体分布,推断不出两个总体分布有差别,故对立的备择假设布有差别,故对立的备择假设H1H1不能认为两个总体分布不同,而只能为两不能认为两个总体分布不同,而只
22、能为两个总体分布位置不同。个总体分布位置不同。 不管两个总体分布的形状有无差别,秩和检验的目的是推断两个总体分布的不管两个总体分布的形状有无差别,秩和检验的目的是推断两个总体分布的位置是否有差别,这正是实践中所需要的,如要推断两个不同人群的某项指位置是否有差别,这正是实践中所需要的,如要推断两个不同人群的某项指标值的大小是否有差别或哪个人群的大,可用其指标值分布的位置差别反映,标值的大小是否有差别或哪个人群的大,可用其指标值分布的位置差别反映,而不关心其指标值分布的形状有无差别。而不关心其指标值分布的形状有无差别。第17页/共71页第十七页,共72页。成组设计(shj)资料的非参数检验 求检验
23、统计量求检验统计量T T值:把两样本数据混合从小到大编秩,遇数据相等者取值:把两样本数据混合从小到大编秩,遇数据相等者取平均秩;以样本例数小者为平均秩;以样本例数小者为n1n1,其秩和(,其秩和(T1T1)为)为T T,若样本例数相等,若样本例数相等,可取任一样本的秩和(可取任一样本的秩和(T1T1或或T2T2)为)为T T。 确定确定P P值,作出推断结论值,作出推断结论(jiln)(jiln):当:当n110n110和和n2- n110n2- n110时,查时,查T T界界值表。若值表。若T T值在界值范围内,其值在界值范围内,其P P值大于相应概率水平;若值大于相应概率水平;若T T值刚
24、好等于界值刚好等于界值,其值,其P P值等于相应概率水平;若值等于相应概率水平;若T T值在界值范围外,其值在界值范围外,其P P值小于相应概率值小于相应概率水平。水平。 若若n110n110或者或者n2- n110n2- n110,超出界值表的范围,可用正态近似法作检验,超出界值表的范围,可用正态近似法作检验,令令n1n1n2=Nn2=N,按下式计算值。,按下式计算值。 )(1 (12) 1(2/ ) 1(33211NNttNnnNnTjj第18页/共71页第十八页,共72页。成组设计(shj)资料非参数检验的SAS程序 SASSAS中对于非参数中对于非参数(cnsh)(cnsh)分析方法功
25、能的实现主要由分析方法功能的实现主要由npar1waynpar1way过程来完成,过程来完成,npar1waynpar1way过程属于过程属于SASSAS的的STATSTAT模块,对于统计学上所涉及的非参数模块,对于统计学上所涉及的非参数(cnsh)(cnsh)统计方法几乎都可以通过此过程完成。统计方法几乎都可以通过此过程完成。Npar1wayNpar1way过程的基本语句格式如下:过程的基本语句格式如下: PROC NPAR1WAY PROC NPAR1WAY ; ; BY BY 变量名变量名; ; CLASSCLASS变量名变量名; ; EXACT EXACT 统计量选项统计量选项 / ;
26、 ; FREQFREQ变量名变量名; ; OUTPUT OUT=OUTPUT ; ; VAR VAR 变量名变量名; ; RUN;RUN;第19页/共71页第十九页,共72页。成组设计(shj)资料非参数检验的SAS程序 DATA=DATA=数据集名:指定要进行分析的数据集;数据集名:指定要进行分析的数据集; MEDIANMEDIAN:运用中位数评分进行分析,即进行中位数检验:运用中位数评分进行分析,即进行中位数检验 NOPRINTNOPRINT:禁止所有的输出,用在仅需要创建输出数据集时;:禁止所有的输出,用在仅需要创建输出数据集时; STST:运用:运用Siegel-TukeySiegel
27、-Tukey评分进行分析;评分进行分析; ANOVAANOVA:对原始数据进行方差分析;:对原始数据进行方差分析; EDFEDF:要求计算基于经验分布的统计量;:要求计算基于经验分布的统计量; MISSINGMISSING:指定分组变量的缺失:指定分组变量的缺失(qu sh)(qu sh)值为一有效的分组水平;值为一有效的分组水平; SAVAGESAVAGE:运用:运用SavageSavage评分进行分析;评分进行分析; VWVW:运用:运用Van der WaerdenVan der Waerden评分进行分析计算;评分进行分析计算;第20页/共71页第二十页,共72页。成组设计(shj)资
28、料非参数检验的SAS程序 CORRECT=NOCORRECT=NO:在两样本时,禁止:在两样本时,禁止WilcoxonWilcoxon和和Siegel-TukeySiegel-Tukey检验的连续性校正检验的连续性校正(jiozhng)(jiozhng)过程;过程; KLOTZKLOTZ:运用:运用KlotzKlotz评分进行分析;评分进行分析; MOODMOOD:运用:运用MoodMood评分进行分析;评分进行分析; SCORES=DATASCORES=DATA:以原始数据为评分值进行分析;:以原始数据为评分值进行分析; WILCOXONWILCOXON:对两样本进行:对两样本进行Wilco
29、xonWilcoxon秩和检验,对多样本进行秩和检验,对多样本进行Kruskal-WallisKruskal-Wallis检验;检验; exactexact语句:要求语句:要求SASSAS对指定的统计量(选项)进行精确概率的对指定的统计量(选项)进行精确概率的计算。其后的统计量选项可为以下项目,分别对应相应的统计计计算。其后的统计量选项可为以下项目,分别对应相应的统计计算方式。算方式。第21页/共71页第二十一页,共72页。成组设计资料(zlio)非参数检验的SAS程序 ABAB,KLOTZKLOTZ,KSKS,MEDIANMEDIAN,MOODMOOD,SAVAGESAVAGE,SCORES
30、=DATASCORES=DATA,STST,WILCOXONWILCOXON,VWVW等。等。 运算选项为精确概率的计算过程指定一些运算选项为精确概率的计算过程指定一些(yxi)(yxi)控制项目,如选项控制项目,如选项“mc”“mc”要求以要求以Monte CarloMonte Carlo方法计算精确概率。方法计算精确概率。 outputoutput语句:与其它过程中相应的语句大同小异,不同之处在于语句最后语句:与其它过程中相应的语句大同小异,不同之处在于语句最后的选项。此处的选项绝大多数包括在表中,指定在输出数据集中包含所指定的选项。此处的选项绝大多数包括在表中,指定在输出数据集中包含所指
31、定项目所对应的统计量。项目所对应的统计量。 varvar语句:与其它过程的也基本相同,用以指定要进行分析的变量,变量必语句:与其它过程的也基本相同,用以指定要进行分析的变量,变量必须为数值型。若省略此语句,须为数值型。若省略此语句,SASSAS将对除将对除byby语句、语句、classclass语句以及语句以及freqfreq语句语句中指定的变量之外的所有数值型变量进行分析。中指定的变量之外的所有数值型变量进行分析。第22页/共71页第二十二页,共72页。例题(lt)成组设计 对对1010例肺癌病人和例肺癌病人和1212例矽肺例矽肺0 0期工人用期工人用X X光片测量肺门横径右侧光片测量肺门横
32、径右侧(yu c)(yu c)距距RDRD值(值(cmcm。问肺癌病人的。问肺癌病人的RDRD值是否高于矽肺值是否高于矽肺0 0期工人的期工人的RDRD值?值?第23页/共71页第二十三页,共72页。例题(lt)两组等级资料 3939名吸烟名吸烟(x yn)(x yn)工人和工人和4040名不吸烟名不吸烟(x yn)(x yn)工人的碳氧血红蛋白工人的碳氧血红蛋白HbCO(%)HbCO(%)含量。问吸烟含量。问吸烟(x yn)(x yn)工人工人的的HbCO(%)HbCO(%)含量是否高于不吸烟含量是否高于不吸烟(x yn)(x yn)工人的工人的HbCO(%)HbCO(%)含量?含量?第24
33、页/共71页第二十四页,共72页。完全随机设计(shj)资料的非参数检验 这一部分的内容相当于参数检验中的方差分析,依据的方法是这一部分的内容相当于参数检验中的方差分析,依据的方法是Kruskal-Kruskal-WallisWallis秩和检验,此方法的基本思想与秩和检验,此方法的基本思想与WilcoxonWilcoxon秩和检验基本相同,都是秩和检验基本相同,都是基于各组混合编秩后,各组秩和应相等的假设。两者的不同点就在于基于各组混合编秩后,各组秩和应相等的假设。两者的不同点就在于Kruskal-WallisKruskal-Wallis秩和检验是针对多组数据的分析,而秩和检验是针对多组数据
34、的分析,而WilcoxonWilcoxon秩和检验则秩和检验则只用于对两组数据的比较。只用于对两组数据的比较。 Kruskal-Wallis HKruskal-Wallis H检验,用于推断计量资料或等级资料的多个独立性样本检验,用于推断计量资料或等级资料的多个独立性样本所来自的多个总体所来自的多个总体(zngt)(zngt)分布是否有差别。在理论上检验假设分布是否有差别。在理论上检验假设H0H0应为多个应为多个总体总体(zngt)(zngt)分布相同,即多个样本来自同一总体分布相同,即多个样本来自同一总体(zngt)(zngt)。由于。由于HH检验多检验多个总体个总体(zngt)(zngt)
35、分布的形状差别不敏感,故在实际应用中检验假设分布的形状差别不敏感,故在实际应用中检验假设H0H0可写作可写作多个总体多个总体(zngt)(zngt)分布位置相同。对立的备择假设分布位置相同。对立的备择假设H1H1为多个总体为多个总体(zngt)(zngt)分分布位置不全相同。布位置不全相同。第25页/共71页第二十五页,共72页。例题(lt)完全随机设计 用三种药物杀灭钉螺用三种药物杀灭钉螺(dnglu)(dnglu),每批用,每批用200200只活钉螺只活钉螺(dnglu)(dnglu),用药后清点每批钉螺,用药后清点每批钉螺(dnglu)(dnglu)的死亡的死亡数、再计算死亡率(数、再计
36、算死亡率(%)。问三种药物杀灭钉螺)。问三种药物杀灭钉螺(dnglu)(dnglu)的效果有无差别?的效果有无差别?第26页/共71页第二十六页,共72页。例题完全(wnqun)随机设计(等级) 四种疾病四种疾病(jbng)(jbng)患者痰液内嗜酸性白细胞的检查结果。问四种疾病患者痰液内嗜酸性白细胞的检查结果。问四种疾病(jbng)(jbng)患者痰液内的嗜酸性白细胞有患者痰液内的嗜酸性白细胞有无差别?无差别?第27页/共71页第二十七页,共72页。随机区组设计(shj)资料的非参数检验 这一部分的内容相当于参数检验中的方差分析,依据的方法这一部分的内容相当于参数检验中的方差分析,依据的方法
37、(fngf)(fngf)是是FriedmanFriedman秩和检验,此方法秩和检验,此方法(fngf)(fngf)的基本思想与的基本思想与WilcoxonWilcoxon秩和检验秩和检验基本相同,都是基于各组混合编秩后,各组秩和应相等的假设。两者的不基本相同,都是基于各组混合编秩后,各组秩和应相等的假设。两者的不同点就在于同点就在于FriedmanFriedman秩和检验是针对随机区组数据的分析,而秩和检验是针对随机区组数据的分析,而WilcoxonWilcoxon秩和检验则只用于对两组数据的比较。秩和检验则只用于对两组数据的比较。 Friedman MFriedman M检验,用于推断计量
38、资料或等级资料的多个独立性样本所检验,用于推断计量资料或等级资料的多个独立性样本所来自的多个总体分布是否有差别。在理论上检验假设来自的多个总体分布是否有差别。在理论上检验假设H0H0应为多个总体分应为多个总体分布相同,即多个样本来自同一总体。由于布相同,即多个样本来自同一总体。由于MM检验多个总体分布的形状差别检验多个总体分布的形状差别不敏感,故在实际应用中检验假设不敏感,故在实际应用中检验假设H0H0可写作多个总体分布位置相同。对可写作多个总体分布位置相同。对立的备择假设立的备择假设H1H1为多个总体分布位置不全相同。为多个总体分布位置不全相同。第28页/共71页第二十八页,共72页。例题随
39、机(su j)区组设计 8 8名受试对象在相同实验条件名受试对象在相同实验条件(tiojin)(tiojin)下分别接受下分别接受4 4种不同频率声音的刺激,他们的反应率(种不同频率声音的刺激,他们的反应率(%)。问)。问4 4种种频率声音刺激的反应率是否有差别?频率声音刺激的反应率是否有差别?第29页/共71页第二十九页,共72页。本章(bn zhn)小节 非参数检验方法简便,不依赖于总体分布的具体形式因而适用性强,但灵敏非参数检验方法简便,不依赖于总体分布的具体形式因而适用性强,但灵敏度和精确度不如参数检验。一般而言,非参数检验适用于以下三种情况:度和精确度不如参数检验。一般而言,非参数检
40、验适用于以下三种情况:顺序类型顺序类型(lixng)(lixng)的数据资料,这类数据的分布形态一般是未知的;虽然的数据资料,这类数据的分布形态一般是未知的;虽然是连续数据,但总体分布形态未知或者非正态,这和卡方检验一样,称自由是连续数据,但总体分布形态未知或者非正态,这和卡方检验一样,称自由分布检验;总体分布虽然正态,数据也是连续类型分布检验;总体分布虽然正态,数据也是连续类型(lixng)(lixng),但样本容量,但样本容量极小,如极小,如1010以下(虽然检验被称为小样本统计方法,但样本容量太小时,以下(虽然检验被称为小样本统计方法,但样本容量太小时,代表性毕竟很差,最好不要用要求较严
41、格的参数检验法)。因为这些特点,代表性毕竟很差,最好不要用要求较严格的参数检验法)。因为这些特点,加上非参数检验法一般原理和计算比较简单,因此常用于一些为正式研究进加上非参数检验法一般原理和计算比较简单,因此常用于一些为正式研究进行探路的预备性研究的数据统计中。当然,由于非参数检验许多牵涉不到参行探路的预备性研究的数据统计中。当然,由于非参数检验许多牵涉不到参数计算,对数据中的信息利用不够,因而其统计检验力相对参数检验也差得数计算,对数据中的信息利用不够,因而其统计检验力相对参数检验也差得多。多。第30页/共71页第三十页,共72页。本章(bn zhn)小节 本章介绍了编秩的基本步骤,平均秩的
42、计算及相等秩的校正本章介绍了编秩的基本步骤,平均秩的计算及相等秩的校正(jiozhng)(jiozhng),详细讲解了非参数检验的几种基,详细讲解了非参数检验的几种基本类型和检验的基本方法,包括配对及单样本秩和检验、两组样本比较的秩和检验、多组样本比较的秩和本类型和检验的基本方法,包括配对及单样本秩和检验、两组样本比较的秩和检验、多组样本比较的秩和检验、等级分组资料的非参数检验和随机区组设计资料比较的秩和检验。我们在学习的过程中掌握各种资检验、等级分组资料的非参数检验和随机区组设计资料比较的秩和检验。我们在学习的过程中掌握各种资料的编秩以及秩和检验方法。料的编秩以及秩和检验方法。第31页/共7
43、1页第三十一页,共72页。蒋红卫蒋红卫第32页/共71页第三十二页,共72页。学习(xux)目标 掌握四格表普通卡方检验和配对卡方检验方法以及相应的掌握四格表普通卡方检验和配对卡方检验方法以及相应的SASSAS程序;程序; 了解了解FREQFREQ过程语句格式过程语句格式(g shi)(g shi); 熟悉熟悉R RC C表资料的分类类型以及相应的统计检验方法;表资料的分类类型以及相应的统计检验方法; 掌握双向无序掌握双向无序R RC C表资料检验以及表资料检验以及SASSAS程序;程序; 掌握单向有序掌握单向有序R RC C表资料检验以及表资料检验以及SASSAS程序;程序; 掌握趋势卡方检
44、验方法以及掌握趋势卡方检验方法以及SASSAS程序;程序; 掌握分层掌握分层R RC C表的分析以及表的分析以及SASSAS程序;程序;第33页/共71页第三十三页,共72页。概述(i sh) 前面已介绍了两个率比较的检验,在观察例数不够大或拟对多个前面已介绍了两个率比较的检验,在观察例数不够大或拟对多个率进行比较时,检验就不适宜了,因为直接对多个样本率作两两率进行比较时,检验就不适宜了,因为直接对多个样本率作两两间的检验有可能增加第一类误差。间的检验有可能增加第一类误差。2 2检验可解决此类问题。检验可解决此类问题。 卡方检验是用途很广的一种假设检验方法,这里我们主要学习它卡方检验是用途很广
45、的一种假设检验方法,这里我们主要学习它在分类资料统计在分类资料统计(tngj)(tngj)推断中的应用,包括:两个率或两个构成推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。类资料的相关分析等。第34页/共71页第三十四页,共72页。四格(s )表资料 定性指标分为有序的(如:疗效分为定性指标分为有序的(如:疗效分为“治愈、显效、好转、无效、死亡治愈、显效、好转、无效、死亡”)和名义的(如:血型分为和名义的(如:血型分为“O“O、A A、B B、AB”AB”型)类,对于每个受
46、试者型)类,对于每个受试者来说,有序指标的观测结果只能是该有序指标若干等级中的级(如某人的来说,有序指标的观测结果只能是该有序指标若干等级中的级(如某人的疗效为疗效为“显效显效”);名义指标的观测结果只能是该名义指标若干标志中的);名义指标的观测结果只能是该名义指标若干标志中的个(如某人的血型为型),显然,无法像处理定量指标那样去直接分析定个(如某人的血型为型),显然,无法像处理定量指标那样去直接分析定性指标,故这类资料常被整理成列联表的形式后再进行分析。性指标,故这类资料常被整理成列联表的形式后再进行分析。 当表中只有个定性指标时,称为维列联表;有个或个以上定性指标当表中只有个定性指标时,称
47、为维列联表;有个或个以上定性指标时,称为多维列联表。常用时,称为多维列联表。常用R R、C C表示维列联表的行数和列数,并称为表示维列联表的行数和列数,并称为R RC C表;当表;当R=C=R=C=时,称为表(或四格时,称为表(或四格(s )(s )表)。表看起表)。表看起来很简单,但根据资料所具备的条件有许多不同的处理方法。来很简单,但根据资料所具备的条件有许多不同的处理方法。第35页/共71页第三十五页,共72页。四格表卡方检验(jinyn)的SAS程序 在在SAS/STATSAS/STAT模块中模块中FREQFREQ、TABULATETABULATE和和SUMMARYSUMMARY等过程
48、可用于分类资料等过程可用于分类资料的统计描述,其中的统计描述,其中FREQFREQ过程兼具统计描述和统计推断的功能,对分类变量计算频过程兼具统计描述和统计推断的功能,对分类变量计算频数分布,产生从一维到数分布,产生从一维到n n维的频数表和列联表;对于二维表,可进行维的频数表和列联表;对于二维表,可进行2 2检验,对检验,对于三维表,可作于三维表,可作Mentel-HanszelMentel-Hanszel分层分析。分层分析。FREQFREQ过程是过程是SASSAS用于分析分类资料用于分析分类资料的一个常用过程。本节将先向大家介绍的一个常用过程。本节将先向大家介绍FREQFREQ过程的语句过程
49、的语句(yj)(yj)及其格式。及其格式。 FREQFREQ过程的语句过程的语句(yj)(yj)基本格式如下:基本格式如下: Proc freq data= order= ; Proc freq data= order= ; Table Table 分类变量分类变量* *分类变量分类变量/ ;/ ; Weight Weight 变量变量; ; Run; Run;第36页/共71页第三十六页,共72页。四格(s )表卡方检验的SAS程序 DATADATA数据集:规定数据集:规定PROC FREQPROC FREQ语句使用的数据集;语句使用的数据集; ORDERORDERFREQFREQ,按频数递
50、减顺序排列;,按频数递减顺序排列;ORDERORDERDATADATA,按数据集中出现,按数据集中出现的顺序排列;的顺序排列;ORDERORDERINTERNALINTERNAL,按内部值排列,按内部值排列( (缺省缺省) );ORDERORDERFORMATTEDFORMATTED,按外部格式值排列;,按外部格式值排列; TableTable语句指定构成表格的变量和表格结构。表格的结构由变量个数和变量排语句指定构成表格的变量和表格结构。表格的结构由变量个数和变量排列顺序决定,一个列顺序决定,一个(y )table(y )table语句允许列出多个表格结构。语句允许列出多个表格结构。PROC
51、FREQPROC FREQ过过程中可有多条程中可有多条TABLESTABLES语句,语句,TABLESTABLES语句后可接多个表格请求式,每个请求语句后可接多个表格请求式,每个请求式可包含任何数量的变量,从而得到所需的表格。式可包含任何数量的变量,从而得到所需的表格。第37页/共71页第三十七页,共72页。四格(s )表卡方检验的SAS程序 如果如果TABLESTABLES语句缺省,则语句缺省,则FREQFREQ过程对数据过程对数据(shj)(shj)集中的所有变量都给出相应集中的所有变量都给出相应的一维频数表。不规定任何选项时,若需某变量的一维频数,的一维频数表。不规定任何选项时,若需某变
52、量的一维频数,FREQFREQ给出该变量每给出该变量每一水平的频数、累积频数、频数的百分比和累积百分比;若需二维频数表,一水平的频数、累积频数、频数的百分比和累积百分比;若需二维频数表,FREQFREQ产生交叉分组列表,即包括各格的频数、总频数的格百分数、行频数的格百分数和产生交叉分组列表,即包括各格的频数、总频数的格百分数、行频数的格百分数和列频数的格百分数。列频数的格百分数。 请求式由一个或多个用请求式由一个或多个用“* *”连接起来的变量名组成。几个变量可放在括号中,如:连接起来的变量名组成。几个变量可放在括号中,如: TABLES ATABLES A* *(B C)(B C);等价于;
53、等价于TABLES ATABLES A* *B AB A* *C C; TABLES (A-C)TABLES (A-C)* *D D;等价于;等价于TABLES ATABLES A* *D BD B* *D CD C* *D D;第38页/共71页第三十八页,共72页。四格表卡方检验(jinyn)的SAS程序 下列选项可用于下列选项可用于TABLESTABLES语句中语句中“/”“/”的后面:的后面: OUTOUT数据集:建立一个包含变量值和频数计数的输出数据集。如果数据集:建立一个包含变量值和频数计数的输出数据集。如果TABLESTABLES语句中不止一个请求式,数据集的内容相应于语句中不止
54、一个请求式,数据集的内容相应于TABLESTABLES语句中最后一个请求。语句中最后一个请求。 CHISQCHISQ对每层作对每层作c2c2检验检验(jinyn)(jinyn),包括,包括Pearson c2Pearson c2、似然比、似然比c2c2和和Mantel-Mantel-Haenszel c2Haenszel c2。此外还给出与。此外还给出与c2c2检验检验(jinyn)(jinyn)有关的关联指标包括有关的关联指标包括PhiPhi系数、系数、列联系数和列联系数和Cramers VCramers V。对于。对于2 22 2表,给出表,给出FisherFisher精确概率。精确概率。
55、 AGREE AGREE 进行配对进行配对c 2c 2检验检验(jinyn)(jinyn)。 EXACT EXACT 对大于对大于2 22 2的列联表计算的列联表计算FisherFisher精确概率。同时也给出精确概率。同时也给出CHISQCHISQ选项选项的全部统计量。的全部统计量。 第39页/共71页第三十九页,共72页。四格表卡方检验(jinyn)的SAS程序 MEASURESMEASURES对每层的二维表计算一系列关联指标及相应的标准误,包括对每层的二维表计算一系列关联指标及相应的标准误,包括PearsonPearson和和SpearmanSpearman相关系数,以及相关系数,以及G
56、ammaGamma和和KendallKendall系数等。对于系数等。对于2 22 2表,还给出表,还给出常用的危险度指标及其标准误。常用的危险度指标及其标准误。 CMH CMH 给出给出Cochran-Mantel-HaenszelCochran-Mantel-Haenszel统计量,可检验在调整了统计量,可检验在调整了TABLESTABLES语句语句中其它变量后,行变量与列变量之间的关联程度。对于中其它变量后,行变量与列变量之间的关联程度。对于2 22 2表,表,FREQFREQ过程给出过程给出相对危险度估计及其可信区间相对危险度估计及其可信区间(q jin)(q jin),还给出各层关联
57、度指标是否齐性的,还给出各层关联度指标是否齐性的BreslowBreslow检验。检验。 ALL ALL 给出给出CHISQCHISQ、MEASURESMEASURES、CMHCMH所请求的全部统计量。所请求的全部统计量。 ALPHAALPHAp p给出检验水准。缺省为。给出检验水准。缺省为。第40页/共71页第四十页,共72页。四格表卡方检验(jinyn)的SAS程序 EXPECTEDEXPECTED给出期望给出期望(qwng)(qwng)频数。频数。 DEVIATIONDEVIATION给出每格的实际频数与期望给出每格的实际频数与期望(qwng)(qwng)频数的差值。频数的差值。 CEL
58、LCHISQCELLCHISQ给出每格对总给出每格对总c2c2的贡献,即计算每格的的贡献,即计算每格的( (实际频数实际频数- -期望期望(qwng)(qwng)频数频数)2/)2/期望期望(qwng)(qwng)频数。频数。 CUMCOLCUMCOL给出累积列百分数。给出累积列百分数。 NOFREQNOFREQ不给出列联表中的格频数。不给出列联表中的格频数。 NOPERCENTNOPERCENT不给出列联表中的格百分数。不给出列联表中的格百分数。第41页/共71页第四十一页,共72页。四格表卡方检验(jinyn)的SAS程序 NOROWNOROW不给出列联表中各格的行百分数。不给出列联表中各
59、格的行百分数。 NOCOLNOCOL不给出列联表中各格的列百分数。不给出列联表中各格的列百分数。 NOCUMNOCUM不给出频数表的累积频数和累积百分数。不给出频数表的累积频数和累积百分数。 NOPRINTNOPRINT不给出表格,但给出不给出表格,但给出CHISQCHISQ、MEASURESMEASURES或或CMHCMH等语句所指定的统等语句所指定的统计量。计量。 TrendTrend指令系统对指令系统对2 2C C频数表的频数表的C C个百分率进行个百分率进行Cochran-ArmitageCochran-Armitage趋势检验;趋势检验; WEIGHTWEIGHT语句:通常每个观察值
60、提供数值语句:通常每个观察值提供数值(shz)1(shz)1给频数计数,当给频数计数,当WEIGHTWEIGHT语句语句出现时,每个观察值提供的是该观察值的加权变量值。该值必须非负,但可不必为出现时,每个观察值提供的是该观察值的加权变量值。该值必须非负,但可不必为整数。只能使用一个整数。只能使用一个WEIGHTWEIGHT语句,且该语句作用于所有的表。语句,且该语句作用于所有的表。第42页/共71页第四十二页,共72页。四格(s )表卡方检验 理论理论(lln)(lln)频数,记为频数,记为T T。理论。理论(lln)(lln)数的计算公式为:数的计算公式为:nnnTcrrc 第43页/共71
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026届河北省石家庄市桥西区重点中学下学期初三生物第二次阶段检测试题考试试卷含解析
- 黑龙江省大庆市林甸县2026年初三第六次质量检查英语试题含解析
- 2026届山西省朔州市朔城区第四中学初三下学期六校(4月)联考英语试题试卷含解析
- 环保目标达成行动方案承诺书(3篇)
- 山西省太原市小店区志达中学2026届初三下学期第二次质量考评语文试题试卷含解析
- 公益活动按期开展切实履行承诺书8篇范文
- 财务数据分析模板企业经营决策支持
- 产品质量控制流程及抽样检测标准
- 企业人事招聘信息公告编制工具
- 产品说明书撰写标准模板提高信息传达效率
- TCAICI39-2022《通信光缆附挂供电杆路技术规范》
- 2025年国家保安员资格考试模拟100题及答案
- 殡葬职业测试题及答案
- GB/T 10810.1-2025眼镜镜片第1部分:单焦和多焦
- 3.1中国担当课件- -2024-2025学年统编版道德与法治九年级下册
- GB/T 45239-2025夜间蓝光辐射危害的评价方法
- 2025年宁波职业技术学院单招职业倾向性测试题库及答案(历年真题)
- 抗凝药物的使用及注意事项课件
- 结构仿生学 课件 第5章 结构仿生学典型应用案例
- 纯英文版高三数学试卷
- 药厂卫生知识培训课件
评论
0/150
提交评论