SAS的t检验正式PPT课件_第1页
SAS的t检验正式PPT课件_第2页
SAS的t检验正式PPT课件_第3页
SAS的t检验正式PPT课件_第4页
SAS的t检验正式PPT课件_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、学习目标 掌握基本掌握基本SASSAS过程的调用过程的调用 掌握单样本、配对设计资料、两独立样本掌握单样本、配对设计资料、两独立样本t t检验的基础理论及其检验的基础理论及其SASSAS分析程序;分析程序;1第1页/共68页概述 SASSAS系统的系统的BASEBASE软件提供了一些计算基础统计量的过程,如:软件提供了一些计算基础统计量的过程,如:meansmeans过程、过程、univariateunivariate过程、过程、ttestttest过过程。程。 这些过程可完成单变量或多变量的描述统计量计算。这些过程可完成单变量或多变量的描述统计量计算。 它们也可完成各种它们也可完成各种t t

2、检验。检验。2第2页/共68页MEANS过程 MEANSMEANS过程功能是对计量数据进行统计描述与单样本或配对设过程功能是对计量数据进行统计描述与单样本或配对设计资料的计资料的t t检验,它的一般格式如下:检验,它的一般格式如下:proc means proc means 输入数据集名输入数据集名 ; ;var var 变量列表变量列表 ; ;class class 变量列表变量列表 ; ;by by 变量列表变量列表 ; ;freq freq 变量变量 ; ;weight weight 变量变量 ; ;id id 变量列表变量列表 ; ; output out= output ; ;run

3、 ;run ;3第3页/共68页选项列表 vardef=df/weight/wgt/n/wdfvardef=df/weight/wgt/n/wdf在方差计算中规定除数在方差计算中规定除数d.d.。 descendingdescending规定输出数据集按规定输出数据集按_type_type_值下降的次序(缺省时为上升)。值下降的次序(缺省时为上升)。 order=freq/data/internal/formatted/order=freq/data/internal/formatted/规定输出时规定输出时classclass变量按所指定方式排序。变量按所指定方式排序。 alpha=alph

4、a=数字数字设置计算置信区间的置信水平设置计算置信区间的置信水平 , 值在值在0 0与与1 1之间。之间。4第4页/共68页5统计量名称统计量名称含义含义统计量名称统计量名称 含义含义n未丢失的观测个数未丢失的观测个数mode众数,出现频数最高的数众数,出现频数最高的数nmiss丢失的观测个数丢失的观测个数sumwgt权数和权数和mean算术平均算术平均max最大值最大值stderr均值的标准误差均值的标准误差min最小值最小值sum加权和加权和range极差,极差,maxminstd标准偏差标准偏差median中间值中间值var方差方差T总体均值等于总体均值等于0的的t统计量统计量cv变异系

5、数的百分数变异系数的百分数Prtt t分布的双尾分布的双尾p值值uss加权平方和加权平方和Clm置信度上限和下限置信度上限和下限css关于均值偏差的加权关于均值偏差的加权平方和平方和Lclm置信度下限置信度下限skewness对称性的度量对称性的度量偏偏度度Uclm置信度上限置信度上限kurtosis对尾部陡平的度量对尾部陡平的度量峰度峰度统计量关键字统计量关键字第5页/共68页output语句中的选项 out=输出数据集名。输出数据集名。 统计量关键字统计量关键字= =变量名列表变量名列表规定在输出数据集中要包含的统计量并规定这些统计量在新数据集中的变量规定在输出数据集中要包含的统计量并规定

6、这些统计量在新数据集中的变量名。名。 meansmeans过程对过程对outputoutput语句的次数没有限制,可以使用几个语句的次数没有限制,可以使用几个outputoutput语句来创建内容不同的多个数据集。语句来创建内容不同的多个数据集。6第6页/共68页其它语句 varvar语句语句分析的连续型变量。分析的连续型变量。 byby语句语句分组变量分组变量, ,须事先排序。须事先排序。 classclass语句语句分组变量,无须事先排序。分组变量,无须事先排序。 freqfreq语句语句指定频数。指定频数。 weightweight语句语句指定权重。指定权重。 idid语句语句在输出数据

7、集中增加一个或几个附加变量,目的在于识别输出数据集里的观测。其值为生成这在输出数据集中增加一个或几个附加变量,目的在于识别输出数据集里的观测。其值为生成这个观测的输入数据集中相应观测组里个观测的输入数据集中相应观测组里idid变量具有的最大值。变量具有的最大值。7第7页/共68页UNIVARIATE过程 UNIVARIATEUNIVARIATE过程功能是对计量数据进行更为详细的统计描述、过程功能是对计量数据进行更为详细的统计描述、少量统计图、正态性检验与单样本或配对设计资料的少量统计图、正态性检验与单样本或配对设计资料的t t检验,它检验,它的一般格式如下:的一般格式如下:proc univa

8、riate proc univariate 输入数据集名输入数据集名 ; ;var var 变量列表变量列表 ; ;by by 变量列表变量列表 ; ;freq freq 变量变量 ; ;weight weight 变量变量 ; ;id id 变量列表变量列表 ; ;output out=output ;run;run;8第8页/共68页选项列表 vardef=df/weight/wgt/n/wdfvardef=df/weight/wgt/n/wdf在方差计算中规定除数在方差计算中规定除数d.d.。 normalnormal要求计算关于输入数据服从正态分布的假设的检验统计量。要求计算关于输入数

9、据服从正态分布的假设的检验统计量。 plotplot要求生成一个茎叶图、一个盒型图和一个正态概率图。要求生成一个茎叶图、一个盒型图和一个正态概率图。 pctldef=1/2/3/4/5pctldef=1/2/3/4/5规定计算百分位的五种方法规定计算百分位的五种方法, , 缺省值为缺省值为5 5。9第9页/共68页10统计量关键字统计量关键字统计量名称统计量名称含义含义统计量名称统计量名称含义含义n n未丢失的观测个数未丢失的观测个数modemode众数,出现频数最高的数众数,出现频数最高的数nmissnmiss丢失的观测个数丢失的观测个数t t总体均值等于总体均值等于0 0的的t t统计量统

10、计量nobsnobs观测个数观测个数prtprtt t分布的双尾分布的双尾p p值值meanmean算术平均算术平均q3q3上四分位数(上四分位数(75%75%)stderrstderr均值的标准误差均值的标准误差q1q1下四分位数(下四分位数(75%75%)sumsum加权和加权和qrangeqrange上下四分位数差(上下四分位数差(q3-q1q3-q1)stdstd标准偏差标准偏差p1p11%1%分位数分位数varvar方差方差p5p55%5%分位数分位数cvcv变异系数的百分数变异系数的百分数p10p1010%10%分位数分位数ussuss加权平方和加权平方和p90p9090%90%分

11、位数分位数csscss关于均值偏差的加权平方关于均值偏差的加权平方和和p95p9595%95%分位数分位数skewnessskewness对称性的度量对称性的度量偏度偏度p99p9999%99%分位数分位数kurtosiskurtosis对尾部陡平的度量对尾部陡平的度量峰峰度度msignmsign符号统计量符号统计量sumwgtsumwgt权数和权数和probmprobm大于符号秩统计量的绝对值概率大于符号秩统计量的绝对值概率maxmax最大值最大值signranksignrank符号秩统计量符号秩统计量minmin最小值最小值probsprobs大于中心符号秩统计量的绝对值大于中心符号秩统计

12、量的绝对值p prangerange极差,极差,maxmaxminminnormalnormal检验正态性的统计量检验正态性的统计量medianmedian中间值中间值probnprobn检验正态分布假设的概率值检验正态分布假设的概率值第10页/共68页output语句中的选项 out=输出数据集名。输出数据集名。 统计量关键字统计量关键字= =变量名列表变量名列表规定在输出数据集中要包含的统计量并规定这些统计量在新数据集中的变量规定在输出数据集中要包含的统计量并规定这些统计量在新数据集中的变量名。名。 meansmeans过程对过程对outputoutput语句的次数没有限制,可以使用几个语

13、句的次数没有限制,可以使用几个outputoutput语句来创建内容不同的多个数据集。语句来创建内容不同的多个数据集。11第11页/共68页其它语句 varvar语句语句分析的连续型变量。分析的连续型变量。 byby语句语句分组变量分组变量, ,须事先排序。须事先排序。 freqfreq语句语句指定频数。指定频数。 weightweight语句语句指定权重。指定权重。 idid语句语句在输出数据集中增加一个或几个附加变量,目的在于识别输出数据集里的观测。其值为生成这在输出数据集中增加一个或几个附加变量,目的在于识别输出数据集里的观测。其值为生成这个观测的输入数据集中相应观测组里个观测的输入数据

14、集中相应观测组里idid变量具有的最大值。变量具有的最大值。12第12页/共68页TTEST过程 对于配对设计定量数据,我们可以采用对于配对设计定量数据,我们可以采用TTESTTTEST过程进行统计分过程进行统计分析。析。TTESTTTEST过程功能是对两组数据的均数进行差别比较的过程功能是对两组数据的均数进行差别比较的t t检验,检验,它的一般格式如下:它的一般格式如下: proc ttest data= ;proc ttest data= ; class class 变量名称(分组变量)变量名称(分组变量); ; paired variables; paired variables; va

15、r var 变量名称(待分析的数值变量)变量名称(待分析的数值变量); ; by by 变量名称(分组变量)变量名称(分组变量); ; run; run; 13第13页/共68页TTEST过程 PROC TTESTPROC TTEST语句和语句和CLASSCLASS(或(或PAIREDPAIRED)语句是必需的,)语句是必需的,其余语句可以省略,其余语句可以省略,CLASSCLASS语句、语句、VARVAR语句及语句及BYBY语句之间的语句之间的顺序可以任意。顺序可以任意。CLASSCLASS语句所指定的分组变量是用来进行组间语句所指定的分组变量是用来进行组间比较的比较的,PAIREDPAIR

16、ED语句专门用来进行配对语句专门用来进行配对t t检验的数据分析检验的数据分析,而,而BYBY语句所指定的分组变量是用来将数据分为若干个更小的样本,语句所指定的分组变量是用来将数据分为若干个更小的样本,以便以便SASSAS分别在各小样本内进行各自独立的处理。分别在各小样本内进行各自独立的处理。VARVAR语句引语句引导所要进行比较的所有变量的列表,导所要进行比较的所有变量的列表,SASSAS将对将对VARVAR语句所引导语句所引导的所有变量分别进行组间均数比较的的所有变量分别进行组间均数比较的t t检验。检验。14第14页/共68页单样本t检验的基础理论 单样本单样本t t检验实际上是推断该样

17、本来自的总体均数检验实际上是推断该样本来自的总体均数 与已知的某一总体均数与已知的某一总体均数00(常为理论值或标准值)(常为理论值或标准值) 有有无差别。其检验统计量按下式计算无差别。其检验统计量按下式计算1,/000nnSXnSXSXtX15第15页/共68页例题 某医生测量了某医生测量了3636名从事铅作业男性工人的血红蛋白含量,算得其均数为,标准差为。问从事铅作业工人的名从事铅作业男性工人的血红蛋白含量,算得其均数为,标准差为。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值血红蛋白是否不同于正常成年男性平均值140g/L140g/L?16第16页/共68页SAS程序 直接计算法

18、直接计算法 PROC MEANSPROC MEANS PROC UNIVARIATEPROC UNIVARIATE PROC TTESTPROC TTEST17第17页/共68页配对设计资料t检验的基础理论 在医学研究中,常用配对设计。在医学研究中,常用配对设计。 异源配对异源配对 同源配对同源配对 自身前后设计自身前后设计18第18页/共68页配对设计资料t检验的基础理论 配对配对t t检验的实质同于单样本检验的实质同于单样本t t检验,可将此类资料看成是差值检验,可将此类资料看成是差值 的样本均数所代表的未知总体均数的样本均数所代表的未知总体均数 与与已知总体均数已知总体均数 =0=0的比

19、较,其检验统计量构造如下:的比较,其检验统计量构造如下:1,/0nnSdnSdSdtdddddd019第19页/共68页例题编号编号(1)哥特里罗紫法哥特里罗紫法(2)脂肪酸水解法脂肪酸水解法(3)差值差值d(4)=(2) (3)10.8400.5800.26020.5910.5090.08230.6740.5000.17440.6320.3160.31650.6870.3370.35060.9780.5170.46170.7500.4540.29680.7300.5120.21891.2000.9970.203100.8700.5060.3642.724 两种方法对乳酸饮料中脂肪含量的测定结

20、果两种方法对乳酸饮料中脂肪含量的测定结果(%)(%)20第20页/共68页例题 计算检验统计量计算检验统计量t t: 1)(22 nnddSd1/0 nvnSdtd21第21页/共68页SAS程序 PROC MEANSPROC MEANS PROC UNIVARIATEPROC UNIVARIATE PROC TTESTPROC TTEST22第22页/共68页两独立样本的t检验 在日常工作中,我们经常要比较某两组计量资料的均数间有无显著差别,如研究不同疗法的降压效果或两种不同制剂对杀灭鼠体内钩虫的效果(条数)等。这时假若事先难以找到年龄、性别等条件完全一样的人(或动物)作配对比较,那么不能求

21、每对的差数只能先算出各组的均数,然后进行比较。两组例数可以相等也可稍有出入。检验的方法同样是先假定两组相应的总体均数相等,看两组均数实际相差与此假设是否靠近,近则把相差看成抽样误差表现,远到一定界限则认为由抽样误差造成这样大的相差的可能性实在太小,拒绝假设而接受H1,作出两总体不相等的结论。23第23页/共68页两独立样本t检验的基础理论 两样本两样本t t检验又称成组检验又称成组t t检验,适用于完全随机设计两样本均数的比较,人们所关心的是两样本均数所代表检验,适用于完全随机设计两样本均数的比较,人们所关心的是两样本均数所代表的两总体均数是否不等。两组完全随机设计是将受试对象完全随机分配到两

22、个不同的处理组。的两总体均数是否不等。两组完全随机设计是将受试对象完全随机分配到两个不同的处理组。 当两样本含量较小,且均来自正态总体时,要根据两总体方差是否不同而采用不同的检验方法。当两样本含量较小,且均来自正态总体时,要根据两总体方差是否不同而采用不同的检验方法。24第24页/共68页总体方差相等的t检验 当两总体方差相等,可将两样本方差合并,求两者的共同方差当两总体方差相等,可将两样本方差合并,求两者的共同方差合并方差合并方差 ,两样本,两样本t t检验的检验统计量为检验的检验统计量为2,)()(212121212121nnvSXXSXXtXXXX25第25页/共68页总体方差相等的t检

23、验)11(2)1()1()11(2/)(/)()11(212122221121212122222121212121221nnnnSnSnXXnnnnnXXnXXXXnnSXXtc26第26页/共68页近似t检验 Cochran & CoxCochran & Cox的检验统计量为的检验统计量为tt,因,因tt分布较复杂,故常利用分布较复杂,故常利用t t分布计算其近似临界值。分布计算其近似临界值。 SatterthwaiteSatterthwaite法法 WelchWelch法法1, 1,221122212121 nvnvnSnSXXt27第27页/共68页例题 为了研究新药阿卡波糖胶囊的降血糖

24、效果,某医院用为了研究新药阿卡波糖胶囊的降血糖效果,某医院用4040名名型糖尿病病人进行同期随机对照试验。实验者型糖尿病病人进行同期随机对照试验。实验者将这些病人随机等分到实验组(阿卡波糖胶囊)和对照组(拜唐苹胶囊),分别测得试验开始前和将这些病人随机等分到实验组(阿卡波糖胶囊)和对照组(拜唐苹胶囊),分别测得试验开始前和8 8周后的周后的空腹血糖,算得空腹血糖下降值,能否认为该新药阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同?空腹血糖,算得空腹血糖下降值,能否认为该新药阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同? 28第28页/共68页例题 提出检验假设提出检验假设H0H0与备择假

25、设与备择假设H1H1: H0H0: 1 1=2 2,阿卡波糖胶囊组与拜唐苹胶囊组空腹血糖下降,阿卡波糖胶囊组与拜唐苹胶囊组空腹血糖下降值的总体均数相等;值的总体均数相等; H1H1: 1 12 2,阿卡波糖胶囊组与拜唐苹胶囊组空腹血糖下降,阿卡波糖胶囊组与拜唐苹胶囊组空腹血糖下降值的总体均数不相等;值的总体均数不相等; 定显著性水准定显著性水准 ,并查出临界,并查出临界t t值。现令,值。现令, 计算检验统计量计算检验统计量t t: 实验组空腹血糖下降值均数实验组空腹血糖下降值均数=2.065 mmol/L=2.065 mmol/L,标准差,标准差S S1 1=3.0601 mmol/L=3.

26、0601 mmol/L;对照组空腹血糖下降值均数;对照组空腹血糖下降值均数=2.625 =2.625 mmol/Lmmol/L,标准差,标准差S S2 2;。;。 29第29页/共68页例题 确定确定P P值,作出推断结论:查值,作出推断结论:查t t界值表得界值表得P P,所以检验假设,所以检验假设H H0 0得得以接受,以接受, 无统计学意义。尚不能认为阿卡波糖胶囊组与拜唐苹无统计学意义。尚不能认为阿卡波糖胶囊组与拜唐苹胶囊组空腹血糖下降效果不同。胶囊组空腹血糖下降效果不同。642. 0204205. 20601. 3625. 2065. 2)11(2) 1() 1(22222121212

27、122221121nSSXXnnnnSnSnXXt30第30页/共68页SAS程序 PROC TTESTPROC TTEST Cochran & CoxCochran & Cox SatterthwaiteSatterthwaite WelchWelch31第31页/共68页本章小节 介绍了单样本介绍了单样本t t检验的基础理论,并列举了单样本检验的基础理论,并列举了单样本t t检验分析实例检验分析实例meansmeans、univariateunivariate过程。以过程。以MEANSMEANS过程实现对单变量分布位置的过程实现对单变量分布位置的t t检验检验,只需在只需在PROC MEA

28、NSPROC MEANS语句后添加语句后添加t t和和probtprobt两个选项两个选项,SASSAS即给出样本均数与即给出样本均数与0 0比较的比较的t t检验值和检验值和t t分布曲线下该分布曲线下该t t值对应的双侧尾部面积。值对应的双侧尾部面积。UNIVARIATEUNIVARIATE过程在默认状过程在默认状态下即可给出单变量分布位置的态下即可给出单变量分布位置的t t检验结果。检验结果。 32第32页/共68页本章小节 介绍了配对设计资料介绍了配对设计资料t t检验的基础理论,并列举了配对检验的基础理论,并列举了配对t t检验分检验分析实例析实例meansmeans、univari

29、ateunivariate、ttestttest过程。过程。 最后,本章介绍了两独立样本最后,本章介绍了两独立样本t t检验的基础理论,并列举了独立检验的基础理论,并列举了独立样本样本t t检验分析实例检验分析实例ttestttest过程应用。过程应用。 需要强调的是,需要强调的是,t t检验的应用条件(正态分布和方差齐性),大检验的应用条件(正态分布和方差齐性),大家在采用家在采用t t检验进行数据分析之前,应首先判断数据是否满足检验进行数据分析之前,应首先判断数据是否满足t t检验的条件,然后再进行统计分析。检验的条件,然后再进行统计分析。33第33页/共68页34课后思考题课后思考题 如

30、何做单侧t检验?第34页/共68页蒋红卫蒋红卫第35页/共68页学习目标 了解非参检验的优缺点及应用范围;了解非参检验的优缺点及应用范围; 熟息非参数检验几种基本类型和检验的基本方法;熟息非参数检验几种基本类型和检验的基本方法; 掌握编秩基本步骤,平均秩的计算及相等秩的校正。掌握编秩基本步骤,平均秩的计算及相等秩的校正。 配对及单样本秩和检验;配对及单样本秩和检验; 两组样本比较的秩和检验;两组样本比较的秩和检验; 多组样本比较的秩和检验及两两比较;多组样本比较的秩和检验及两两比较; 等级分组资料的非参数检验;等级分组资料的非参数检验; 随机区组设计资料比较的秩和检验及两两比较。随机区组设计资

31、料比较的秩和检验及两两比较。第36页/共68页概述 比较两个总体间的差异,我们比较熟悉的是可依据总体方差是比较两个总体间的差异,我们比较熟悉的是可依据总体方差是否已知,选择使用正态否已知,选择使用正态Z Z检验或检验或t t检验法。但如果有明显的证据检验法。但如果有明显的证据表明,这些参数型检验法不能使用时又该如何呢?非参数检验表明,这些参数型检验法不能使用时又该如何呢?非参数检验法对此提供了解决方案。法对此提供了解决方案。 作为参数检验的一种推广,非参数检验有何特点?它的使用有作为参数检验的一种推广,非参数检验有何特点?它的使用有什么样的要求?本章首先对非参数检验进行概述,接着按照和什么样的

32、要求?本章首先对非参数检验进行概述,接着按照和参数检验对应的原则分别介绍用于两组比较的非参数检验法、参数检验对应的原则分别介绍用于两组比较的非参数检验法、用于多组比较的非参数检验法以及等级相关检验(秩相关)。用于多组比较的非参数检验法以及等级相关检验(秩相关)。 第37页/共68页概述 参数检验是在已知总体分布的条件下(一般要求总体服从正态参数检验是在已知总体分布的条件下(一般要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验,有时还要求某些总体参数满足一定条件。如等)进行的检验,有时还要求某些总体参数满足

33、一定条件。如独立样本的检验和方差分析不仅要求总体符合正态分布,还独立样本的检验和方差分析不仅要求总体符合正态分布,还要求各总体方差齐性。要求各总体方差齐性。 非参数检验则不考虑总体分布是否已知,常常也不是针对总体非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一般性假设(如总体分布的位置是参数,而是针对总体的某些一般性假设(如总体分布的位置是否相同,总体分布是否正态)进行检验。否相同,总体分布是否正态)进行检验。第38页/共68页概述 非参数检验方法简便,不依赖于总体分布的具体形式因而适用性强,但灵非参数检验方法简便,不依赖于总体分布的具体形式因而适用性强,但灵敏

34、度和精确度不如参数检验。一般而言,非参数检验适用于以下三种情况:敏度和精确度不如参数检验。一般而言,非参数检验适用于以下三种情况:顺序类型的数据资料,这类数据的分布形态一般是未知的;虽然是连顺序类型的数据资料,这类数据的分布形态一般是未知的;虽然是连续数据,但总体分布形态未知或者非正态,这和卡方检验一样,称自由分续数据,但总体分布形态未知或者非正态,这和卡方检验一样,称自由分布检验;总体分布虽然正态,数据也是连续类型,但样本容量极小,如布检验;总体分布虽然正态,数据也是连续类型,但样本容量极小,如1010以下(虽然检验被称为小样本统计方法,但样本容量太小时,代表以下(虽然检验被称为小样本统计方

35、法,但样本容量太小时,代表性毕竟很差,最好不要用要求较严格的参数检验法)。因为这些特点,加性毕竟很差,最好不要用要求较严格的参数检验法)。因为这些特点,加上非参数检验法一般原理和计算比较简单,因此常用于一些为正式研究进上非参数检验法一般原理和计算比较简单,因此常用于一些为正式研究进行探路的预备性研究的数据统计中。当然,由于非参数检验许多牵涉不到行探路的预备性研究的数据统计中。当然,由于非参数检验许多牵涉不到参数计算,对数据中的信息利用不够,因而其统计检验力相对参数检验也参数计算,对数据中的信息利用不够,因而其统计检验力相对参数检验也差得多。差得多。第39页/共68页单组资料的符号及符号秩和检验

36、 单样本资料与已知总体符号秩和检验的检验步骤如下:单样本资料与已知总体符号秩和检验的检验步骤如下: 求差值:求样本资料中单个个体数据与总体中位数的差值。求差值:求样本资料中单个个体数据与总体中位数的差值。 检验假设检验假设 H0H0:差值的总体中位数等于零,即:差值的总体中位数等于零,即 H1H1:差值的总体中位数不等于零,即:差值的总体中位数不等于零,即 编秩按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号。编秩按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号。编秩时,若差值为编秩时,若差值为0 0,舍去不计;若差值的绝对值相等,这时取平均秩次。,舍去不计;若差值的绝对值

37、相等,这时取平均秩次。 求秩和,并确定统计量求秩和,并确定统计量T T将所排的秩次冠以原差数的符号,分别求出正、将所排的秩次冠以原差数的符号,分别求出正、负差值秩次之和,分别以负差值秩次之和,分别以T T+ +和和 T T- -表示。表示。0dM0dM第40页/共68页单组资料的符号及符号秩和检验编秩按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号。编秩时,若差值为编秩按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号。编秩时,若差值为0 0,舍去不,舍去不计;若差值的绝对值相等,这时取平均秩次。计;若差值的绝对值相等,这时取平均秩次。求秩和,并确定统计量求秩和,并确定统计量

38、T T将所排的秩次冠以原差数的符号,分别求出正、负差值秩次之和,分别以将所排的秩次冠以原差数的符号,分别求出正、负差值秩次之和,分别以T T+ +和和 T T- -表示。表示。第41页/共68页单组资料的符号及符号秩和检验 在在HH0 0成立时,如果当观察例数比较多,正差值的秩和与负差值成立时,如果当观察例数比较多,正差值的秩和与负差值的秩和理论上应相等,即使有些差别,也只能是一些随机因素的秩和理论上应相等,即使有些差别,也只能是一些随机因素造成的。换句话说,如果造成的。换句话说,如果HH0 0成立,一份随机样本中成立,一份随机样本中“不太可能不太可能”出现正差值的秩和与负差值的秩和相差悬殊的

39、情形;如果样本出现正差值的秩和与负差值的秩和相差悬殊的情形;如果样本的正差值的秩和与负差值的秩和差别太大,我们有理由拒绝的正差值的秩和与负差值的秩和差别太大,我们有理由拒绝H H0 0,接受接受HH1 1,即认为两种处理效应不同;反之,没有理由拒绝,即认为两种处理效应不同;反之,没有理由拒绝H H0 0,还不能认为两种处理效应不同。还不能认为两种处理效应不同。第42页/共68页单组资料的符号及符号秩和检验双侧检验时,以绝对值较小者为统计量双侧检验时,以绝对值较小者为统计量T T值,即值,即T T=min(=min(T T+,+,T T-) -);单侧检验时,任取正差值的秩和或负差值的;单侧检验

40、时,任取正差值的秩和或负差值的秩和为统计量秩和为统计量T T。记正、负差值的总个数为。记正、负差值的总个数为n n (即(即n n为差值不为差值不等于等于0 0的对子数),则的对子数),则T T+ +与与T T- -之和为之和为n(n+1)/2n(n+1)/2。确定确定P P值和作出推断结论值和作出推断结论查表法(时)查查表法(时)查T T界值表,若检验统计量界值表,若检验统计量T T值在上、下界值范值在上、下界值范围内,其围内,其P P值大于相应的概率水平;若值大于相应的概率水平;若T T值在上、下界值上或值在上、下界值上或范围外,则范围外,则P P值小于相应的概率水平。值小于相应的概率水平

41、。第43页/共68页单组资料的符号及符号秩和检验 正态近似法(正态近似法(n n5050时)这时可利用秩和分布的正态近似法作出判断。已知时)这时可利用秩和分布的正态近似法作出判断。已知HH0 0成立时,近似地有成立时,近似地有 其中,其中, 统计量的计算公式为:统计量的计算公式为:),(2TTNT第44页/共68页例题单样本 已知某地正常人尿氟含量的中位数为已知某地正常人尿氟含量的中位数为45.30 45.30 。今在该地某厂随机抽取。今在该地某厂随机抽取1212名工人,测得尿氟含量。问该厂工名工人,测得尿氟含量。问该厂工人的尿氟含量是否高于当地正常人的尿氟含量?人的尿氟含量是否高于当地正常人

42、的尿氟含量?第45页/共68页配对设计资料的非参数检验 配对设计有两种情况:一种是同对的两个受试对象分别给予两配对设计有两种情况:一种是同对的两个受试对象分别给予两种处理,目的是推断两种处理的效果有无差别。如取同窝别、种处理,目的是推断两种处理的效果有无差别。如取同窝别、体重相近的体重相近的2 2只动物配对。临床试验疗效比较时,常将病种、病只动物配对。临床试验疗效比较时,常将病种、病型、病情及其它影响疗效的主要因素一致的病人配成对子,以型、病情及其它影响疗效的主要因素一致的病人配成对子,以构成配对的研究样本。另一种是同一受试对象处理前后的比较,构成配对的研究样本。另一种是同一受试对象处理前后的

43、比较,目的是推断该处理有无作用。例如观察某指标的变化,用同一目的是推断该处理有无作用。例如观察某指标的变化,用同一组病人治疗前后作比较;用同一批动物处理前后作比较;或用组病人治疗前后作比较;用同一批动物处理前后作比较;或用同一批受试对象的不同部位、不同器官作比较等,也属于配比同一批受试对象的不同部位、不同器官作比较等,也属于配比试验。试验。第46页/共68页配对设计资料的非参数检验 配对设计资料一般采用配对配对设计资料一般采用配对t t检验方法进行分析,但若配对数据差数的分布非正态分布,但其总体分布基本检验方法进行分析,但若配对数据差数的分布非正态分布,但其总体分布基本对称,则可采用符号秩检验

44、作为配对对称,则可采用符号秩检验作为配对t t检验的替代方法。符号秩检验功效很高,在数据满足配对检验的替代方法。符号秩检验功效很高,在数据满足配对t t检验的要检验的要求时,符号秩检验的功效可达配对求时,符号秩检验的功效可达配对t t检验功效的检验功效的95%95%。第47页/共68页配对设计资料的非参数检验配对设计资料的检验步骤为:配对设计资料的检验步骤为:求差值求各对数据求差值求各对数据 的差值的差值 ;检验假设检验假设H H0 0:差值的总体中位数等于零,即:差值的总体中位数等于零,即 H H1 1:差值的总体中位数不等于零,即:差值的总体中位数不等于零,即编秩按差值的绝对值由小到大编秩

45、,并按差值的正负给秩次加上正负号。编秩按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号。编秩时,若差值为编秩时,若差值为0 0,舍去不计;若差值的绝对值相等,取平均秩次。,舍去不计;若差值的绝对值相等,取平均秩次。求秩和并确定统计量求秩和并确定统计量T T将所排的秩次冠以原差数的符号,分别求出正、将所排的秩次冠以原差数的符号,分别求出正、负差值秩次之和,分别以负差值秩次之和,分别以T T+ +和和 T T- -表示。表示。),(iiyxiiyxd0dM0dM第48页/共68页配对设计资料的非参数检验 在在HH0 0成立时,如果当观察例数比较多,正差值的秩和与负差值成立时,如果当观察例

46、数比较多,正差值的秩和与负差值的秩和理论上应相等,即使有些差别,也只能是一些随机因素的秩和理论上应相等,即使有些差别,也只能是一些随机因素造成的。换句话说,如果造成的。换句话说,如果HH0 0成立,一份随机样本中成立,一份随机样本中“不太可能不太可能“出现正差值的秩和与负差值的秩和相差悬殊的情形;如果样出现正差值的秩和与负差值的秩和相差悬殊的情形;如果样本的正差值的秩和与负差值的秩和差别太大,我们有理由拒绝本的正差值的秩和与负差值的秩和差别太大,我们有理由拒绝HH0 0,接受,接受HH1 1,即认为两种处理效应不同;反之,没有理由拒绝,即认为两种处理效应不同;反之,没有理由拒绝HH0 0,还不

47、能认为两种处理效应不同。,还不能认为两种处理效应不同。第49页/共68页配对设计资料的非参数检验统计量统计量双侧检验时,以绝对值较小者为统计量双侧检验时,以绝对值较小者为统计量T T值,即值,即T T=min(=min(T T+ +,T T-) -);单侧检验时,任取正差值的秩和或负;单侧检验时,任取正差值的秩和或负差值的秩和为统计量差值的秩和为统计量T T。记正、负差值的总个数为。记正、负差值的总个数为n n (即(即n n为差值不等于为差值不等于0 0的对子数),则的对子数),则T T+ +与与T T- -之和之和为为n(n+1)/2n(n+1)/2。确定确定P P值和作出推断结论。值和作

48、出推断结论。第50页/共68页例题配对设计 对对1212份血清分别用原方法(检测时间份血清分别用原方法(检测时间2020分钟)和新方法(检测时间分钟)和新方法(检测时间1010分钟)测谷分钟)测谷- -丙转氨酶。问两法所得丙转氨酶。问两法所得结果有无差别?结果有无差别?第51页/共68页成组设计资料的非参数检验 WilcoxonWilcoxon秩和检验,用于推断计量资料或等级资料的两个样本所来自的秩和检验,用于推断计量资料或等级资料的两个样本所来自的两个总体分布是否有差别。在理论上假设两个总体分布是否有差别。在理论上假设H0H0应为两个总体分布相同,即应为两个总体分布相同,即两个样本来自同一总

49、体。由于秩和检验对于两个总体分布的形状差别不敏两个样本来自同一总体。由于秩和检验对于两个总体分布的形状差别不敏感,对于位置相同、形状不同但类似的两个总体分布,推断不出两个总体感,对于位置相同、形状不同但类似的两个总体分布,推断不出两个总体分布有差别,故对立的备择假设分布有差别,故对立的备择假设H1H1不能认为两个总体分布不同,而只能不能认为两个总体分布不同,而只能为两个总体分布位置不同。为两个总体分布位置不同。 不管两个总体分布的形状有无差别,秩和检验的目的是推断两个总体分布不管两个总体分布的形状有无差别,秩和检验的目的是推断两个总体分布的位置是否有差别,这正是实践中所需要的,如要推断两个不同

50、人群的某的位置是否有差别,这正是实践中所需要的,如要推断两个不同人群的某项指标值的大小是否有差别或哪个人群的大,可用其指标值分布的位置差项指标值的大小是否有差别或哪个人群的大,可用其指标值分布的位置差别反映,而不关心其指标值分布的形状有无差别。别反映,而不关心其指标值分布的形状有无差别。第52页/共68页成组设计资料的非参数检验 求检验统计量求检验统计量T T值:把两样本数据混合从小到大编秩,遇数据相等者取值:把两样本数据混合从小到大编秩,遇数据相等者取平均秩;以样本例数小者为平均秩;以样本例数小者为n1n1,其秩和(,其秩和(T1T1)为)为T T,若样本例数相等,若样本例数相等,可取任一样

51、本的秩和(可取任一样本的秩和(T1T1或或T2T2)为)为T T。 确定确定P P值,作出推断结论:当值,作出推断结论:当n110n110和和n2- n110n2- n110时,查时,查T T界值表。若界值表。若T T值在界值范围内,其值在界值范围内,其P P值大于相应概率水平;若值大于相应概率水平;若T T值刚好等于界值,其值刚好等于界值,其P P值等于相应概率水平;若值等于相应概率水平;若T T值在界值范围外,其值在界值范围外,其P P值小于相应概率水平。值小于相应概率水平。 若若n110n110或者或者n2- n110n2- n110,超出界值表的范围,可用正态近似法作检验,超出界值表的

52、范围,可用正态近似法作检验,令令n1n1n2=Nn2=N,按下式计算值。,按下式计算值。 )(1 (12) 1(2/ ) 1(33211NNttNnnNnTjj第53页/共68页成组设计资料非参数检验的SAS程序 SASSAS中对于非参数分析方法功能的实现主要由中对于非参数分析方法功能的实现主要由npar1waynpar1way过程来完成,过程来完成,npar1waynpar1way过程属于过程属于SASSAS的的STATSTAT模块,对于统计学上所涉及的非参数统模块,对于统计学上所涉及的非参数统计方法几乎都可以通过此过程完成。计方法几乎都可以通过此过程完成。Npar1wayNpar1way过

53、程的基本语句格式如下:过程的基本语句格式如下: PROC NPAR1WAYPROC NPAR1WAY ; ; BYBY 变量名变量名; ; CLASSCLASS变量名变量名; ; EXACTEXACT 统计量选项统计量选项 / ; FREQFREQ变量名变量名; ; OUTPUTOUTPUT OUT= ; ; VARVAR 变量名变量名; ; RUN;RUN;第54页/共68页成组设计资料非参数检验的SAS程序 DATA=DATA=数据集名:指定要进行分析的数据集;数据集名:指定要进行分析的数据集; MEDIANMEDIAN:运用中位数评分进行分析,即进行中位数检验:运用中位数评分进行分析,即

54、进行中位数检验 NOPRINTNOPRINT:禁止所有的输出,用在仅需要创建输出数据集时;:禁止所有的输出,用在仅需要创建输出数据集时; STST:运用:运用Siegel-TukeySiegel-Tukey评分进行分析;评分进行分析; ANOVAANOVA:对原始数据进行方差分析;:对原始数据进行方差分析; EDFEDF:要求计算基于经验分布的统计量;:要求计算基于经验分布的统计量; MISSINGMISSING:指定分组变量的缺失值为一有效的分组水平;:指定分组变量的缺失值为一有效的分组水平; SAVAGESAVAGE:运用:运用SavageSavage评分进行分析;评分进行分析; VWVW

55、:运用:运用Van der WaerdenVan der Waerden评分进行分析计算;评分进行分析计算;第55页/共68页成组设计资料非参数检验的SAS程序 CORRECT=NOCORRECT=NO:在两样本时,禁止:在两样本时,禁止WilcoxonWilcoxon和和Siegel-Siegel-TukeyTukey检验的连续性校正过程;检验的连续性校正过程; KLOTZKLOTZ:运用:运用KlotzKlotz评分进行分析;评分进行分析; MOODMOOD:运用:运用MoodMood评分进行分析;评分进行分析; SCORES=DATASCORES=DATA:以原始数据为评分值进行分析;:

56、以原始数据为评分值进行分析; WILCOXONWILCOXON:对两样本进行:对两样本进行WilcoxonWilcoxon秩和检验,对多样本进秩和检验,对多样本进行行Kruskal-WallisKruskal-Wallis检验;检验; exactexact语句:要求语句:要求SASSAS对指定的统计量(选项)进行精确概率的对指定的统计量(选项)进行精确概率的计算。其后的统计量选项可为以下项目,分别对应相应的统计计算。其后的统计量选项可为以下项目,分别对应相应的统计计算方式。计算方式。第56页/共68页成组设计资料非参数检验的SAS程序 ABAB,KLOTZKLOTZ,KSKS,MEDIANME

57、DIAN,MOODMOOD,SAVAGESAVAGE,SCORES=DATASCORES=DATA,STST,WILCOXONWILCOXON,VWVW等。等。 运算选项为精确概率的计算过程指定一些控制项目,如选项运算选项为精确概率的计算过程指定一些控制项目,如选项“mc”mc”要求要求以以Monte CarloMonte Carlo方法计算精确概率。方法计算精确概率。 outputoutput语句:与其它过程中相应的语句大同小异,不同之处在于语句最语句:与其它过程中相应的语句大同小异,不同之处在于语句最后的选项。此处的选项绝大多数包括在表中,指定在输出数据集中包含所后的选项。此处的选项绝大多

58、数包括在表中,指定在输出数据集中包含所指定项目所对应的统计量。指定项目所对应的统计量。 varvar语句:与其它过程的也基本相同,用以指定要进行分析的变量,变量语句:与其它过程的也基本相同,用以指定要进行分析的变量,变量必须为数值型。若省略此语句,必须为数值型。若省略此语句,SASSAS将对除将对除byby语句、语句、classclass语句以及语句以及freqfreq语句中指定的变量之外的所有数值型变量进行分析。语句中指定的变量之外的所有数值型变量进行分析。第57页/共68页例题成组设计 对对1010例肺癌病人和例肺癌病人和1212例矽肺例矽肺0 0期工人用期工人用X X光片测量肺门横径右侧

59、距光片测量肺门横径右侧距RDRD值(值(cmcm。问肺癌病人的。问肺癌病人的RDRD值是否高值是否高于矽肺于矽肺0 0期工人的期工人的RDRD值?值?第58页/共68页例题两组等级资料 3939名吸烟工人和名吸烟工人和4040名不吸烟工人的碳氧血红蛋白名不吸烟工人的碳氧血红蛋白HbCO(%)HbCO(%)含量。问吸烟工人的含量。问吸烟工人的HbCO(%)HbCO(%)含量是否高于含量是否高于不吸烟工人的不吸烟工人的HbCO(%)HbCO(%)含量?含量?第59页/共68页完全随机设计资料的非参数检验 这一部分的内容相当于参数检验中的方差分析,依据的方法是这一部分的内容相当于参数检验中的方差分析

60、,依据的方法是Kruskal-Kruskal-WallisWallis秩和检验,此方法的基本思想与秩和检验,此方法的基本思想与WilcoxonWilcoxon秩和检验基本相同,都秩和检验基本相同,都是基于各组混合编秩后,各组秩和应相等的假设。两者的不同点就在于是基于各组混合编秩后,各组秩和应相等的假设。两者的不同点就在于Kruskal-WallisKruskal-Wallis秩和检验是针对多组数据的分析,而秩和检验是针对多组数据的分析,而WilcoxonWilcoxon秩和检秩和检验则只用于对两组数据的比较。验则只用于对两组数据的比较。 Kruskal-Wallis HKruskal-Wall

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论