SAS的非参数检验(正式).ppt_第1页
SAS的非参数检验(正式).ppt_第2页
SAS的非参数检验(正式).ppt_第3页
SAS的非参数检验(正式).ppt_第4页
SAS的非参数检验(正式).ppt_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、非参数检验,SAS应用,学习目标,了解非参检验的优缺点及应用范围; 熟息非参数检验几种基本类型和检验的基本方法; 掌握编秩基本步骤,平均秩的计算及相等秩的校正。 配对及单样本秩和检验; 两组样本比较的秩和检验; 多组样本比较的秩和检验及两两比较; 等级分组资料的非参数检验; 随机区组设计资料比较的秩和检验及两两比较。,概述,比较两个总体间的差异,我们比较熟悉的是可依据总体方差是否已知,选择使用正态Z检验或t检验法。但如果有明显的证据表明,这些参数型检验法不能使用时又该如何呢?非参数检验法对此提供了解决方案。 作为参数检验的一种推广,非参数检验有何特点?它的使用有什么样的要求?本章首先对非参数检

2、验进行概述,接着按照和参数检验对应的原则分别介绍用于两组比较的非参数检验法、用于多组比较的非参数检验法以及等级相关检验(秩相关)。,概述,参数检验是在已知总体分布的条件下(一般要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验,有时还要求某些总体参数满足一定条件。如独立样本的检验和方差分析不仅要求总体符合正态分布,还要求各总体方差齐性。 非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一般性假设(如总体分布的位置是否相同,总体分布是否正态)进行检验。,概述,非参数检验方法简便,不依赖于总体分布的具体形式因而适用性强,但灵敏度和精确

3、度不如参数检验。一般而言,非参数检验适用于以下三种情况:顺序类型的数据资料,这类数据的分布形态一般是未知的;虽然是连续数据,但总体分布形态未知或者非正态,这和卡方检验一样,称自由分布检验;总体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下(虽然检验被称为小样本统计方法,但样本容量太小时,代表性毕竟很差,最好不要用要求较严格的参数检验法)。因为这些特点,加上非参数检验法一般原理和计算比较简单,因此常用于一些为正式研究进行探路的预备性研究的数据统计中。当然,由于非参数检验许多牵涉不到参数计算,对数据中的信息利用不够,因而其统计检验力相对参数检验也差得多。,单组资料的符号及符号秩和检验,

4、单样本资料与已知总体符号秩和检验的检验步骤如下: 求差值:求样本资料中单个个体数据与总体中位数的差值。 检验假设 H0:差值的总体中位数等于零,即 H1:差值的总体中位数不等于零,即 编秩按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号。编秩时,若差值为0,舍去不计;若差值的绝对值相等,这时取平均秩次。 求秩和,并确定统计量T将所排的秩次冠以原差数的符号,分别求出正、负差值秩次之和,分别以T+和 T-表示。,单组资料的符号及符号秩和检验,编秩按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号。编秩时,若差值为0,舍去不计;若差值的绝对值相等,这时取平均秩次。 求秩和,并确定统

5、计量T将所排的秩次冠以原差数的符号,分别求出正、负差值秩次之和,分别以T+和 T-表示。,单组资料的符号及符号秩和检验,在H0成立时,如果当观察例数比较多,正差值的秩和与负差值的秩和理论上应相等,即使有些差别,也只能是一些随机因素造成的。换句话说,如果H0成立,一份随机样本中“不太可能”出现正差值的秩和与负差值的秩和相差悬殊的情形;如果样本的正差值的秩和与负差值的秩和差别太大,我们有理由拒绝H0,接受H1,即认为两种处理效应不同;反之,没有理由拒绝H0,还不能认为两种处理效应不同。,单组资料的符号及符号秩和检验,双侧检验时,以绝对值较小者为统计量T值,即T=min(T+,T-);单侧检验时,任

6、取正差值的秩和或负差值的秩和为统计量T。记正、负差值的总个数为n (即n为差值不等于0的对子数),则T+与T-之和为n(n+1)/2。 确定P值和作出推断结论 查表法(时)查T界值表,若检验统计量T值在上、下界值范围内,其P值大于相应的概率水平;若T值在上、下界值上或范围外,则P值小于相应的概率水平。,单组资料的符号及符号秩和检验,正态近似法(n50时)这时可利用秩和分布的正态近似法作出判断。已知H0成立时,近似地有 其中, 统计量的计算公式为:,例题单样本,已知某地正常人尿氟含量的中位数为45.30 。今在该地某厂随机抽取12名工人,测得尿氟含量。问该厂工人的尿氟含量是否高于当地正常人的尿氟

7、含量?,配对设计资料的非参数检验,配对设计有两种情况:一种是同对的两个受试对象分别给予两种处理,目的是推断两种处理的效果有无差别。如取同窝别、体重相近的2只动物配对。临床试验疗效比较时,常将病种、病型、病情及其它影响疗效的主要因素一致的病人配成对子,以构成配对的研究样本。另一种是同一受试对象处理前后的比较,目的是推断该处理有无作用。例如观察某指标的变化,用同一组病人治疗前后作比较;用同一批动物处理前后作比较;或用同一批受试对象的不同部位、不同器官作比较等,也属于配比试验。,配对设计资料的非参数检验,配对设计资料一般采用配对t检验方法进行分析,但若配对数据差数的分布非正态分布,但其总体分布基本对

8、称,则可采用符号秩检验作为配对t检验的替代方法。符号秩检验功效很高,在数据满足配对t检验的要求时,符号秩检验的功效可达配对t检验功效的95%。,配对设计资料的非参数检验,配对设计资料的检验步骤为: 求差值求各对数据 的差值 ; 检验假设 H0:差值的总体中位数等于零,即 H1:差值的总体中位数不等于零,即 编秩按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号。编秩时,若差值为0,舍去不计;若差值的绝对值相等,取平均秩次。 求秩和并确定统计量T将所排的秩次冠以原差数的符号,分别求出正、负差值秩次之和,分别以T+和 T-表示。,配对设计资料的非参数检验,在H0成立时,如果当观察例数比较多

9、,正差值的秩和与负差值的秩和理论上应相等,即使有些差别,也只能是一些随机因素造成的。换句话说,如果H0成立,一份随机样本中“不太可能“出现正差值的秩和与负差值的秩和相差悬殊的情形;如果样本的正差值的秩和与负差值的秩和差别太大,我们有理由拒绝H0,接受H1,即认为两种处理效应不同;反之,没有理由拒绝H0,还不能认为两种处理效应不同。,配对设计资料的非参数检验,统计量 双侧检验时,以绝对值较小者为统计量T值,即T=min(T+,T-);单侧检验时,任取正差值的秩和或负差值的秩和为统计量T。记正、负差值的总个数为n (即n为差值不等于0的对子数),则T+与T-之和为n(n+1)/2。 确定P值和作出

10、推断结论。,例题配对设计,对12份血清分别用原方法(检测时间20分钟)和新方法(检测时间10分钟)测谷-丙转氨酶。问两法所得结果有无差别?,成组设计资料的非参数检验,Wilcoxon秩和检验,用于推断计量资料或等级资料的两个样本所来自的两个总体分布是否有差别。在理论上假设H0应为两个总体分布相同,即两个样本来自同一总体。由于秩和检验对于两个总体分布的形状差别不敏感,对于位置相同、形状不同但类似的两个总体分布,推断不出两个总体分布有差别,故对立的备择假设H1不能认为两个总体分布不同,而只能为两个总体分布位置不同。 不管两个总体分布的形状有无差别,秩和检验的目的是推断两个总体分布的位置是否有差别,

11、这正是实践中所需要的,如要推断两个不同人群的某项指标值的大小是否有差别或哪个人群的大,可用其指标值分布的位置差别反映,而不关心其指标值分布的形状有无差别。,成组设计资料的非参数检验,求检验统计量T值:把两样本数据混合从小到大编秩,遇数据相等者取平均秩;以样本例数小者为n1,其秩和(T1)为T,若样本例数相等,可取任一样本的秩和(T1或T2)为T。 确定P值,作出推断结论:当n110和n2- n110时,查T界值表。若T值在界值范围内,其P值大于相应概率水平;若T值刚好等于界值,其P值等于相应概率水平;若T值在界值范围外,其P值小于相应概率水平。 若n110或者n2- n110,超出界值表的范围

12、,可用正态近似法作检验,令n1n2=N,按下式计算值。,成组设计资料非参数检验的SAS程序,SAS中对于非参数分析方法功能的实现主要由npar1way过程来完成,npar1way过程属于SAS的STAT模块,对于统计学上所涉及的非参数统计方法几乎都可以通过此过程完成。Npar1way过程的基本语句格式如下: PROC NPAR1WAY ; BY 变量名; CLASS变量名; EXACT 统计量选项 ; FREQ变量名; OUTPUT ; VAR 变量名; RUN;,成组设计资料非参数检验的SAS程序,DATA=数据集名:指定要进行分析的数据集; MEDIAN:运用中位数评分进行分析,即进行中位

13、数检验 NOPRINT:禁止所有的输出,用在仅需要创建输出数据集时; ST:运用Siegel-Tukey评分进行分析; ANOVA:对原始数据进行方差分析; EDF:要求计算基于经验分布的统计量; MISSING:指定分组变量的缺失值为一有效的分组水平; SAVAGE:运用Savage评分进行分析; VW:运用Van der Waerden评分进行分析计算;,成组设计资料非参数检验的SAS程序,CORRECT=NO:在两样本时,禁止Wilcoxon和Siegel-Tukey检验的连续性校正过程; KLOTZ:运用Klotz评分进行分析; MOOD:运用Mood评分进行分析; SCORES=DA

14、TA:以原始数据为评分值进行分析; WILCOXON:对两样本进行Wilcoxon秩和检验,对多样本进行Kruskal-Wallis检验; exact语句:要求SAS对指定的统计量(选项)进行精确概率的计算。其后的统计量选项可为以下项目,分别对应相应的统计计算方式。,成组设计资料非参数检验的SAS程序,AB,KLOTZ,KS,MEDIAN,MOOD,SAVAGE,SCORES=DATA,ST,WILCOXON,VW等。 运算选项为精确概率的计算过程指定一些控制项目,如选项“mc”要求以Monte Carlo方法计算精确概率。 output语句:与其它过程中相应的语句大同小异,不同之处在于语句最

15、后的选项。此处的选项绝大多数包括在表6.1中,指定在输出数据集中包含所指定项目所对应的统计量。 var语句:与其它过程的也基本相同,用以指定要进行分析的变量,变量必须为数值型。若省略此语句,SAS将对除by语句、class语句以及freq语句中指定的变量之外的所有数值型变量进行分析。,例题成组设计,对10例肺癌病人和12例矽肺0期工人用X光片测量肺门横径右侧距RD值(cm。问肺癌病人的RD值是否高于矽肺0期工人的RD值?,例题两组等级资料,39名吸烟工人和40名不吸烟工人的碳氧血红蛋白HbCO(%)含量。问吸烟工人的HbCO(%)含量是否高于不吸烟工人的HbCO(%)含量?,完全随机设计资料的

16、非参数检验,这一部分的内容相当于参数检验中的方差分析,依据的方法是Kruskal-Wallis秩和检验,此方法的基本思想与Wilcoxon秩和检验基本相同,都是基于各组混合编秩后,各组秩和应相等的假设。两者的不同点就在于Kruskal-Wallis秩和检验是针对多组数据的分析,而Wilcoxon秩和检验则只用于对两组数据的比较。 Kruskal-Wallis H检验,用于推断计量资料或等级资料的多个独立性样本所来自的多个总体分布是否有差别。在理论上检验假设H0应为多个总体分布相同,即多个样本来自同一总体。由于H检验多个总体分布的形状差别不敏感,故在实际应用中检验假设H0可写作多个总体分布位置相

17、同。对立的备择假设H1为多个总体分布位置不全相同。,例题完全随机设计,用三种药物杀灭钉螺,每批用200只活钉螺,用药后清点每批钉螺的死亡数、再计算死亡率(%)。问三种药物杀灭钉螺的效果有无差别?,例题完全随机设计(等级),四种疾病患者痰液内嗜酸性白细胞的检查结果。问四种疾病患者痰液内的嗜酸性白细胞有无差别?,随机区组设计资料的非参数检验,这一部分的内容相当于参数检验中的方差分析,依据的方法是Friedman秩和检验,此方法的基本思想与Wilcoxon秩和检验基本相同,都是基于各组混合编秩后,各组秩和应相等的假设。两者的不同点就在于Friedman秩和检验是针对随机区组数据的分析,而Wilcox

18、on秩和检验则只用于对两组数据的比较。 Friedman M检验,用于推断计量资料或等级资料的多个独立性样本所来自的多个总体分布是否有差别。在理论上检验假设H0应为多个总体分布相同,即多个样本来自同一总体。由于M检验多个总体分布的形状差别不敏感,故在实际应用中检验假设H0可写作多个总体分布位置相同。对立的备择假设H1为多个总体分布位置不全相同。,例题随机区组设计,8名受试对象在相同实验条件下分别接受4种不同频率声音的刺激,他们的反应率(%)。问4种频率声音刺激的反应率是否有差别?,本章小节,非参数检验方法简便,不依赖于总体分布的具体形式因而适用性强,但灵敏度和精确度不如参数检验。一般而言,非参

19、数检验适用于以下三种情况:顺序类型的数据资料,这类数据的分布形态一般是未知的;虽然是连续数据,但总体分布形态未知或者非正态,这和卡方检验一样,称自由分布检验;总体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下(虽然检验被称为小样本统计方法,但样本容量太小时,代表性毕竟很差,最好不要用要求较严格的参数检验法)。因为这些特点,加上非参数检验法一般原理和计算比较简单,因此常用于一些为正式研究进行探路的预备性研究的数据统计中。当然,由于非参数检验许多牵涉不到参数计算,对数据中的信息利用不够,因而其统计检验力相对参数检验也差得多。,本章小节,本章介绍了编秩的基本步骤,平均秩的计算及相等秩的校

20、正,详细讲解了非参数检验的几种基本类型和检验的基本方法,包括配对及单样本秩和检验、两组样本比较的秩和检验、多组样本比较的秩和检验、等级分组资料的非参数检验和随机区组设计资料比较的秩和检验。我们在学习的过程中掌握各种资料的编秩以及秩和检验方法。,卡方检验,SAS应用,蒋红卫 Email: JHWCCC21CN.COM,学习目标,掌握四格表普通卡方检验和配对卡方检验方法以及相应的SAS程序; 了解FREQ过程语句格式; 熟悉RC表资料的分类类型以及相应的统计检验方法; 掌握双向无序RC表资料检验以及SAS程序; 掌握单向有序RC表资料检验以及SAS程序; 掌握趋势卡方检验方法以及SAS程序; 掌握

21、分层RC表的分析以及SAS程序;,概述,前面已介绍了两个率比较的检验,在观察例数不够大或拟对多个率进行比较时,检验就不适宜了,因为直接对多个样本率作两两间的检验有可能增加第一类误差。2检验可解决此类问题。 卡方检验是用途很广的一种假设检验方法,这里我们主要学习它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。,四格表资料,定性指标分为有序的(如:疗效分为“治愈、显效、好转、无效、死亡”)和名义的(如:血型分为“O、A、B、AB”型)类,对于每个受试者来说,有序指标的观测结果只能是该有序指标若干等级中的级(如某人的疗效

22、为“显效”);名义指标的观测结果只能是该名义指标若干标志中的个(如某人的血型为型),显然,无法像处理定量指标那样去直接分析定性指标,故这类资料常被整理成列联表的形式后再进行分析。 当表中只有个定性指标时,称为维列联表;有个或个以上定性指标时,称为多维列联表。常用R、C表示维列联表的行数和列数,并称为RC表;当R=C=时,称为表(或四格表)。表看起来很简单,但根据资料所具备的条件有许多不同的处理方法。,四格表卡方检验的SAS程序,在SAS/STAT模块中FREQ、TABULATE和SUMMARY等过程可用于分类资料的统计描述,其中FREQ过程兼具统计描述和统计推断的功能,对分类变量计算频数分布,

23、产生从一维到n维的频数表和列联表;对于二维表,可进行2检验,对于三维表,可作Mentel-Hanszel分层分析。FREQ过程是SAS用于分析分类资料的一个常用过程。本节将先向大家介绍FREQ过程的语句及其格式。 FREQ过程的语句基本格式如下: Proc freq data= order= ; Table 分类变量*分类变量/ ; Weight 变量; Run;,四格表卡方检验的SAS程序,DATA数据集:规定PROC FREQ语句使用的数据集; ORDERFREQ,按频数递减顺序排列;ORDERDATA,按数据集中出现的顺序排列;ORDERINTERNAL,按内部值排列(缺省);ORDER

24、FORMATTED,按外部格式值排列; Table语句指定构成表格的变量和表格结构。表格的结构由变量个数和变量排列顺序决定,一个table语句允许列出多个表格结构。PROC FREQ过程中可有多条TABLES语句,TABLES语句后可接多个表格请求式,每个请求式可包含任何数量的变量,从而得到所需的表格。,四格表卡方检验的SAS程序,如果TABLES语句缺省,则FREQ过程对数据集中的所有变量都给出相应的一维频数表。不规定任何选项时,若需某变量的一维频数,FREQ给出该变量每一水平的频数、累积频数、频数的百分比和累积百分比;若需二维频数表,FREQ产生交叉分组列表,即包括各格的频数、总频数的格百

25、分数、行频数的格百分数和列频数的格百分数。 请求式由一个或多个用“*”连接起来的变量名组成。几个变量可放在括号中,如: TABLES A*(B C);等价于TABLES A*B A*C; TABLES (A-C)*D;等价于TABLES A*D B*D C*D;,四格表卡方检验的SAS程序,下列选项可用于TABLES语句中“/”的后面: OUT数据集:建立一个包含变量值和频数计数的输出数据集。如果TABLES语句中不止一个请求式,数据集的内容相应于TABLES语句中最后一个请求。 CHISQ对每层作c2检验,包括Pearson c2、似然比c2和Mantel-Haenszel c2。此外还给出

26、与c2检验有关的关联指标包括Phi系数、列联系数和Cramers V。对于22表,给出Fisher精确概率。 AGREE 进行配对c 2检验。 EXACT 对大于22的列联表计算Fisher精确概率。同时也给出CHISQ选项的全部统计量。,四格表卡方检验的SAS程序,MEASURES对每层的二维表计算一系列关联指标及相应的标准误,包括Pearson和Spearman相关系数,以及Gamma和Kendall系数等。对于22表,还给出常用的危险度指标及其标准误。 CMH 给出Cochran-Mantel-Haenszel统计量,可检验在调整了TABLES语句中其它变量后,行变量与列变量之间的关联程

27、度。对于22表,FREQ过程给出相对危险度估计及其可信区间,还给出各层关联度指标是否齐性的Breslow检验。 ALL 给出CHISQ、MEASURES、CMH所请求的全部统计量。 ALPHAp给出检验水准。缺省为0.05。,四格表卡方检验的SAS程序,EXPECTED给出期望频数。 DEVIATION给出每格的实际频数与期望频数的差值。 CELLCHISQ给出每格对总c2的贡献,即计算每格的(实际频数-期望频数)2/期望频数。 CUMCOL给出累积列百分数。 NOFREQ不给出列联表中的格频数。 NOPERCENT不给出列联表中的格百分数。,四格表卡方检验的SAS程序,NOROW不给出列联表

28、中各格的行百分数。 NOCOL不给出列联表中各格的列百分数。 NOCUM不给出频数表的累积频数和累积百分数。 NOPRINT不给出表格,但给出CHISQ、MEASURES或CMH等语句所指定的统计量。 Trend指令系统对2C频数表的C个百分率进行Cochran-Armitage趋势检验; WEIGHT语句:通常每个观察值提供数值1给频数计数,当WEIGHT语句出现时,每个观察值提供的是该观察值的加权变量值。该值必须非负,但可不必为整数。只能使用一个WEIGHT语句,且该语句作用于所有的表。,四格表卡方检验,理论频数,记为T。理论数的计算公式为:,四格表卡方检验,卡方检验的统计量是2值,它是每

29、个格子实际频数A与理论频数T差值平方与理论频数之比的累计和。每个格子中的理论频数T是在假定两组的发病率相等的情况下计算出来的,故2值越大,说明实际频数与理论频数的差别越明显,两组发病率不同的可能性越大。,例题,某医院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效。将200例颅内压增高症患者随机分为两组。问两组降低颅内压的总体有效率有无差别?,连续性校正公式,2分布是正态变量的一种分布。设 是k个独立的标准正态变量,则 。2界值表就是根据这种连续性分布计算出来的。2统计量计算公式实质上是正态近似法。分类资料是间断性的,由此计算的2值不连续,尤其自由度为1的四格表,求出

30、的概率可能偏小,此时需要对2值进行连续性校正,公式为,2检验的应用条件,连续性校正主要针对四格表资料,尤其理论数较小时,连续性校正不可忽略。 四格表2检验的应用条件为: 当n40且所有T5时,用普通的2检验,若所得,改用确切概率法; 当n40但有1T5时,用校正的2检验; 当n40或有T1时,不能用2检验,改用确切概率法。,例题,某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将78例脑血管疾病患者随机分为两组。问两种药物治疗脑血管疾病的有效率是否有差别?,配对计数资料的卡方检验,把每一份样本平均分成两份,分别用两种方法进行化验,比较此两种化验方法的结果(两类计数资料)是否有本质的不同;

31、或者分别采用甲、乙两种方法对同一批病人进行检查,比较此两种检查方法的结果(两类计数资料)是否有本质的不同,此时要用配对卡方检验。,配对计数资料的卡方检验,比较两法结果有无差别,要着眼于两法结果不一致的部分。表中观察变量是对子中两法的差值或差别,由b和c两格数据来反映,总体中与b和c对应的数据可用B和C表示(a格和d格表示两法差值为0,不予考虑)。 当40时, 当40时,需作连续性校正:,例题,某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定。问两种方法的检测结果有无差别?,行列表资料的2检验,前面介绍了两个样本率比较的2检验方法,其基本数据有2行2列,称为

32、22表或四格表资料。本节介绍的行列表资料的2检验,用于多个样本率的比较、两个或多个构成比的比较以及双向有序或无序分类资料的检验等。 RC表可以分为双向无序、单向有序、双向有序属性相同和双向有序属性不同4类。,双向无序RC表,RC表中两个分类变量皆为无序分类变量,对于该类资料:若研究目的为多个样本率(或构成比)的比较,可用行列表资料的2检验;若研究目的为分析两个分类变量之间有无关联性以及关系的密切程度时,可以用行列表资料的2检验以及Pearson列联系数进行分析。,例题1,某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效。问三种疗法的有效率有无差别?,例题2,测得某地58

33、01人的ABO血型和MN血型结果,问两种血型系统之间是否有关联?,单向有序RC表,有两种形式。一种是RC表中的分组变量是有序的,而指标变量是无序的。此种单向有序RC表资料可用行列表资料的2检验进行分析。另一种情况是RC表中的分组变量是无序的,而指标变量是有序的,此种单向有序RC表资料宜用秩和检验进行分析。,例题,某地城市与农村高血压患者严重程度情况,试比较该地城市和农村高血压患者高血压严重程度是否有差别?,双向有序RC表,双向有序属性相同的RC表 RC表中的两分类变量皆为有序且属性相同。实际上是22配对设计的扩展,此时宜用一致性检验(或称Kappa检验)。 双向有序属性不同的RC表 RC表中的

34、两分类变量皆为有序且属性不相同。对于该类资料,需要分析两有序分类变量间是否存在线性变化趋势,宜用有序分组资料的线性趋势检验。,行列均为顺序变量的相关检验,变量虽然是有序的,但毕竟还不是定量的,需要给有序变量的各等级赋值方可进行相关分析。最简单的赋值法是按顺序赋给秩次(即得分),即给行变量的等级赋值1,2,R和给列变量的等级赋值1,2,C。这样(X,Y)的不同取值就有RC对,表中的RC个频数就是这RC对取值所对应的频数,然后计算Spearman秩相关系数,并作显著性检验,这是比较粗糙的分析方法。,行列均为顺序变量的相关检验,Spearman秩相关分析比较粗糙,这是因为它给有序变量的等级赋值过于简

35、单,不能最大限度地获得有序变量之间的相关信息。而典型相关分析是在使有序变量的相关达到极大的前提下给有序变量的各等级赋值,就是对于表的边缘(指“行合计”与“列合计”)设法产生一双变量正态,从而进行相关分析。因产生各等级的得分值的计算过程中涉及矩阵运算,故手工计算较麻烦,将用SAS程序实现统计计算。一旦有了各等级的得分值后,就可运用求维频数资料相关系数的公式计算了。典型相关分析可以得出几个典型相关系数R, 与每一个典型相关系数对应的检验为卡方检验,其数值为nR2,其中n为RC表中的总频数,与第k个卡方值对应的自由度dfk=R+C-2k-1。,行列均为顺序变量的相关检验,与定量资料的相关与回归分析类似,也可对RC表资料中有序变量之间是否存在线性趋势作显著性检验,通常这两种检验的结果是基本一致的,即相关分析结果显著,线性趋势检验结果也显著。可以通过检验实现线性趋势检验,即利用回归分析思想产生的与线性回归有关的卡分量和偏离线性回归的卡分量。,行列均为顺序变量的相关检验,首先计算RC表的值,然后将总的值分解成线性回归分量与偏离线性回归分量。若两分量均具有统计学意义,说明两分类变量存在相关关系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论