




已阅读5页,还剩3页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
袁肅膄莅薁袈肀蒄蚃肃羆蒃螅袆芅蒂蒅肂芁蒁蚇羄膇蒁螀膀肃蒀袂羃莁葿薁螆芇薈蚄羁膃薇螆螄聿薆蒆罿羅薅蚈螂莄薅螀肈芀薄袃袀膆薃薂肆肂薂蚅衿莁蚁螇肄芇蚀衿袇膃虿蕿肂肈芆螁袅肄芅袄膁莃芄薃羄艿芃蚅腿膅芃螈羂肁节袀螅莀莁薀羀芆莀蚂螃膂荿袄羈膈莈薄袁肄莇蚆肇莂莇蝿袀芈莆袁肅膄莅薁袈肀蒄蚃肃羆蒃螅袆芅蒂蒅肂芁蒁蚇羄膇蒁螀膀肃蒀袂羃莁葿薁螆芇薈蚄羁膃薇螆螄聿薆蒆罿羅薅蚈螂莄薅螀肈芀薄袃袀膆薃薂肆肂薂蚅衿莁蚁螇肄芇蚀衿袇膃虿蕿肂肈芆螁袅肄芅袄膁莃芄薃羄艿芃蚅腿膅芃螈羂肁节袀螅莀莁薀羀芆莀蚂螃膂荿袄羈膈莈薄袁肄莇蚆肇莂莇蝿袀芈莆袁肅膄莅薁袈肀蒄蚃肃羆蒃螅袆芅蒂蒅肂芁蒁蚇羄膇蒁螀膀肃蒀袂羃莁葿薁螆芇薈蚄羁膃薇螆螄聿薆蒆罿羅薅蚈螂莄薅螀肈芀薄袃袀膆薃薂肆肂薂蚅衿莁蚁螇肄芇蚀衿袇膃虿蕿肂肈芆螁袅肄芅袄膁莃芄薃羄艿芃蚅腿膅芃螈羂肁节袀螅莀莁薀羀芆莀蚂螃膂荿袄羈膈莈薄袁肄莇蚆肇莂莇蝿袀芈莆袁肅膄莅薁袈肀蒄蚃肃羆蒃螅袆芅蒂蒅肂芁蒁蚇羄膇蒁螀膀肃蒀袂羃莁葿薁螆芇 非参数统计分析Nonparametric Tests菜单详解平时我们使用的统计推断方法大多为参数统计方法,它们都是在已知总体分布的条件下,对相应分布的总体参数进行估计和检验。比如单样本u检验就是假定该样本所在总体服从正态分布,然后推断总体的均数是否和已知的总体均数相同。本节要讨论的统计方法着眼点不是总体参数,而是总体分布情况,即研究目标总体的分布是否与已知理论分布相同,或者各样本所在的分布位置/形状是否相同。由于这一类方法不涉及总体参数,因而称为非参数统计方法。SPSS的的Nonparametric Tests菜单中一共提供了8种非参数分析方法,它们可以被分为两大类:1、分布类型检验方法:亦称拟合优度检验方法。即检验样本所在总体是否服从已知的理论分布。具体包括:Chi-square test:用卡方检验来检验二项/多项分类变量的几个取值所占百分比是否和我们期望的比例有没有统计学差异。Binomial Test:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一分为二。Runs Test:用于检验样本序列随机性。观察某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。 One-Sample Kolmogorov-Smirnov Test:采用柯尔莫哥诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission分布和指数分布。2、分布位置检验方法:用于检验样本所在总体的分布位置/形状是否相同。具体包括:Two-Independent-Samples Tests:即成组设计的两独立样本的秩和检验。 Tests for Several Independent Samples:成组设计的多个独立样本的秩和检验,此处不提供两两比较方法。 Two-Related-Samples Tests:配对设计的两样本秩和检验。 Tests for Several Related Samples:配伍设计的多样本秩和检验,此处同样不提供两两比较。 一、 分布位置检验方法1、Two Independent Samples Test与 K Independent Samples Test用于检验两独立样本/多独立样本所在总体是否相同。Two-lndependent-Samples Test对话框:(1) Test Variable框,指定检验变量。(2) Grouping Variable框,指定分组变量。Define Groups对话框,Groupl和Groupl后的栏中,可指定分组变量的值。(3) TestType框,确定用来进行检验的方法。Mann-Whitney U:默认值,相当于两样本秩和检验。Kolmogorov-Smimov Z:K-S检验的一种。Moses extreme reactions:如果施加的处理使得某些个体出现正向效应,而另一些个体出现负向效应,就应当采用该检验方法。Wald-Wolfowitz runs:游程检验的一种,检验总体分布是否相同。(4) Options对话框,选择输出结果形式及缺失值处理方式。多个独立样本检验中不同之处:Define Range对话框,定义分组变量值范围。Minimum:分组变量范围的下限。 Maximum:上限。Test Type框,确定用来进行检验的方法。Kruskal-WallisH:默认值,单向方差分析,检验多个样本在中位数上是否有差异; Median:中位数检验,检验多个样本是否来自具有相同中位数的总体。2、Two Related Samples Test与 K Related Samples TestTwo Related Samples Test是考察配对样本的总体分布是否相同,或者说差值总体是否以0为中心分布;K Related Samples Test则用于检验多个配伍样本所在总体的分布是否相同。Two-Related-SamplesTests对话框:(1)Test Pair(s)List框,指定检验变量对。可有多对。(2)TestType框,确定检验的方法。Wilcoxon:默认值,配对设计差值的秩和检验,利用次序大小。Sign:符号检验,利用正负号。McNemar:配对卡方检验,适用于两分类资料,特别适合自身对照设计。Marginal Homogeneity:适用于资料为有序分类情况。(3)Options对话框中,选择输出结果形式及缺失值处理方式,K Related SamplesTest 用于多组间的非参数检验,不同之处在于:A、比较方法不同: Friedman:系统默认值,即最常用的随机区组设计资料的秩和检验,也被称为M检验。 Kendalls W:该指标也被称为Kendall和谐系数,它表示的是K个指标间相互关联的程度(一致性程度),取值在01之间。 Cochrarls Q:是两相关样本McNemar检验在多样本情形下的推广,只适用于二分类变量。B、Statistics对话框: Descriplive,描述统计量。Quartiles,四分位数。二、 分布类型检验方法原理:计算实际分布与理论分布间的差异,根据某种统计量求出 P 值。1、Chi-square test与行列表卡方检验区别:Chi-square test是检验分类数据样本所在总体分布(各类别所占比例)是否与已知总体分布相同,是一个单样本检验。行列表卡方检验是比较两个分类资料样本所在的总体分布是否相同,在spss中要用crosstable菜单来完成。具体做法:先按照已知总体的构成比分布计算出样本中各类别的期望频数,然后求出观测频数与期望频数的差值,最后计算出卡方统计量,利用卡方分布求出P值,得出检验结论。例5.1 某地一周内各日死亡数的分布如表所示,请检验一周内各日的死亡危险性是否相同?周日 一 二 三 四 五 六 日死亡数 11 19 17 15 15 16 19数据文件为death.sav:day 周日,death 死亡数。Chi-Square Test对话框: (1)Test Variable List框,指定检验变量,可为多个变量。(2)ExpectedRange栏,确定检验值的范围。l Get from data选项,即最小值和最大值所确定的范围,系统默认该项。l Use specified range选项,只检验数据中一个子集的值,在Lower和Upper参数框中键入检验范围的下限和上限。(3)ExpectedValues栏,指定期望值。l All categories equal选项,系统默认的检验值是所有组对应的期望值都相同,这意味着你要检验的总体是否服从均匀分布。l Values选项,选定所要检验的与总体是否服从某个给定的分布,并在其右边的框中键人相应各组所对应的由给定分布所计算而得的期望值。 “Add”按钮,增加刚键入的期望值,必须大于0。“Remove”按钮,移走错误值。“Change”按钮,替换错误值。(4)Options对话框。A、Statistics栏,选择输出统计量。Descriptive:输出变量的均值、标准差、最大值、最小值、非缺失个体的数量。Quartiles 复选项,输出结果将包括四分位数的内容。显示第25、50与75百分位数。B、在MissingValues栏中选择对缺失值的处理方式。具体操作如下:Data Weight Case Weight Case by: Frequency Variable: death OK;AnalyzeNonparametic TestChi-SquareTest variable list:dayOK。卡方值X2=2.875,自由度(DF)=6,P=0.824,可认为一周内各日的死亡性是相同的。2、Binomial Test(二项分布检验)调用Binomial过程可对样本资料进行二项分布分析,检验二项分类变量是否来自概率为P的二项分布。例5-2 某地某一时期内出生40名婴儿,其中女性12名(Sex=0),男性28名(sex=1)。问该地出生婴儿的性比例与通常的男女性比例(总体概率约为0.5)是否不同?数据文件为sex.sav。Binomial Test对话框:(1) Test Variable框,指定检验变量。(2) Define Dichotomy栏,定义二分值。l Get from data选项,适用于指定的变量只有两个有效值,无缺失值。l Cut point选项,如果指定的变量超过两个值,选择该项,并在参数框中键入一个试算点的值。(3)Test参数框,指定检验概率值。默认的检验概率值是0.5,这意味着要检验的二项是服从均匀分布的。(3) Options对话框,选择输出结果形式及缺失值处理方式。具体操作如下: Binomial TestTest Test Variable List sex Test Proportion 0.50 OK。二项分布检验表明,女婴12名,男婴28名,观察概率为0.7(即男婴占70%,检验概率为0.5,二项分布检验的结果是双侧概率为0.018,可认为男女比例的差异有高度显著性,即与通常的0.5的性比例相比,该地男婴比女婴明显多。3、Runs Test(游程检验)一个游程是指某序列中同类元素的一个持续的最大主集,或者说一个游程是指依时间或其他顺序排列的有序数列中,具有相同的事件或符号的连续部分。游程检验用于检验样本或任何序列的随机性。例5-3 某村发生一种地方病,其住户沿一条河排列,调查时对发病的住户标记为1,非发病住户为0,共26户,如下表所示。0 1 1 0 0 0 1 0 0 1 0 O 0 0 1 1 O 0 1 0 0 0 0 1 0 l数据文件为run.sav:住户变量为epi。Runs Test 对话框:(1) Test Variable框,指定检验变量。(2) Cut Point栏,确定划分二分类的试算点。中位数、众数、均数及用户指定临界割点。(3) Options对话框,选择输出结果形式及缺失值处理方式。具体操作如下:Runs Test Test Variable epi 1 OK从检验结果可见,本例游程个数为14,小于1有17个案例;而大于或等于1有9个案例。Z=0.325,双尾检验概率P0.746。所以认为此地方病的病户沿河分布的情况无聚集性,而是呈随机分布。4、单样本K-S检验又称单样本柯尔莫哥洛夫-斯米诺夫检验(one-sample Kolmogorov-Smirmov tes)。它是频数优度拟合检验,用于检验变量是否服从某一指定分布。调用此过程可对单样本进行Kolmogorov-Smimov Z检验,它将一个变量的实际频数分布与正态分布(Normal)、均匀分布(Uniform)、泊松分布(Poisson)进行比较。例5-4 某地101例健康男子血清胆固醇值测定结果如下见数据文件dguchun.sav,试分析该数据是否服从正态分布?One-Sample K-S Test对话框: (1)Test Variable框,指定检验变量。 (2)Test Distribution框,确定分布检验。分别有:正态分布(Normal)、均匀分布(Uniform)、泊松分布(Poisson)和指数分布(Exponential)。默认为Normal。(3)Options对话框,选择输出结果形式及缺失值处理方式。具体操作如下:One-Sample K-S Test Test Variable: X OKK-S正态性检验的结果显示,Z值=0.724,双尾检验概率P值=0.671,可认为变量X符合正态分布。三、非参数检验中的一些问题 1. 在多数情况下,如果非参数检验结论为有统计学意义,相应正确的参数检验结 论大多与之相同。如果出现矛盾酌情况,必须仔细考察参数检验的条件是否符合,多数情况下都是这里出了问题。 2当结果变量为两分类或多分类时,我们仍然可以采用非参数检验方法分析,但 此时也可以使用Crosstabs过程中的卡方检验,尤其是X2CMH统计量进行分析。该统计量和秩和检验实质上的区别只在于次序的评分方式不同,即秩和检验中有平均秩次的问题,而X2CMH统计量对相同数值都给予相同评分,不考虑重复数的多少。一般来说,它们的检验结果差别不会太大。 3如果大部分数据分布比较集中,但存在少数非常大小的极端值,此时仅采用 非参数分析方法尚不能完全概括信息,最好能在分析结束后单独对这些极端值给出描述,以充分反映样本特征。 4多组比较后总体有差异,接下来的问题应当是两两比较,但由于这方面还有一定争议,包括SAS、SPSS在内的所有权威统计软件均未提供该功能。此时我们可以采用以下两种对策: 两两进行两组间的非参数检验,但一定要调整水准,以保证总的比较水准控制在0.05,否则就会犯和多组均数比较时采用两两t检验性质相同的错误。 当各组例数较多时,可以采用秩变换分析,操作更加方便,而结论也更加准确。四、秩变换分析方法 在本章中我们已经学习了非参数分析方法,但还有很多的问题无法解决,这里向大家介绍一种通用的非参数分析原理,希望能对大家有所帮助。所谓秩变换分析方法,就是先求出原变量的秩次,然后使用求出的秩次代替原变量进行参数分析,当样本含量较大时,该方法的分析结果和相应的非参数方法基本一致,但该方法可以充分利用已知的参数方法,如多组样本的两两比较、多元回归等,从而大大扩展了非参数分析方法的范围。SPSS中的Rank过程可以用来求出秩次,该过程默认得到的是从1n均匀分布的秩次,使用者也可以自行指定生成正态分布的秩次,但这一般不需要,即基本不影响分析结果。例5-7 今欲研究胸腺增生病人中增生情况于titinab值的关系,共调查了141名病人,数据见titinab.sav。变量class表示胸腺增生情况,分为15级;titinab为测量值。请比较class各级之间有无显著差异。具体操作如下:Transform RankCases Variables框:titinab(计算titinab的秩次)OKAnalyze CompareMeans One-Way ANOVA Depe
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 汉字笔顺规则课件
- 汉字的演变史
- 内蒙古巴彦淖尔市乌拉特前旗第三中学2025届九年级下学期学业水平考试模拟(三模)数学试卷(含答案)
- 广东省肇庆市2024-2025学年高一下学期期末统一考试物理试卷(含解析)
- 2024-2025学年广东省茂名市高州市八年级(下)5月月考数学试卷(含答案)
- 硬件按需购买模式的市场研究
- 传统文化保护传承与现代文化创新融合探讨
- 网约车行业监管政策分析
- 汉字书法课件模板楷书庵
- 汉字书写讲解课件
- 初中地理学科课程规划方案
- 定额〔2025〕1号文-关于发布2018版电力建设工程概预算定额2024年度价格水平调整的通知
- 塑胶模具类中英文对照专业术语
- 安全- 中国移动认证考试L1题库(附答案)
- 干部民主推荐表(样式)
- 【公开课】社区教案
- 平面磨床操作时注意事项
- GB/T 29651-2013锰矿石和锰精矿全铁含量的测定火焰原子吸收光谱法
- GB/T 13275-1991一般用途离心通风机技术条件
- 核心素养下的高考语文命题评价体系讲座课件
- 高一英语必修一试卷(含答案)(适合测试)
评论
0/150
提交评论