




已阅读5页,还剩17页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章 数据文件的建立一、SPSS基础知识 SPSS的常用名词和术语1. 常数(constant)在运行中保持不变的数据。如p、e等。2. 变量(variable)变化数据的代表。SPSS对变量有如下规定: 变量名最多由8个字符组成(12.0以前版本),首字符必须为字母或, 其后可以是字母、数字、下划线、句点、$,#,但不允许把句点(.)作为变量名的尾字符。10.0版本以上可以取汉字变量名;12.0版本开始支持长文件名,允许最长64个字符,但单词之间不允许以空格分隔。 变量有数值型与字符型。SPSS提供的8种类型中,前七种均视为数值型。具体参见教材第12页表2.4。 变量名不区分大小写字母。 变量名不能使用SPSS的关键字。有: AND、OR、 NOT、ALL、TO、BY、EQ、GE、GT、 LE、LT、NE、WITH。 变量名必须唯一,不允许重复。3. 表达式(expression)用运算符和括号把常数、变量和函数按一定的规则连接起来的有意义的式子。如:COMPUTE y=sin(x).COMPUTE x=x+1.SPSS用 * 代表乘方运算符。4. 关键字(keywords)SPSS定义的用于标识命令、子命令、函数、运算符和其它设定的特殊词汇。5. 样品(case)是组成数据文件的基本单元。又称记录(record)或观测( observation )。6. 缺失值(missing value)指统计中不合格项(因缺失或遗漏)或给出规定值以外的数值。SPSS有系统缺失值和用户缺失值两种。SPSS用句点(.)代表缺失值。 SPSS的常用函数二、SPSS数据录入和数据获取 SPSS数据录入在SPSS中可以采取先定义变量后录入数据和直接输入数据后修改变量两种方式建立数据文件。 1. 按部就班式 定义变量。即在变量编辑窗口(Variable View)定义变量的十大属性Name、Type、Width、Decimals、Label、Values、Missing、Columns、Align、Measure。参见例2.1的数据文件exp2.1.sav的变量编辑窗口。 输入数据。即在数据编辑窗口(Data View)录入原始数据。一列为一个变量,一行为一个记录。参见例2.1的数据文件exp2.1.sav的数据编辑窗口。2. 先斩后奏式 输入数据。SPSS默认从var00001、var00002 、开始自动启变量名。 修改变量。SPSS的数据文件经存储后,其默认的文件名后缀为: “.sav” 。 SPSS的数据文件还可以存成其它类型的数据文件,如Excel(*.xls)、dBASE(*.dbf)等。 SPSS数据获取SPSS可以调入由其它软件生成的数据文件。如常用的Excel、dBASE等数据库文件。 方法:File Open Data,在打开的Open File对话框中打开“文件类型”下拉框,选择外部数据文件相应的文件类型,再找到文件的相应存储位置,即可找到并调入该数据文件。SPSS可打开的数据文件类型参见图2.8a。 SPSS可以存储多达22种格式的数据文件(12.0以上版本)。SPSS可存储的数据文件类型参见图2.8b。 思考题1. 变量的标签( variable labels)和变量值标签(value label)的区别。2. 变量宽度(Width)和变量显示宽度(Columns)的区别。3. 系统缺失值和用户缺失值的区别。第三章 数据文件的编辑一、数据的搜索1. 搜索指定记录的序号Data Go to case,键入序号。这里的序号是指SPSS自动生成的记录编号。2. 搜索指定变量中的指定数据先点击指定变量所在列的任一单元格, Edit Find,键入指定数据值。二、变量和记录的插入与删除1. 插入变量 在Data View窗口,点击插入变量的位置列,Data Insert Variable,原变量右移。 在Variable View窗口,点击插入变量的位置行,Data Insert Variable,原变量下移。2. 删除变量 在Data View窗口,点击要删变量的名称栏,Edit Clear。 在Variable View窗口,点击要删变量的序号栏,Edit Clear。3. 插入记录在Data View窗口,点击插入记录的位置行,Data Insert case,原记录下移。4. 删除记录在Data View窗口,点击要删记录的序号栏,Edit Clear。 三、数据的重新编码根据统计分析的需要,当将连续变量转换为分组资料或离散资料时,SPSS常用Recode命令或Visual Bander命令( 12.0以上版本)完成此任务。1. Recode命令的用法例2.1中的月龄age最小值1,最大值144。现以20个月为间隔分“120”、“2140”、“4160”、“6180”、 “81 100”、“101120”、“121140”、“141” 8个组。 方法:Transform Recode 4 Into Same Variables 重编码后覆盖原变量 Into Different Variables 重编码后生成新变量分别点击Old and New Values按钮可打开两个几乎相同的对话框。通过不同的范围定义来生成新的变量值。SPSS可用于定义范围的主要方式有: 下限值 through 上限值 Lowest through 上限值 下限值 through highest注意:为避免重复或遗漏,不论是上限值、下限值 、最小值和最大值,凡是第一次出现,SPSS均包含,下次出现相同的值则不包含;范围定义出现重叠,以第一次定义为准。本例若选择生成一新变量age1,其新旧变量值重新编码的对话框见图3.5。2. Visual Bander命令的用法Visual Bander命令是SPSS 12.0开始增加的一个可视化分组的过程,采用图形化操作,非常直观。方法:Transform Visual Bander Visual Bander对话框1 Visual Bander对话框2 ,点击Make Cutpoints按钮打开对话框,定义第一切点(First Cutpoint),组距(Width)和切点数(Number of),完成填写数据后Apply返回Visual Bander对话框2 , 若定义每组标号则点击Make Labels按钮, SPSS将根据Make Cutpoints中定义值自动生成标号, 后在Banded Name填充栏里填写新变量名称,OK完成。注意:在Make Cutpoints对话框中, First Cutpoint、 Number of和Width三个值的定义中,任意定义完成其中两个值,SPSS则会自动生成第三个值。本例若选择生成一新变量age1,用Visual Bander命令完成的操作步骤见视频。四、利用SPSS函数建立新变量根据统计分析的需要,SPSS可以使用表达式生成新变量,可利用SPSS的函数、运算操作符、数字、逻辑运算符和原有变量,还可利用条件语句If。SPSS主要通过Transform Compute命令完成新变量的建立。下面通过把例2.1中的“手术时间”变量time(单位为分钟)转化成小时来生成一个新变量timehr,并且要求只转换男性病例的过程讲解SPSS建立新变量的过程。方法:Transform Compute Compute Variable对话框,利用对话框提供的功能完成表达式timehr=time/60的建立,然后点击条件语句If按钮,打开Compute Variable: If Cases对话框,完成条件选择sex=1,点击Continue按钮,再点击OK按钮完成。五、排序SPSS主要通过Data Sort Cases命令完成对某变量的排序。 具体方法参见教材第29页第六节相关内容。六、数据文件的拆分与合并1. 数据文件的拆分SPSS主要通过Data Select Cases命令或Split File命令完成对数据文件的拆分。 物理拆分 Data Select Cases Select Cases对话框若点击条件语句If按钮,打开Select Cases: If 对话框,完成条件选择。 注意:在Select Cases对话框中的Unselected Cases Are选项中,若选择Deleted,则不满足条件的记录将被永久删除且不可恢复;而选择Filtered,则不满足条件的记录只是被屏蔽(即打斜杠),可恢复。 Filtered为SPSS默认选项。 形式拆分 Data Split File Split File 对话框,从左侧数据库变量列表中选择分组变量,移动到Groups Based on选项框里, OK即可。注意:形式拆分后只对数据库进行按被拆分变量的排序,只有在实施统计分析命令时方才发生效应。即Split File 命令是一个“冷命令”,只有在执行“热命令”时产生作用。 SPSS的Weight Cases命令也是一个“冷命令”。以下是对例2.1按“性别变量”(sex)进行形式拆分,分别选择Compare groups和Organize output by groups项,然后调用统计分析Frequencies命令对“感染与否变量”(infect)进行分析得到的结果1和结果2。 2. 数据文件的合并SPSS主要通过Data Merge Files 4命令完成对数据文件的合并。具体方法参见教材第42页“二、数据文件的合并”部分相关内容。思考题1. 物理拆分( Select Cases )和形式拆分( Split File )的区别。2. 本教材中“热命令”和“冷命令”的含义。第四章 清理数据(自学)一、异常数据的检查和清理 利用Frequencies命令此命令主要针对分类变量或离散变量,通过选择 Display frequency tables(列频数表)来发现异常数据的有无。通过EditFind命令或DataSelect Cases命令查找异常数据所在的记录,修改或删除。 利用Explore命令此命令主要针对定量变量或连续变量,通过选择 Outliers(异常点)来发现异常数据的有无,也可通过其输出的Stem-and-Leaf Plot(茎-叶图)或Boxplot(箱图)来直观发现异常数据的有无。通过EditFind命令或DataSelect Cases命令查找异常数据所在的记录,修改或删除。二、相关变量之间的逻辑检查和清理 具体方法参见教材第54页第二节相关内容。第五章 基本描述统计一、正态性检验 原始资料SPSS主要通过Analyze Nonparametric Tests 4 1-Sample K-S检验(即One-Sample Kolmogorov-Smirnov Test)完成对某变量所有数据的正态性检验。 下面通过对教材第58页例5.1的数据做正态性检验来讲述操作步骤及结果的判读。1. 建立数据文件(见exp5.1.sav)2. 正态性检验Analyze Nonparametric Tests 41-Sample K-S打开One-Sample Kolmogorov-Smirnov Test对话框。选择检验变量并选择 Normal(正态分布)选项, OK完成。3. 结果判读输出结果见表5.2,若Asymp. Sig. (2-tailed)的值大于检验水准(0.05),则该变量服从正态分布;反之不服从。注意:在One-Sample Kolmogorov-Smirnov Test对话框中的Exact按钮,一般当被检验变量的例数小于30时,点击可选择精确检验方法来得到精确检验概率。SPSS还可以通过Analyze Descriptive Statistics 4Explore分析方法(即探索性分析)完成对某变量所有数据的正态性检验。 下面通过对教材第59页例5.2的数据做正态性检验来讲述操作步骤及结果的判读。1. 建立数据文件(见exp5.2.sav)2. 正态性检验Analyze Descriptive Statistics 4 Explore打开Explore对话框,选择检验变量并点击 Plots按钮打开Explore: Plots对话框, 选择 Normality plots with tests选项, 点击Continue按钮,再点击OK按钮完成。3. 结果判读输出结果见表5.4a。本例数据经Lilliefors检验水准下的Kolmogorov-Smirnov检验和Shapiro-Wilk检验,检验概率P均小于0.001,则不服从正态分布。 注意:当样本含量50时,选择Shapiro-Wilk检验结果为准。 频数表资料方法同上。只需把频数表的组中值当成变量值x,把频数 f 用SPSS的加权命令Weight cases选上, 其余操作步骤同上。参见教材第61页“二、频数表资料的正态性检验”内容。二、基本描述统计 使用Frequencies命令SPSS可以使用Frequencies命令完成对连续变量数据的频数分布分析,可以绘制直方图(histogram);对离散变量进行频数列表并绘制直条图(Bar chart)或饼图( Pie chart );对数据可以求均数、标准差、最大值、最小值、标准误、中位数和百分位数等。 方法:Analyze Descriptive Statistics 4 Frequencies 打开Frequencies对话框, 首先选择分析变量, 选择 Display frequency tables选项则输出变量的频数表。点击Statistics按钮打开Frequencies: Statistics对话框,里面有百分位数值、集中趋势、离散趋势以及分布四类的指标,每个指标的具体含义参见教材第63页“一、使用Frequencies作基本统计分析”内相关内容;点击Charts按钮打开Frequencies: Charts对话框,可选择绘制条图、饼图或直方图。例5.4 对例5.1的数据作基本统计分析。1. 打开数据文件(见exp5.1.sav)2. 选择分析变量和基本统计分析项Analyze Descriptive Statistics 4 Frequencies 打开Frequencies对话框,选择检验变量男性红细胞量blood并点击 Statistics 按钮打开Frequencies: Statistics对话框,选择Mean、Sum、Std.deviation、Minimum、Maximum和S.E.mean,点击Continue按钮,点击Charts按钮打开Frequencies: Charts对话框,选择Histograms并选择 With normal curve选项, 点击Continue按钮,再点击OK按钮完成。3. 结果判读:输出结果见表5.7和图5.9,从图5.9 可见该变量基本服从正态分布。例5.5 对例5.3的数据作基本统计描述。操作步骤见教材第66 68页内容。 使用Descriptives命令SPSS可以使用Descriptives命令完成对连续变量数据的基本描述统计量的计算,与Frequencies命令相比,除不提供中位数、众数(Mode)、百分位数的计算和统计图的输出外,其余功能相同。 方法:Analyze Descriptive Statistics 4 Descriptives 打开Descriptives对话框, 首先选择分析变量, 点击Options按钮打开Descriptives : Options对话框,里面有各种基本描述统计量供选择,每个统计量的具体含义参见教材第64 65页内相关内容。 即使不点击Options按钮,SPSS默认选择Mean、Std.deviation、Minimum、Maximum四个统计量进行计算。对例2.1的数据中的月龄变量(age)和红细胞压积变量(hct)作基本描述统计分析。 1. 打开数据文件(见exp2.1.sav)2. 选择分析变量和基本描述统计分析项(略)3. 结果判读:输出结果见表5.9。思考题1. Frequencies命令和Descriptives命令的区别。2. SPSS对数据进行正态性检验的方法有几种?3. 在用Frequencies命令对连续型变量进行分析时,为什么常常应不选Display frequency tables项?第六章 t 检验一、配对 t 检验 使用Paired-Samples T Test命令SPSS主要通过Analyze Compare Means 4 Paired-Samples T Test检验完成对某资料的配对 t 检验。 注意:SPSS的配对 t 检验要求资料建立配对的两个变量数据。 例题及分析过程下面通过对教材第70页例6.1的数据做配对 t 检验来讲述操作步骤及结果的判读。1. 建立数据文件(见exp6.1.sav)2. 适用条件判断利用前述的正态性检验方法对样本数据进行正态性检验。Analyze Descriptive Statistics 4 Explore打开Explore对话框。选择配对的两个变量的差值作为检验变量,并选择Plots按钮中的 Normality plots with tests选项, 点击Continue按钮,再点击OK按钮完成。从输出结果表6.2中可以判断出本例治疗前与治疗后的血红蛋白含量差值数据服从正态分布。3. 配对 t 检验 Analyze Compare Means 4 Paired-Samples T Test打开Paired-Samples T Test对话框,点击两个变量形成配对变量并移入Paired Variables:列表栏里, OK完成。4. 结果判读输出结果见表6.36.5,在表6.5中可以得到配对 t 检验的统计量 t 值为-0.364,检验概率P为Sig. (2-tailed)的值,即P=0.7220.05,则无统计学意义,即还不能认为该药能引起患者的血红蛋白含量的显著变化。二、两组独立样本的 t 检验 使用Independent-Samples T Test命令SPSS主要通过Analyze Compare Means 4 Independent-Samples T Test检验完成对某资料的两组独立样本的 t 检验。 注意:SPSS的两组独立样本的 t 检验要求资料建立分组变量。 例题及分析过程下面通过对教材第75页例6.2的数据做两组独立样本的t 检验来讲述操作步骤及结果的判读。1. 建立数据文件(见exp6.2.sav)2. 适用条件判断利用前述的SPSS的数据文件的形式拆分命令Split File把数据文件中的分组变量(group)设置成分组比较变量,从而使得正态性检验方法可以对分组样本数据进行正态性检验(即一箭双雕)。 Data Split File Split File 对话框,点击选择Compare groups选项,再从左侧数据库变量列表中选择分组变量(group),移动到Groups Based on选项框里, OK即可。Analyze Descriptive Statistics 4 Explore打开Explore对话框,选择血磷值变量(xl)作为检验变量,点击 Plots按钮打开Explore: Plots对话框, 选择 Normality plots with tests选项, Continue OK完成。从输出结果表6.7中可以判断出本例急性克山病组与健康组的血磷测定值数据均服从正态分布。3. 两组独立样本的 t 检验Analyze Compare Means 4IndependentSamplesT Test打开Independent -Samples T Test对话框,选择分析变量和分组变量, 点击Define Groups按钮打开Define Groups对话框输入分组标志值, Continue OK完成。4. 结果判读输出结果见表6.86.9,表6.8显示的是每组血磷值的描述统计分析结果;在表6.9中同时显示方差齐性检验结果和 t 检验结果。首先通过Levenes test for equality of variances(即Levene方差齐性检验)结果判断此数据的方差齐性结果,本例 F 值为0.072,P=0.7910.05,则方差齐。然后在Equal variances assumed(即等方差假设)一行找出t 检验结果。本例 t = 2.576,P=0.0170.05,则方差齐。表7.5显示的是方差分析的结果。本例F = 5.564,P= 0.0080.05,即认为三组大鼠肾组织液中NO水平存在着不同。二、方差分析中均数的两两比较当方差分析结论拒绝H0时,得到的多组样本的总体均数不同只是笼统的,而研究者往往需要知道多个均数间到底哪些存在不同,这就需要借助多重比较(Multiple Comparisons)的方法。SPSS提供了多达18种的多重比较方法,我们这里只介绍常用的S-N-K法、LSD法、Dunnett法和Bonfferoni法。 S-N-K法(Student-Newman-Keuls):又称q检验。常用于多个均数间每两个均数的比较。 LSD法(Least Significant Difference):即最小显著差法。常用于多个处理组与对照组的均数比较。 Dunnett法:常用于多个处理组与对照组的均数比较。 Bonfferoni法:常用于多个均数间每两个均数的比较。 使用Post Hoc按钮SPSS通过Analyze Compare Means 4 One-Way ANOVA打开One-Way ANOVA对话框并点击Post Hoc按钮打开One-Way ANOVA: Post Hoc Multiple Comparisons对话框来选择使用某种多重比较方法。 例题及分析过程下面通过对教材第85页例7.2的数据做多重比较来讲述操作步骤及结果的判读。1. 打开数据文件(见exp7.2.sav)2. 选用多重比较方法Analyze Compare Means 4 One-Way ANOVA打开One-Way ANOVA对话框并点击Post Hoc按钮打开One-Way ANOVA: Post Hoc Multiple Comparisons对话框,分别选择 LSD、 S-N-K、 Bonfferoni和 Dunnett选项,Continue OK完成。3. 结果判读输出结果见表7.67.7,表7.6显示的是S-N-K法的分析结果;表7.7显示的是LSD法、 Bonfferoni法和Dunnett法的分析结果。S-N-K法是通过寻找同质子集(Homogeneous Subsets)的方法得出比较结果。子集之间的各组间有差别(P0.05)。 LSD法、 Bonfferoni法和Dunnett法是通过在对比的两组均数差值(Mean Difference (I-J)的右上角标记“ * ”来表示此两组均数有差别(P0.05)。本例用上述四种多重比较方法得到的两两比较结果见下表7.6-7。表7.6-7 四种多重比较方法得到的结果对比组LSD Bonfferoni Dunnett S-N-K 正常对照组与肾缺血60min组 P 0.05P 0.05P 0.05P 0.05正常对照组与肾缺血60min再灌流组 P 0.05P 0.05P 0.05P 0.05肾缺血60min组与肾缺血60min再灌流组 P 0.05P 0.05P 0.05三、随机区组设计的方差分析(自学) 使用Univariate命令SPSS通过Analyze General Linear Model 4 Univariate 命令完成随机区组设计的方差分析。 例题及分析过程下面通过对教材第87页例7.3的资料做随机区组设计的方差分析来讲述操作步骤及结果的判读。1. 建立数据文件(见exp7.3.sav)2. 适用条件判断:具体过程略。3. 随机区组设计的方差分析Analyze General Linear Model 4 Univariate 打开Univariate对话框, 将尿氟排出量变量(nf)调入Dependent Variable (因变量) 中,将时间变量(group)、区组变量(block)调入Fixed Factor(s)(固定因素)中,点击Model按钮打开Univariate: Model对话框, 选择Custom(自定义)选项,再点击 Build Term(s)下的下拉框并从中选择Main Effects,然后把左侧的group、block调入右侧的Model栏,去掉栏下的Include intercept in model选项, Continue OK完成。4. 结果判读输出结果见表7.10a,结果显示:group组(不同时间):F=7.033, P=0.004 0.05,即工人之间的差异对尿氟排出量影响不大。5. 多重比较Analyze General Linear Model 4 Univariate 打开Univariate对话框, 点击Post Hoc按钮打开Univariate:Post Hoc Multiple Comparisons for Observed Means对话框,选择group为多重比较变量, 再分别选择 LSD、 S-N-K、 Bonfferoni和 Dunnett选项,Continue OK完成。输出结果见表7.12和表7.13。用上述四种多重比较方法得到的两两比较结果见下表7.12-13。表7.12-13 四种多重比较方法得到的结果对比组LSD Bonfferoni Dunnett S-N-K 工前组与工中组 P 0.05P 0.05P 0.05P 0.05P 0.05P 0.05P 0.05工中组与工后组 P 0.05P 0.05P 0.05教材第93页例7.4的资料做随机区组设计的方差分析的操作步骤及结果的判读(自学)。 * 四、多因素方差分析前面讲授的随机区组设计的方差分析实质就是一个最简单的多因素方差分析(两因素无重复数据),因为它不存在交互效应(interaction),当某因素的各单独效应随另一因素变化而变化时,则称这两个因素存在交互效应。由于从总变异中分解的变异项目增多,多因素方差分析计算和输出结果就更为复杂。本节内容略。 *五、析因分析(有重复的两因素方差分析) 析因分析实质就是有重复数据的两因素方差分析。它可以存在单独效应(Simple effect)、主效应(main effect)和交互效应(interaction)。SPSS通过Analyze General Linear Model 4 Univariate 命令完成析因分析。下面通过对卫生统计学第5版教材第157页例9-3的资料做析因分析来讲述操作步骤及结果的判读。1. 建立数据文件(见wstjx5exp9-3.sav)2. 析因分析 Analyze General Linear Model 4 Univariate 打开Univariate对话框,将吞噬指数变量调入DependentVariable (因变量) 中,将升白细胞药物、纯苯调入Fixed Factor(s) (固定因素) 中,点击Model按钮打开Univariate: Model对话框,选择Custom选项,选择Build Term(s)中的interaction ,点击左侧的升白细胞药物和纯苯则将二者的交互效应项(纯苯*升白细胞药物)调入右侧的Model栏,再选择Build Term(s)中的Main Effects,点击左侧的升白细胞药物和纯苯则将二者的主效应项(纯苯、升白细胞药物)调入右侧的Model栏, Continue,点击Options按钮打开Univariate: Options对话框,选择 Descriptives statistics 选项, Continue OK完成。3. 结果判读输出结果见表7.287.29。表7.28显示的是“升白细胞药物”和“纯苯”两因素在单独效应、主效应和交互效应下的“吞噬指数”的均数、标准差等大小。表7.29显示的是“升白细胞药物”和“纯苯”两因素在主效应和交互效应下的“吞噬指数”的假设检验结果。结果为:升白细胞药物和纯苯的交互效应:F=1.0000, P=0.3322 0.05,即两因素的交互效应无统计学意义;升白细胞药物的主效应: F=1.5192, P=0.2355 0.05,即升白细胞药物的主效应无统计学意义; 纯苯的主效应: F=1857.0087, P 0.001,即纯苯的主效应有统计学意义。 思考题1. 分组变量和分组标志值的区别。2. 单因素方差分析、随机区组设计的方差分析和析因分析的区别。第八章 2 检验一、四格表 2 检验 使用Crosstabs命令SPSS主要通过Analyze Descriptive Statistics 4 Crosstabs分析完成对某资料的四格表 2 检验。 注意:SPSS的Analyze Nonparametric Tests 4 Chi-Square命令是针对单样本 2 检验的。 例题及分析过程下面通过对教材第125页例8.3的四格表做 2 检验来讲述操作步骤及结果的判读。1. 建立数据文件(见exp8.3.sav)2. 加权例数若非原始数据而是整理好的频数表数据(即四格表),需要加权例数(Weight cases)。 Data Weight cases 打开Weight cases对话框,将频数变量f移入Weight cases by选项下的Frequency Variable:栏中, OK完成。3. x2 检验 Analyze Descriptive Statistics 4 Crosstabs打开Crosstabs对话框,将处理方法变量(t)移入Row(s)列表栏里,将疗效变量(r)移入Column(s)列表栏里,点击 Statistics按钮打开Crosstabs: Statistics对话框,选择 Chi-Square选项, Continue ,点击 Cells按钮打开Crosstabs: Cell Display对话框,选择 Expected及 Row选项, Continue OK完成。4. 结果判读输出结果见表8.198.20。表8.19中显示了四格表的实际频数(Count)、理论频数(Expected Count)、行百分数(% within 处理方法)等结果。表8.20中显示了四格表的检验结果。其中2=6.508,P=0.0110.05。此外还提供了确切概率法( Fishers Exact Test )得到的精确检验概率P=0.014(双侧)。表下的注释还提供了四格表中理论频数小于5的格子数及占总格子数的百分比,最小理论频数的大小。本例所有格子的理论频数都大于5,最小理论频数的大小为7.70二、配对四格表 2 检验 使用2 Related Samples命令SPSS主要通过Analyze Nonparametric Tests 42 Related Samples分析完成对某资料的配对四格表 2 检验。配对四格表 2 检验又称McNemar检验。 例题及分析过程下面通过对教材第133页例8.6的配对四格表做 2 检验来讲述操作步骤及结果的判读。1. 建立数据文件(见exp8.6.sav)2. 加权例数:具体操作步骤参见上例。 3. 配对 2 检验 Analyze Nonparametric Tests 4 2 Related Samples打开Two-Related-Samples Tests对话框,选择A培养基变量(a)和B培养基变量(b)作为配对变量,调入右侧的Test Pair(s) List:栏里,在Test Type里选择 McNemar选项, 去掉Wilcoxon选项, OK完成。4.结果判读输出结果见表8.278.28。表8.28中显示了配对四格表的检验结果。P=0.0210.05,差异有统计学意义。注意:SPSS还可以使用Crosstabs分析来完成配对四格表 2 检验。三、行列表 2 检验 使用Crosstabs命令SPSS通过Analyze Descriptive Statistics 4 Crosstabs分析完成对某资料的行列表 2 检验。 例题及分析过程下面通过对教材第110页例8.1的资料中第一问做 2 检验来讲述操作步骤及结果的判读。1. 打开数据文件(见exp2.1.sav)2. 行列表 2 检验Analyze Descriptive Statistics 4 Crosstabs打开Crosstabs对话框,将感染与否变量(infect)移入Row(s)列表栏里,将手术中输血次数变量(bn)移入Column(s)列表栏里,点击 Statistics按钮打开Crosstabs: Statistics对话框,选择 Chi-Square选项, Continue OK完成。3.结果判读输出结果见表8.18.2。表8.1显示了感染组与非感染组的各自输血次数形成的行列表(2 5表)的结果。表8.2显示了此行列表的检验结果。2=12.317,P=0.0150.05,差异有统计学意义。但注意表下的注释a的说明:有4个格子的理论频数小于5,占总格子数(10)的40.0%(4/10)。超过了行列表的适用条件(不宜有1/5以上的格子的理论频数小于5), 因此上述2值是不可信的。我们可以采取以下三种措施之一: 扩大样本含量。 合理的合并。(参见教材的相关内容) 采用精确检验(Exact Test)。若采用精确检验,只需在Crosstabs对话框下部点击Exact按钮,在打开的Exact Test对话框中选择Exact选项或Monte Carlo选项即可。本例选择Exact选项, Continue OK完成。输出结果见表8.2a。与表8.2相比,多出了精确检验(Fishers Exact Test)的结果, P=0.006 0.05,说明感染组与非感染组的各自输血次数是不同的。当行列表(多于四格)的 2 检验拒绝H0时,只能得出总的差异有统计学意义,若要进行两两比较,需要进行2 分割,即把行列表分割成多个2 C表比较,由于重复多次的假设检验增大了I 类错误,常采用重新规定检验水准的方法进行校正。常用的校正公式见下: 其中N 为两两比较的次数,n 为要检验的组数。SPSS未提供定性资料的两两比较方法。我们可以采取对要比较的分组变量的分组标志值定义缺失值的办法来进行两两比较。即只保留要比较的两组的分组标志值,其余的定义成缺失值。此法利用了SPSS默认不对缺失值进行分析的设置。下面通过对教材第116页例8.2的数据做两两比较来讲述操作步骤及结果的判读。1. 建立数据文件(见exp8.2.sav)2. 行列表 2 检验操作步骤略,输出结果见表8.108.11。结果显示:2=297.375,P0.001。3. 两两分组首先进入SPSS Data Editor窗口,点击Variable View名签进入变量定义窗口,点击变量(area)的Missing属性单元格的右侧 ,弹出Missing Values对话框,选择Discrete missing values选项并在其中的格子中敲入3(即北美洲人组的分组标志值), OK完成。4. 两两比较Analyze Descriptive Statistics 4 Crosstabs打开Crosstabs对话框,将地区变量(area)移入Row(s)列表栏里,将血型变量(type)移入Column(s)列表栏里, 点击 Statistics按钮打开Crosstabs: Statistics对话框,选择 Chi-Square选项, Continue OK完成。5.结果判读:输出结果见表8.128.13。结果显示:2=151.574,P 0.05。说明两种方法检测结果基本一致。二、两样本比较的秩和检验 使用2 Independent Samples命令SPSS通过Analyze Nonparametric Tests 4 2 Independent Samples分析完成对某资料的两样本比较的秩和 检验。两样本比较的秩和检验可用Wilcoxon两样本法,也可用Mann-Whitney U检验法。 例题及分析过程下面通过对教材第139页例9.2的资料做两样本比较的秩和检验来讲述操作步骤及结果的判读。1. 建立数据文件(见exp9.2.sav)2. 两样本比较的秩和检验Analyze Nonparametric Tests 4 2 Independent Samples打开Two-Independent-Samples Tests对话框,把血铅值变量(bp)调入Test Variable List:栏里,把分组变量(group)调入Grouping Variable:栏里,点击Define Groups按钮打开Two Independent Samples: Define Groups对话框
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 员工离职和解协议书范本
- 五年级数学(小数四则混合运算)计算题专项练习及答案
- 小学英语课后辅导计划与案例
- 电商运营数据分析及策略制定
- 学生课业焦虑调查及对策分析报告
- 医院药品采购及验收管理流程
- 校园篮球操特色推广活动实施方案
- 现代物流技术应用与管理
- 中考语文满分作文集锦
- 单层厂房施工组织设计方案
- 冷库维保合同(2025版)
- 2025国核示范电站有限责任公司校园招聘笔试历年参考题库附带答案详解
- 2025年护士资格证考试试题(附答案)
- 医院实验室生物安全管理体系文件
- 生活垃圾清运工安全教育培训手册
- 普通诊所污水、污物、粪便处理方案及周边环境情况说明
- 防诈骗班会课件
- 老年照护芳香疗法应用规范
- 2025年高考语文真题全国一、二卷古诗词鉴赏
- 法拉利课件介绍
- 2025-2030年中国汽车电源管理IC行业市场现状供需分析及投资评估规划分析研究报告
评论
0/150
提交评论