




已阅读5页,还剩121页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SPSS所处理的数据文件有两种来源:一是SPSS环境下建立的数据文件;二是调用其它软件建立的数据文件。 1 在SPSS数据编辑窗口建立数据文件当用户启动SPSS后,系统首先显示一个提示窗口,询问用户要SPSS做什么时,把鼠标移至“Type in data”项上单击左键选中,然后单击“OK”按钮;或者该窗口中单击“Cancel”按钮进入SPSS数据编辑窗屏幕,如图所示。 图 进入SPSS数据编辑器(1) 数据编辑(SPSS Data Editor)界面介绍窗口名显示栏: 在窗口的顶部,显示窗口名称和编辑的数据文件名,没有文件名时显示为“Untitled-SPPS Data Editor”。窗口控制按钮:在窗口的顶部的右上角,第一个按钮是窗口最小化,第二个按钮是窗口最大化,第三个按钮是关闭窗口。SPSS主菜单:在窗口显示的第二行上,有:File文档,Edit编辑,View显视,Data数据,Transform转换,Analyze分析,Graphs图形,Utilities公用项,Windows视窗。图 SPSS窗口界面常用工具按钮:在窗口显示的第三行上,有:打开文档,保存文档,打印,对话检索,取消当前操作,重做操作,转到图形窗口,指向记录,指定变量操作,查找,在当前记录的上方插入新的空白记录,在当前变量的左边插入新的空白变量,切分文件,设置权重单元,标记单元,显示价值标签。数据单元格信息显示栏:在编辑显示区的上方,左边显示单元格和变量名(单元格:变量名),右边显示单元里的内容。编辑显示区: 在窗口的中部,最左边列显示单元序列号,最上边一行显示变量名称,缺省为“Var”。编辑区选择栏: 在编辑显示区下方,Data View 在编辑显示区中显示编辑数据,Variable View在编辑显示区中显示编辑数据变量信息。状态显示栏: 在窗口的底部,左边显示执行的系统命令,右边显示窗口状态。 (2) 数据文件格式数据文件格式以每一行为一个记录,或称观察单位(Cases),每一列为一个变量(Variable)。由于SPSS不同的统计分析过程需要不同的数据类型,因此,在学习使用SPSS软件作统计分析时要注意这个问题。 现在,我们通过一个例子来学习数据的输入操作。例: 马尾松腮扁叶蜂在林间表土层的水平分布调查数据调查地点 样方里的幼虫数量样地11 4 0 2 6 3 2 3 0 0 6 4 2 8 7 0 3 4 2 5 5 3 2 4 4 5 9 2 0 5 1 3 4 0 0 1 8 7 3 3 2 2 8 4 7样地23 1 1 0 0 0 4 1 4 1 5 2 0 5 2 3 0 0 3 5 4 3 5 11 0 0 3 5 1 1 3 4 2 4 0 3 1 4 4 4 9 5 6 1 6样地33 5 3 0 4 0 2 3 1 4 3 7 6 3 4 2 0 4 4 2 3 2 8 3 6 3 1 4 1 4 3 3 2 5 5 3 10 2 5 2 5 4 5 1 4(3) 定义变量建立数据文件的第一步是定义变量。在数据编辑窗口左下角激活(Variable View)变量定义窗口,如下图在数据窗口中,用户定义数据变量的名称、数据类型、宽度、小数位和标记等信息。变量名称 输入字符(汉字和英文)作为变量的名称,本例为,样地1,样地2,样地3。如不输入名称,系统依次默认为“var00001”、“var00002”、“var00003” 。变量应遵循下列原则: 在SPSS10.0中限制为8个字符长度(4个汉字);在SPSS12.0中没有限制。 首字符必须是字母或汉字,不能以下划线“_”或圆点“,”结尾。 变量不能有空格或某些特殊符号,如“!?*”等。 变量名不能与SPSS的关键字相同,即不能用ALL、AND、BY、EQ、GT、LE等。 变量的数据类型 当鼠标指针移至单元格,单击后该单元格的右边就会显示一个“”按钮,单击该按钮就会显示一个数据类型设置窗口,如下图所示。可供选择的数据类型有: Numeric 标准数值型,系统默认。例如: 12345.67 Comma 逗号数值型。例如: 12,345.67 千分位用逗号 Dot 圆点数值型。例如: 12.345,67 千分位用圆点 Scientific notal 科学记数法。 例如: 1.2E+04 Dat 日期型,有27种形式。 例如: mm/dd/yyyy Dollar 美元型。 例如:$12345.67 Custom currency 自定义型。 例如:12345.67 String 字符型。 例如:12345.67 width 指定数据字符占据的总个数(包括小数点和小数位)。Decimal 指定小数位。根据本例的要求,变量定义如图所示。变量标签(Label):有的时候变量名不能正确反映变量含义,有必要给它贴上标签以便识别。这个时候,就在变量定义的标签栏里输入你的注释。变量值标签(Values):变量值标签是用来帮助解释某些变量,特别是分类变量的数值含义。例如,有一个数值变量,0表示女性,1表示男性。此时,为了便于识别这些数值,我们是用变量值标签。在下图的第一个Value栏输入数值,在第二个Value栏输入数值标签。当两个输入栏输入内容后,Add按钮激活,点击它就定义了变量值标签。如本例,定义了0=女 和1=男 。需要修改和删除,使用Change和Remove按钮。缺失值(Missing): 缺失值是统计分析时,对数据中缺少数据的一种统计识别值。缺失值定义窗口如下图。No missing values 没有定义缺失值,用系统默认值圆点“.”表示。Discrete missing values 可以定义3个缺失值,例如,第一格输入“0”,表示凡为0的数据是缺失值。Range plus one optional discrete missing value 定义取值区间为缺失值。例如,Low:为1,High:为5,Discrete value:为10,表示1至5之间的数据及数值10视为缺失值。数据列的显示宽度(Columns): 显示数据的列宽,默认8个字符。对齐方式(Align): 有左中右3种数据显示方式。度量类型(Measure): 按度量精度将变量分为定量变量(Scale)、等级变量(Orsinal)和定性变量(Nominal)。该选项仅用于统计绘图时坐标轴变量的区分以及决策树模块的变量定义。定量变量,如虫口数、死亡率等;等级变量,如防治效果的好、不好等;定性变量,如害虫抗药性发生,低抗,中抗和高抗。(4) 输入数据变量定义完成后,在编辑区选择栏里单击“Data View”卡片,编辑显示区显示为数据编辑。在编辑区中,把与变量名相对应的数据输入到单元格里区,如下图所示。数据输入后的数据编辑窗口2 调用已建立的数据文件SPSS可以调用SPSS(*.sav),Excel(*.xls),dBASE(*.dbf),ASCII(*.dat,*.txt)等数据文件。2.1 调用SPSS数据文件(*.sav)从菜单选择File-Open-Data命令,在弹出的打开文件对话中指定数据文件的路径,文件名框内显示的是SPSS数据文件是系统默认的文件类型“*.sav”,点击所选文件,单击“打开”按钮,或双击所选文件。这样就把该数据文件调入数据编辑窗口中。2.2 调用ASCII数据文件(文本文件,*.dat, *.txt)文本文件(ASCII)格式是我们经常使用的一种文件格式,也是许多软件都具有的数据交换格式。文本文件分变量固定字符宽度与使用分隔符分开变量格式(,、;)和制表(Tab)两种形式,下面我们用例子来说明其操作。1) 定字符宽度格式文本文件的输入我们使用Windows“记事本”创建一个显示如下格式的TEXT1.TXT的文件。0 7 15.56 7 15.561 3 6.67 10 22.222 8 17.78 18 40.003 7 15.56 25 55.564 7 15.56 32 71.115 4 8.89 36 80.006 2 4.44 38 84.447 3 6.67 41 91.118 3 6.67 44 97.78该数据文件有5个变量,9个记录。使用这种格式使用变量名称注意宽度不能超过对应的变量数据的宽度,否则会发生一些变量名称不对的错误。该数据文件保存在配套光盘中(SPSSDATATEXT1.TXT)。操作过程: (1). 在主菜单中点击“File-Open-Data”命令。(2). 出现打开文件操作窗口,在“查找范围”栏指定文本文件“TEXT1.TXT”保存的文件夹;在“文件类型”栏里,单击该输入框或者右边的下拉按钮(三角形按钮),在下拉选项里选中“Text (*.txt)”,然后在文件列表框里选中“Text1.txt”文件,再单击“打开”按钮,如下图所示。(3). 出现数据引导对话窗口,一共有6个对话窗口。 第一个对话窗口的设置 Does your text file match a predefined format(该文本文件是否与以前定义过的格式匹配?)Yes 选择此项,则“Browse.”按钮被激活,可以将以前定义的文件调出。No 不使用保存过的匹配文件,系统默认。然后点击“下一步”按钮,出现文本输入向导的第二个对话窗口。第二个对话窗的设置(设置变量的分隔方式)图 变量格式和变量名设置How are your variables arranged (变量间分隔方式?):Delimited: 变量间用特殊符号分隔,系统默认; Fixed width: 变量间为固定列宽度,本例选中该项。Are variable names included at top your file (文件顶端是否含变量名?) Yes: 文件中第1行为变量; NO: 文件中没有变量名,系统自动给变量命名。本例选中该项。然后点击“下一步”按钮,出现文本输入向导的第三个对话窗口。第三个对话窗口的设置(设置纪录读取方式)The first case of data begins on which: 指定第一数据从那行开始,本例选1。How many lines represent a case 多少行为一个记录?本例选择1。How many cases do you want to import (读入多少记录?) All of the cases: 全部记录。系统默认,本例选中该项; The first 1000 cases: 开始的1000个记录; A random percentage of the cases (approximately): 随机选择一定百分比。然后,点击“下一步”按钮。 在第四个对话窗口的设置(修改变量分割)可以在窗口的数据显示(Data preview)栏里,用鼠标抓住变量分隔竖线,调整竖线位置来符合变量取值宽度。 有如下三种操作:(1)修改变量字符宽度,用鼠标抓住分割线拖移;(2)插入一条分割线,在插入位置点击鼠标左键;(3)删除一条分割线,用鼠标抓住分割线拖移数据窗口。调整完成后,点击“下一步”按钮。在第五个窗口定义变量属性Specifications for variable(s) selected the data preview(设置在数据显示栏选中变量的属性):Variable name: v1 重新定义变量名称。 Data: Numeric 重新定义变量的数据类型。 在窗口中,先在数据显示栏(Data preview)指定需要定义的变量,然后才在“Variable name”和“Data ”栏输入变量名和数据类型。完成后,点击“下一步”按钮。 第六个对话窗口的设置Would you like to save this file format for future(是否将文件格式存盘) Yes 选此项,“Save as .”按钮激活,单击按钮后,将文件另存到指定的路径。在有相同格式文本文件时调用 它来设置。 No 不保存Would you like to paste the syntax(是否存为程序语句文件?) Yes 选中此项,则将上述过程保存为程序文件。 No 不保存为程序语句文件,系统默认。设置完成后,在窗口的数据显示框里观察数据读取情况,如果读出的数据不对,可以点击“上一步”按钮,回到前面的对话窗口里进行修正设置。数据显示正确后,点击“下一步”按钮。最后单击“完成”按钮,文本数据就输入到数据编辑窗里,完成了数据的转换过程。2 数据转换(Transform)在有些情况下,原始数据难以满足数据分析的要求,需要对原始数据进行适当的转换。SPSS具体强大的数据转换功能,它不仅可以进行简单的变量转换和重新建立分类变量,还可以进行复杂的统计函数运算以及逻辑函数运算。在主菜单中点击Transform命令,弹出数据转换子菜单,如图所示。计算产生变量 重新赋值 测量方位 计数统计 观测值单位排序 自动重新赋值 产生时间序列变量 缺失值代替 随机数 2.1 计算产生变量(Compute.)计算产生变量是根据已存在的变量,经函数计算后,建立新变量或替换原变量值。例如,我们在方差分析中常常要求对百分数和层数描叙的数据作反正弦函数的转换(sin-1SQRT(x))。 ARSIN(SQRT(x)首先,打开数据文据文件(DATA1-1.SAV),将数据调入工作区。然后,从菜单选择Transform- Compute.命令,弹出计算产生变量对话框,如下图:Target Variable: 目标变量名指定栏。可以输入新的变量,也可以输入已有的变量。输入变量后,下边的 Type & Label.按钮就会被激活,点击它出现变量定义的对话框,可以设置以下变量属性。Label 栏:Label 输入标签名。Use expression as label: 以数学表达式作为标签。Type 栏:Use Expression as label: 数字型变量String 字符型变量,Width: 8 字符宽度。Numeric Expression: 数学表达式输入使用键盘或利用系统提供的计算面板输入数学表达式。也可以将Functions(函数)框里的函数选入表达式中。系统提供了70多种函数,它包括算术函数,统计函数,分布函数,日期函数,缺失值函数和字符函数。If定义条件Include all cases: 包括所有记录。Include if cases satisfies condition: 符合条件的记录。选中此项后,条件输入框激活,在此框中输入 变量的逻辑表达式。SPSS 算术函数 函数 说明 示例 (x=3.6, y=2)ABS(x)绝对值函数 ABS(y-x) 1.6 ARTAN(x)反正切函数,得弧度值 ARTAN(y) 1.11 ARSIN(x)反正弦函数,得弧度值 ARSIN(x/4) 1.12 COS(x)余弦函数(弧度单位) COS(y) 0.47 EXP(x)以e为底的指数函数 EXP(y) 7.39 LG10(x)以10为底的对数函数 LG10(y*100) 2.3 LN(x)以e为底的对数函数 LN(y) 0.69 MOD(x)取余函数 MOD(x,y) 1.6 RND(x)四舍五入后去正 RND(x) 4 SIN(x)正弦函数(弧度单位) SIN(y) 0.909 SQRT(x)平方根函数 SQRT(y) 1.41 TRUNC(x)取整函数 TRUNC(x) 3 注:x 可以是变量、常量,也可以是函数。 2.2 自动重新赋值(Automatic Recode)有的时候,我们需要重新把数值变量或字符变量按它本身的数值大小转换成为从1开始的顺序整数,并存放在新变量对应的记录中。首先,打开数据文据文件(DATA3-1.SAV),将数据调入工作区。然后,从菜单选择“Transform- Automatic Recode”命令,弹出连续型变量转换为分类变量对话框,如下图:操作步骤:1)从左边数据变量栏里把变量选入到右边的“Variable-New Name”框中。2)在“New Name:”输入新变量名称后,点击 Add New Name 按钮加入到“Variable-New Name”框中。3)在“Recode Starting from”设置赋值顺序,有以下两种顺序:Lowest value: 按从小到大顺序,赋值为1开始的顺序整数。Highest valus: 按从大到小顺序,赋值为1开始的顺序整数。4)单击 OK 按钮,执行转换。统计分析往往是从了解数据的基本特征开始的。描述数据分布特征的统计量可分为两类:一类表示数量的中心位置,另一类表示数量的变异程度(或称离散程度)。两者相互补充,共同反映数据的全貌。这些内容可以通过SPSS中的“Descriptive Statistics”菜单中的过程来完成。1 频数分析 (Descriptive Statistics - Frequencies)频数分布分析主要通过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。下面我们通过例子来学习单变量频数分析操作。1) 输入分析数据在数据编辑器窗口打开“data1-2.sav”数据文件。2) 调用分析过程在主菜单栏单击“Analyze”,在出现的下拉菜单里移动鼠标至“Descriptive Statistics”项上,在出现的次菜单里单击“Frequencies”项,打开如图3-4所示的对话框。 图3-4 “Frequencies” 对话框3) 设置分析变量从左则的源变量框里选择一个和多个变量进入“Variable(s):”框里。在这里我们选“三化螟蚁螟 虫口数”变量进入“Variable(s):”框。4) 输出频数分布表 Display frequency tables,选中显示。5) 设置输出的统计量单击“Statistics”按钮,打开图3-5所示的对话框,该对话框用于选择统计量: 图3-5 “Statistics”对话框 选择百分位显示“Percentiles Values”栏:Quartiles:四分位数,显示25%、50%和75%的百分位数。 Cut points for 10 equal groups:将数据平分为输入的10个等份。 Percentile(s)::用户自定义百分位数,输入值0100之间。选中此项后,可以利用“Add”、“Change”和 “Remove”按钮设置多个百分位数。 选择变异程度的统计量“Dispersion”:(离散趋势)Std.deviation 标准差 Minimum 最小值 Variance 方差 Maximum 最大值 Range 极差 S.E.mean 均值标准误 选择表示数据中心位置的统计量“Central Tendency”:(集中趋势)Mean 均值 Median 中位数 Mode 众数 Sum 算术和 选择分布指标“Distribution”:Skewness 偏度 Kurtosis 峰度6) 统计图形输出设置单击“Charts”按钮,将弹出如图3-6所示的对话框:图3-6 “Charts”对话框 Chart Type 图形选择栏: None: 不输出图形; Bar charts: 输出条形图; Pie charts: 输出饼图; Histograms: 输出柱状图。若选中“With normal curve”项,则在绘制柱状图中加绘一条正态分布曲线。 当用户选中条形图或饼图时,在“Chart Values”框的选项中可选择: Frequencies:绘制频数图。 Percentages:绘制频率图。7)设置频数表格式在图3-4对话框中,单击“Format”按钮,打开如图3-7所示的对话框:图3-7 “Format”对话框 设置排序的方法“Order by”: Ascending values:按变量值的升序排列。 Descending valus:按变量值的降序排列。 Ascending counts:按频数的升序排列。 Descending counts:按频数的降序排列。 选择多变量输出设置“Multiple Variables ”: Compare variables 选项,所有变量在一个图形中输出,以便进行比较。 Organize output by variables选项,为每一个变量单独输出一个图。 设置在频数表中显示的组数选中此项,输入分组数,系统缺省为10组。设置完成后,点击“Continue”按钮回到上一级对话框。8)提交执行在图3-4 对话框里单击“OK”按钮,SPSS在输出窗口的输出结果如表1、表2和图1结果。 9)分析结果表1 统计量表 Statistics三化螟蚁螟 N Valid120 Missing0Mean(平均数)75.14Std. Deviation(标准差)7.024Skewness(偏度系数)-.031Std. Error of Skewness(偏度系数误差).221Kurtosis(峰度系数)-.582Std. Error of Kurtosis(峰度系数误差).438Percentiles1065.00 2068.20 3071.00 4073.40 5075.00 6077.00 7079.00 8081.80 9084.90在表1中列出的信息有:有效观测值有124个,缺失值0个,平均数75.14,标准差7.024。偏度系数(Skewness)及误差:-0.031和0.221,峰度系数(Kurtosis)及误差:-0.582和0.438。表2 频数表三化螟蚁螟Frequency(频数)Percent(百分比)Valid Percent(有效观测值的百分比)Cumulative Percent(累积百分比)Valid?581.8.8.86232.52.53.3631.8.84.26443.33.37.56543.33.310.8661.8.811.76754.24.215.86854.24.220.06943.33.323.37043.33.326.77154.24.230.87275.85.836.77343.33.340.07443.33.343.37597.57.550.87697.57.558.37754.24.262.57865.05.067.57965.05.072.58065.05.077.58132.52.580.08243.33.383.38332.52.585.88454.24.290.08521.71.791.78643.33.395.08732.52.597.5881.8.898.3901.8.899.2911.8.8100.0Total120100.0100.0?在表2中列出的信息有:Frequency 频数;Percent 百分比;Valid Percent有效观测值的百分比;Cumulative Percent 累积百分比。 图3-8 频数分布的条形图表示2 列联表分析(Crosstabs)列联表是指两个或多个分类变量各水平的频数分布表,又称频数交叉表。SPSS的Crosstabs过程,为二维或高维列联表分析提供了22种检验和相关性度量方法。其中卡方检验是分析列联表资料常用的假设检验方法。例子:山东烟台地区病虫测报站预测一代玉米螟卵高峰期。预报发生期y为3级(1级为6月20日前,2级为6月21-25日,3级为6月25日后);预报因子5月份平均气温x1()分为3级(1级为16.5以下,2级为16.6-17.8,3级为17.8以上),6月上旬平均气温x2()分为3级(1级为20以下,2级为20.1-21.5,3级为21.5以上),6月上旬降雨量x3(mm)分为3级(1级为15mm以下,2级为15.1-30mm,3级为30mm以上),6月中旬降雨量x4(mm)分为3级(1级为29mm以下,2级为29.1-36mm,3级为36mm以上)。数据如下表。山东烟台历年观测数据分级表()年份 596061626364656667697071727374757677y131131121321223221x1322313233123111221x2123112211112311112x3311312132212123231x4311111111131121111注:摘自农业病虫统计测报 131页。 1) 输入分析数据在数据编辑器窗口打开“data1-3.sav”数据文件。数据文件中变量格式如下:2) 调用分析过程在菜单选中“Analyze-Descriptive- Crosstabs”命令,弹出列联表分析对话框,如下图3) 设置分析变量选择行变量:将“五月气温x1,六月上气温x2,六月上降雨x3,六月中降雨x4”变量选入“Rows:”行变量框中。选择列变量:将“玉米螟卵高峰发生期y”变量选入 “Columns:”列变量框中。4) 输出条形图和频数分布表 Display clustered bar charts: 选中显示复式条形图。 Suppress table: 选中则不输出多维频数分布表。5) 统计量输出点击“Statistics”按钮,弹出统计分析对话框(如下图)。Chi-Square: 卡方检验。选中可以输出皮尔森卡方检验(Pearson)、似然比卡方检验(Likelihood-ratio)、连续性校正卡方检验 (Continuity Correction)及Fisher精确概率检验(Fishers Exact test)的结果。Correlations: 选中输出皮尔森(Pearson)和Spearman相关系数,用以说明行变量和列变量的相关程度。Nominal: 两分类变量的关联度(Association)测量Contingency Coefficient: 列联系数,其值越大关联性越强。 Phi and Cramers V:Cramer列联系数,其值越大关联性越强。 Lambda: 减少预测误差率,1表示预测效果最好,0表示预测效果最差。 Uncertainty Coefficient: 不定系数Ordinal: 两有序分类变量(等级变量)的关联度测量Gamma: 关联度,+1表示完全正关联,-1表示负关联,0表示无联。 Somersd:列联度,其取值范围和意义同上。 Kendalls tau-b:Nominal by Interval: 一个定性变量和一个定量变量的关联度Eta:关联度统计量。Kappa:吻合度系数,其取值-1至+1,其值越大吻合程度越高。 Risk:危险度分析。 McNemar:配对计数资料的卡方检验。Cochrans and Mantel-Haenszel statistics: 检验在协变量存在下,两个二分类变量是否独立。6) 设置列联表的显示单击“Cells”按钮,弹出列联表显示内容对话框(如下图)。Counts: 频数 Observed: 观测频数。 Expected: 期望频数。Percentages: 百分比 Row: 占本行的百分比。 Column: 占本列的百分比。 Total: 占全部的百分比。Residuals: 残差分析 Unstandardized: 非标准化残差分析。 Standardized: 标准化残差分析。 Adj. Standardized: 调整的标准化残差分析。Noninteger Weights: Round cell counts: 临近列计算。 Truncate cell counts:。 Round case Weights临近记录度量 Truncate case Weights No adjustments: 不调整。7)设置输出格式单击Format按钮,弹出列联表输出格式对话框(如下图)。Row Order: 频数 Ascending: 行变量从小到大升序排列。 Descending: 行变量从大到小降序排列。8)设置检验单击“Exact”按钮,弹出精确检验对话框(如下图)。 Asymptotic only 近似的,系统设置。Monte Carlo Confidence level: 99% 置信度,系统默认99%。Number of samples: 10000 样本数量,系统默认10000。Exact Time limit per test: 5 minutes 限时检验时间,系统默认值5分钟。9)提交执行设置完成后,在列联表分析对话框中,点击OK 按钮,计算结果输出在结果窗口中。10)结果与分析在结果窗口中查看计算结果,主要输出内容如下。五月气温 * 玉米螟卵高峰发生期 Crosstab 玉米螟卵高峰发生期 Total 6月20日前 6月21-25日 6月25日以后 五月气温 16.5以下 Count(频数)Expected Count(期望值)12.722.031.366.016.6-17.8 Count(频数)Expected Count(期望值)22.732.011.366.017.8以上 Count(频数)Expected Count(期望值)52.712.001.366.0Total Count(频数)Expected Count88.066.044.01818.0 Chi-Square TestsValuedfAsymp. Sig. (2-sided)Pearson Chi-Square皮尔森卡方检验7.750(a)4.101Likelihood Ratio似然比卡方检验8.5104.075Linear-by-Linear Association6.2481.012N of Valid Cases18 a 9 cells (100.0%) have expected count less than 5. The minimum expected count is 1.33.(其余的省约)结果分析:从交叉表(Crosstab)对角线中看出,只有“五月气温与玉米螟卵高峰发生期”对角线上出现的频数大于期望值(52.7,32.0,31.3)。从卡方检验表得知,也只有“五月气温与玉米螟卵高峰发生期”能通过线性间的联合检验(Linear-by-Linear Association),双尾检验p0.012。因此,玉米螟卵高峰发生期与五月气温有密切的关系,五月气温越高,发生越早。 平 均 数 比 较Means过程用于统计分组变量的的基本统计量。这些基本统计量包括:均值(Mean)、标准差(Standard Deviation)、观察量数目(Number of Cases)、方差(Variance)。Means过程还可以列出方差表和线性检验结果。例子调查了棉铃虫百株卵量在暴雨前后的数量变化,统计暴雨前和暴雨后的统计量,其数据如下:暴雨前 110 115 133 133 128 108 110 110 140 104 160 120 120暴雨后 90 116 101 131 110 88 92 104 126 86 114 88 112该数据保存在“DATA4-1.SAV”文件中。1)准备分析数据 在数据编辑窗口输入分析的数据,如图4-2所示。或者打开需要分析的数据文件“DATA4-1.SAV”。图4-2 数据窗口 2)启动分析过程在SPSS主菜单中依次选择“AnalyzeCompare MeansMeans”。出现对话框如图4-3。图4-3 Means设置窗口 3)设置分析变量从左边的变量列表中选中“百株卵量”变量后,点击变量选择右拉按钮,该变量就进入到因子变量列表“Dependent List:”框里,用户可以从左边变量列表里选择一个或多个变量进行统计。从左边的变量列表中选中“调查时候”变量,点击“Independent List”框左边的右拉按钮,该变量就进入分组变量“Independent List”框里,用户可以从左边变量列表里选择一个或多个分组变量。多个分组变量既可放在一层,又可放在不同层。利用图中的“Previous”和“Next”按钮可以在不同层之间切换。4)选择输出统计量单击“Options”按钮,将打开如下图所示的对话框。在“Options”对话框中,“Statistics”框中列出了SPSS可求的统计量。其中各项的意义分别为: 1. Mean 均值。 2. Number of Cases 观测量数目 3. Standard Deviation 标准差 4. Median 中位数。 5. Grouped Median 分组的中位数 6. Std. Error of Mean 均值的标准误 7. Sum 观测值之和 8. Minimum 最小值 9. Maximum 最大值 1. Range 极差 2. First 第一个观测值 3. Last 最后一个观测值 4. Variance 方差 5. Kurtosis 峰度 6. Std. Error of Kurtosis 峰度的标准误 7. Skewness 偏度 8. Std. Error of Skewness 偏度的标准误 其中,“Mean”、“Number of Cases”和“Standard Deviation”项为系统的默认选项。在“Cell”框中列出了已选中的统计量。从“Statistics”框中选择要生成的统计量。“Statistics for First Layer”框中列出了第一层分组的另外两个统计量。 “Anova table and eta”选中将给出方差分析表和eta统计量。方差分析表的前提条件是按照分组变量分组后各组 的均值都相等。eta统计量为分组变量与生成统计量的变量关系紧密程度的度量。“Test for Iinearity”选中给出分析变量和分组变量的线性关系参数,其前提条件为:分组变量和分析变量线性相关。本例子选定统计量为“Mean”、“Number of Cases”、“Standard Deviation”3个统计变量。选中复选项“Anova table and eta”。5)提交执行提交各选项,在本例中我们不做其他选择,保持缺省值。在图4-3中点击“OK”按钮,SPSS输出结果将显示在输出浏览器中。6) 结果与分析表4-1 结果报告(Report) 表4-2 方差分析表 ANOVA Table结果分析: 表4-1结果报告,分别给出暴雨前和暴雨后卵量的统计量:暴雨前有13个样本,平均数122.38,标准差15.95,方差254.42; 暴雨后有13个样本,平均数104.46,标准差15.11,方差228.269;总体26个样本,平均数113.42,标准差17.75,方差315.214。表4-2方差分析表,共有六列,第一列说明方差的来源,Between Groups是组间的,Within Groups 组内的,Total 总的。第二列为平方和,其大小说明了各方差来源作用的大小。第三列为自由度。第四列为均方,即平方和除以自由度。第五列F值是F统计量的值,其计算公式为模型均方除以误差均方,用来检验模型的显著性。第六列是F统计量的显著值,由于这里的显著值0.007小于0.05,所以模型是显著的,降雨对卵量有显著影响。单一样本的T检验如果已知总体均数,进行样本均数与总体均数之间的差异显著性检验属于单一样本的T检验。在SPSS中,单一样本的T检验由“One-Sample T Test”过程来完成。例子有一种新型农药防治柑桔红蜘蛛,进行了9个小区的实验,其防治效果为:95%,92%,88%,92%,93%,95%,89%,98%,92%与原用农药的防治效果90%比较,分析其效果是否高于原用农药。该数据保存在“DATA4-2.SAV”文件中。1)准备分析数据 在数据编辑窗口输入分析的数据,如图4-4所示。或者打开需要分析的数据文件“DATA4-2.SAV”。图4-4 数据窗口 2)启动分析过程在SPSS主菜单选中“AnalyzeCompare MeansOne-Sample T Test”,打开单一样本T检验主对话框,如图4-5。图4-5 单一样本T检验变量选择窗3)设置分析变量设置检验变量: 从左边的变量列表中选中“防治效果”变量后,点击中部的右拉按钮后,这个变量就进入到检验分析“Test Variable(s):”框里,用户可以从左边变量列表里选择一个或多个变量进行分析。输入检验值: 在“Test Variable(s)”输入栏里,输入用于比较检验的均值:在本例中为90。4)设置其他参数单击“Options”按钮,打开设置检验的置信度和缺失值对话框。在“Confidence Interval:”框输入置信度水平,系统默认为95%。在“Missing Values”栏里选择缺失值处理方式:5)提交执行输入完成后,在过程主窗口中单击“OK”按钮,SPSS输出分析结果如表4-3和表4-4。6) 结果与分析表4-3 单一样本的统计量列表 One-Sample StatisticsTest Value = 90 tdfSig. (2-tailed)Mean Difference95% Confidence Interval of th
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工业设计与印刷课件
- 工业网络岗位安全培训课件
- 年度安全生产知识培训课件
- 年度安全培训个人总结课件
- 娱乐行业员工安全培训课件
- 工业气瓶安全使用培训
- 威海高区安全生产培训课件
- 城乡企业管理咨询业务合作合同7篇
- 年会安全培训总结课件
- 工业安全用电培训报告课件
- 盆腔超声诊断教学课件
- 电气化铁路技术培训课件
- 2024脓毒性休克的血流动力学管理要点
- 学校校服厂管理制度
- 2025至2030中国沥青基碳纤维行业发展趋势分析与未来投资战略咨询研究报告
- 【生物 黑吉辽蒙版】2025年普通高等学校招生选择性考试(解析版)
- T/CNFAGS 15-2024绿色合成氨分级标准(试行)
- 建筑工程答辩试题及答案
- 综合应用能力b类试卷及真题答案
- 行测资料5000题题库
- 2025-2030中国资产托管行业市场发展分析及前景趋势与投资研究报告
评论
0/150
提交评论