版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、spss上机实验指导书 spss统计软件应用实验指导书目 录1. 实验一 spss的数据管理2. 实验二 描述性统计分析3. 实验三 均值检验4. 实验四 相关分析5. 实验五 因子分析6. 实验六 聚类分析7. 实验七 回归分析8. 实验八 判别分析74实验一 spss的数据管理一、 实验目的1 熟悉spss的菜单和窗口界面,熟悉spss各种参数的设置;2掌握spss的数据管理功能。二、 实验内容及步骤统计分析离不开数据,因此数据管理是spss的重要组成部分。详细了解spss的数据管理方法,将有助于用户提高工作效率。spss的数据管理是借助于数据管理窗口和主窗口的file、data、tran
2、sform等菜单完成的。(一) spss进行统计处理的基本过程spss是statistics package for social sciences(社会科学统计软件包)的缩写,被广泛应用于社会科学和自然科学的各个领域中。spss功能强大,但操作简单,这一特点突出地体现在它统一而简单的使用流程中。spss进行统计处理的基本过程如图6-1所示:其基本步骤如下:1. 数据的录入将数据以电子表格的方式输入到spss中(*.sav, 是spss独有的格式),也可以从其它可转换的数据文件中读出数据。数据录入的工作分两个步骤,一是定义变量,二是录入变量值。2. 数据的预分析在原始数据录入完成后,要对数据进
3、行必要的预分析,如数据分组、排序、分布图、平均数、标准差的描述等,以掌握数据的基本特点和基本情况,保证后续工作的有效性,也为确定应采用的统计检验方法提供依据。3. 统计分析按研究的要求和数据的情况确定统计分析方法,然后对数据进行统计分析。4. 统计结果可视化在统计过程进行完后,spss会自动生成一系列数据表,其中包含了统计处理产生的整套数据。为了能更形象地呈现数据,需要利用spss提供的图形生成工具将所得数据可视化。如前所述,spss提供了许多图形来进行数据的可视化处理,使用时可根据数据的特点和研究的需求来进行选择。5. 保存和导出分析结果 数据结果生成完之后,则可将它以spss自带的数据格式
4、(*.spo)进行存贮,同时也可利用spss的输出功能以常见的数据格式进行输出,以供其它系统使用。(二)spss 数据文件的建立和管理(详细内容可参考“spss统计分析方法及应用.pdf ”中第二章)在使用spss软件进行数据分析时,首先要建立数据文件。通常一个数据文件的建立可以包括定义变量、数据输入、数据的编辑、数据文件的保存和输出等内容。(一)定义变量:输入数据前要定义变量,包括定义变量名、变量类型、变量宽度、变量标签和变量格式。定义变量的步骤如下:1打开定义变量的界面启动spss,进入主界面,单击图6-2所示的屏幕左下角的“variable view”选项卡,打开定义变量的表格。2输入变
5、量名,符合变量的命名规则在“name”列的第一个单元格输入第一个变量名,如 “编号”。 3确定变量类型单击“type”列的第一个单元格,如图6-3所示,spss的默认变量类型为数值型。单击数值型变量后的“”,弹出如图6-4所示的对话框,用户可以从该对话框中选择其他的变量类型。在图6-4的对话框中列出了8种可选的基本变量类型:数字型(numerric)、逗号型(comma)、句点型(dot)、科学计数型(scientific notation)、日期格式型(date)、美元型(dollar)、定制货币型(custom currency)和字符串型(string)。1)、numeric:数值型,同
6、时定义数值的宽度(width),即整数部分小数点小数部分的位数,默认为8位;定义小数位数(decimal places),默认为2位。2)、comma:加显逗号的数值型,即整数部分每3位数加一逗号,其余定义方式同数值型。3)、dot:3位加点数值型,无论数值大小,均以整数形式显示,每3位加一小点(但不是小数点),可定义小数位置,但都显示0,且小数点用逗号表示。如12345显示为 12345,00(实际是12345e4)4)、scientific notation:科学记数型,同时定义数值宽度(width)和小数位数(decimal places),在数据管理窗口中以指数形式显示。如 定义数值宽
7、度为9,小数位数为2,则345678 显示为346e02。5)、date:日期型,用户可从系统提供的日期显示形式中选择自己需要的。如选择mm/dd/yy形式,则1995年6月25日显示为06/25/95。6)、dollar:货币型,用户可从系统提供的日期显示形式中选择自己需要的,并定义数值宽度和小数位数,显示形式为数值前有$。7)、custom currency:常用型,显示为整数部分每3位加一逗号,用户可定义数值宽度和小数位数。如12345678显示为12,345678。8)、string:字符型,用户可定义字符长度(characters)以便输入字符。4设置变量的其他属性在图6-3所示的表
8、格中,“width”表示变量的总宽度,“decimal”表示小数位数,“lable”表示变量标签,“value”表示变量的值,“missing”表示缺失值,“alignment”表示对齐方式,“measurement”表示变量的种类。这些属性如果不是特殊需要,一般不要进行修改。(二)数据的输入定义好变量后,单击“variable view”选项卡旁的“data view”选项卡,进入数据输入窗口,按照spss表格直接输入数据即可。定义好变量并格式化数据之后,即可向数据管理窗口键入原始数据。数据管理窗口的主要部分就是电子表格,横方向为电子表格的行,其行头以1、2、3、表示,即第1、2、3、行;纵
9、方向为电子表格的列,其列头以var00001,var00002,var00003表示变量名。行列交叉处称为单元格,即保存数据的空格。鼠标一旦移入电子表格内即呈十字形,这时按鼠标左键可激活单元格,被激活的单元格以加粗的边框显示;用户也可以按方向键上下左右移动来激活单元格。单元格被激活后,用户即可向其中输入新数据或修改已有的数据。为方便起见,用户亦可省略定义变量和数据格式化两个步骤,一启动spss即向数据管理窗口中键入原始数据,这时,变量名默认为var00001,var00002,var00003(三)数据的编辑 edit 菜单1练习spss数据的定位:按个案号定位;按变量值自动定位2练习插入和删
10、除一条个案和一个变量3练习数据的移动、复制和删除(四)保存数据文件在查看器窗口中,进行以下操作,保存数据内容:1单击主菜单中的file菜单,打开file菜单条。2单击save选项,弹出“save data as”对话框。3输入文件名称,spss保存的文件类型为“*.sav”,单击“保存”按钮。spss能够将数据编辑窗口中的数据保存成多种格式的数据文件。如:spss 文件格式,excel文件格式,.dbf文件格式,文本格式等。(五)数据与统计结果的输出spss的文件输出是指将统计分析后的数据与结果以表格或图形的形式显示出来。如图6-7所示,为spss的输出窗口。在窗口的右侧以图表的形式显示输出结
11、果。spss可以对输出的文件进行保存,保存的类型为“*.spo”。(六)数据文件合并1 纵向合并:合并“职工数据.sav”和“追加职工.sav”,首尾对接。data-merge files-add cases.2横向合并:左右对接。data-merge files-add variables. 注意: 横向合并的两个数据文件必须至少有一个名称相同的变量,即关键变量. 两个数据文件都必须事先按关键变量进行升序排序.(三)spss 数据的预处理(详细内容可参考“spss统计分析方法及应用.pdf ”中第三章)(一)数据的排序: data-sort cases现有学生24人,分成两小组,在某一次期中
12、测验中,某学科测验成绩如表6-7所示。试利用spss对该班学生成绩进行等级排序操作步骤: 录入数据录入数据的过程分为两个步骤,一是定义变量,二是录入变量值。(1)定义变量:“学号”、“组别”与“成绩”。(2)录入变量值:在数据编辑窗口中,按照表1的内容,将各变量值一一录入。录入后的部分界面如图6-14所示。 数据的等级排序(1)选择“datasort cases”命令,弹出“sort cases”对话框,把“成绩”变量选入“sort by”中,并在sort order中选择“ascending(降序)”选项,将学生成绩按升序排列,如图6-15所示,单击“ok”按钮。(2)排序结果排序结果在数据
13、编辑窗口可以即时浏览,如图6-16所示,并可以通过选择“fileprint”命令,将结果打印输出。练习1: 打开案例数据中的”住房状况调查.sav”, 通过数据排序功能分析本市户口和外地户口家庭的住房面积情况。(二)变量计算 transform-computespss的变量计算是在原有数据的基础上,根据用户给出的spss算术表达式以及函数,对所有个案或满足的条件的部分个案,计算产生一系列的新变量。变量的计算结果应保存到一个指定变量中。变量计算过程中涉及几个概念:spss算术表达式,spss条件表达式,函数。(详细内容可参考“spss统计分析方法及应用.pdf ”)。 选transform菜单的
14、compute命令项,既可对选定的变量进行运算操作,又可通过运算操作让系统生成新的变量。在弹出的compute variable对话框中,用户首先在target variable指定一个变量(可以是数据管理器中已有的变量,也可是用户欲生成的新变量),然后点击type&label钮确定是数值型变量,还是字符型变量,或加上变量标签。在numeric expression框中键入运算公式,系统提供计算器和82种函数(在functions框内)让用户使用;若点击if钮会弹出compute variable:if cases对话框,用户可指定符合条件的变量参与运算。练习2:打开“职工数据.sav”,依据
15、职称级别计算实发工资,计算规则:实发工资=基本工资-失业保险,之后,依据职称1-4个等级分别将以上计算结果上浮50%,30%,20%,10%。(三)数据选取 样本抽样。data-select cases选data菜单的select cases命令项,弹出select cases对话框,后面的分析只针对选出的样本进行,直到用户取消这种选取为止。系统提供如下几种选择方法:1、all cases:表示所有的观察例数都被选择,该选项可用于解除先前的选择;2、if condition is satisfied:表示按指定条件选择,点击if钮,弹出select cases:if对话框,先选择变量,然后定义
16、条件;3、random sample of cases:表示对观察单位进行随机抽样,点击sample钮,弹出select cases:random sample对话框,有两种选择分式,一是大概抽样(approximately)即键入抽样比例后由系统随机抽取,另一是精确抽样(exactly)即要求从第几个观察值起抽取多少个;4、based on time or case range:表示顺序抽样,点击range钮,弹出select cases:range对话框,用户定义从第几个观察值抽到第几个观察值;5、use filter variable:表示用指定的变量作过滤,用户先选择1个变量,系统自动
17、在数据管理器中将该变量值为0或系统缺失值的观察单位标上删除标记,系统对有删除标记的观察单位不作分析。若用户在select cases对话框的unselected cases are框中选deleted项,则系统将删除所有被标上删除标记的观察单位。调用select cases命令完成定义后,spss将在主窗口的最下面状态行中显示filter on字样;若调用该命令后的数据库被用户存盘,则当这个数据文件再次打开使用时,仍会显示filter on字样,意味着数据选择命令依然有效。练习3: 打开案例数据中的”住房状况调查.sav”, 分别采用以下两种样本选取方案:1 希望对具有本市户口的家庭住房状况进
18、行分析,因此应只选择本市户口的住户样本。2 希望对全部样本的70%的数据进行分析,因此应采用随机选取中的近似选取方法进行抽样。(四)计数 transform-countspss实现的计数是对所有个案或满足条件的部分个案,计算若干个变量中有几个变量的值落在指定的区间内,并将计数结果存入一个新的变量中的过程。关键步骤:指定哪些变量参与计数,计数的结果存入哪个新变量中。指定计数区间。练习4: 打开案例数据中的”住房状况调查.sav”,分析被调查的家庭中有多少比例的家庭对目前的住房满意且近几年不准备购买住房。(五)分类汇总 data-aggregate如某企业希望了解本企业不同学历职工的基本工资是否存
19、在较大差距。通过分类汇总,将职工按学历进行分类,然后分别计算不同学历职工的平均工资,对平均工资进行比较。关键:按哪个变量进行分类;对哪个变量进行汇总,并指定对汇总变量计算哪些统计量。用户还可对数据管理器中的数据按指定变量的数值进行归类分组汇总,汇总的形式十分多样。例如,要对下列数据按变量group的大小,把变量x1作平均值汇总、把变量x2作求和汇总。选data菜单的aggregate命令项,弹出aggregate data对话框,在变量名列框中选group变量,点击使之进入break variable(s)框,选x1变量进入aggregate variable(s)框,因x1欲作平均值汇总,故
20、点击function钮弹出aggregate data: aggregate function对话框选mean of values项点击continue钮返回;选x2变量进入aggregate variable(s)框,因x2变量欲作求和汇总,故点击function钮选sum of values项点击continue钮返回。再点击ok钮即可。分组汇总提供的函数形式有:1、mean of values:求该组的平均值;2、standard deviation:求该组的标准差;3、first value:只保留该组的第1个数值;4、minimum value:只保留该组的最小值;5、last va
21、lue:只保留该组的最后1个数值;6、maximum value:只保留该组的最大值;7、number of cases:合计该组的观察例数;8、sum of values :求该组所有观察值的和。9、percentage above :先确定1个数值,求大于该数值的所有例数占总例数的百分比(0100%);10、percentage below:先确定1个数值,求小于该数值的所有例数占总例数的百分比(0100%);11、fraction above:先确定1个数值,求大于该数值的所有例数占总例数的百分比(01);12、fraction below:先确定1个数值,求小于该数值的所有例数占总例数
22、的百分比(01);13、percentage inside:先确定1个下限,再确定1个上限,求数值在该区间内的例数占总例数的百分比(0100%);14、percentage outside:先确定1个下限,再确定1个上限,求数值在该区间外的例数占总例数的百分比(0100%);15、fraction inside:先确定1个下限,再确定1个上限,求数值在该区间内的例数占总例数的百分比(01);16、fraction outside:先确定1个下限,再确定1个上限,求数值在该区间外的例数占总例数的百分比(01)。练习5: 打开案例数据中的”住房状况调查.sav”, 分析本市户口家庭和外地户口家庭目
23、前人均住房面积的平均值是否有较大差距,未来打算购买住房的平均面积是否有较大差距。(六)数据分组transform-recode-into different variables变量值较多时,通常采用组距分组,将全部变量值依次划分为若干个区间,并将同一区间的变量值作为一组。要确定分组数目,确定组距。练习6: 打开案例数据中的”住房状况调查.sav”, 分析被调查家庭的人均住房面积分布特征。(七)自学练习数据预处理的其他功能数据转置:data-transpose数据拆分:data-split file 等。三、练习题:1、定义spss数据结构。下表是某大学的一个问卷调查,要求将问卷调查结果表示成s
24、pss可识别的数据文件,利用spss软件进行分析和处理。练习:创建数据文件的结构,即数据文件的变量和定义变量的属性。表1 大学教师基本情况调查表问题备选答案1姓名2 性别3年龄4学历5 工作年月6职称7本年度教学工作量(课时)4(1)专科(2)本科(3)硕士(4)博士(5)博士后6 (1)助教(2)讲师(3)副教授(4)教授7 (1)0120 (2)120240 (3)240320 (4)320480 (5) 480以上8 本年度公开发表论文数9 本年度您的科研经费总额(万元)10.您认为学校对科研人员每年的科研成果要求是否合理(1)合理 (2)不合理 (3)无所谓11 您最常用的全文期刊数据
25、库的名称(多选,限选2个)(1)cnki (2)万方 (3)springerlink (4)ebsco12 您对学校科研管理部门的工作是否满意(1)非常满意 (2)满意 (3)一般 (4)不满意2 、高校提前录取名单的确定某高校今年对部分考生采取单独出题、提前录取的招生模式。现有20名来自国内不同省市的考生报考该校,7个录取名额。见数据文件compute.sav. 该校制定了如下录取原则:(1)文化课成绩由数学、语文、英语和综合四门成绩组成。文化课成绩制定最低录取分数线:400分。(2)个人档案中若有“不良记录”,不予录取。(3)对西部考生和少数民族考生,给予加分优惠。少数民族考生加20分,西
26、部考生加10分。(4)对参加过省以上竞赛并取得三等奖以上名次的考生,每项加10分。(5)文化课成绩和加分总和构成综合分,录取综合排名为前7名的学生。练习:利用spss软件,综合利用所学 ,给出成绩排名的操作步骤。四、实验小结:实验中遇到的问题及解决办法、心得体会等等.实验二 描述性统计分析一、 实验目的利用spss进行描述性统计分析。要求掌握频数分析(frequencies过程)、描述性分析(descriptives过程)、交叉列联表分析(crosstabs过程)。二、 实验内容及步骤(一)频数分析 (descriptive statistics - frequencies)频数分布分析主要通
27、过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。1) 输入分析数据在数据编辑器窗口打开“data1-2.sav”数据文件。2) 调用分析过程在主菜单栏单击“analyze”,在出现的下拉菜单里移动鼠标至“descriptive statistics”项上,在出现的次菜单里单击“frequencies”项,打开如图3-4所示的对话框。 3) 设置分析变量从左则的源变量框里选择一个和多个变量进入“variable(s):”框里。在这里我们选“三化螟蚁螟 虫口数”变量进入“variable(s):”框。4) 输出频数分布表 display frequency t
28、ables,选中显示。5) 设置输出的统计量单击“statistics”按钮,打开图3-5所示的对话框,该对话框用于选择统计量: 图3-5 “statistics”对话框 选择百分位显示“percentiles values”栏:quartiles:四分位数,显示25%、50%和75%的百分位数。 cut points for 10 equal groups:将数据平分为输入的10个等份。 percentile(s):用户自定义百分位数,输入值0100之间。选中此项后,可以利用“add”、“change”和“remove”按钮设置多个百分位数。 选择变异程度的统计量“dispersion”:(
29、离散趋势)std.deviation 标准差 minimum 最小值 variance 方差 maximum 最大值 range 极差 s.e.mean 均值标准误 选择表示数据中心位置的统计量“central tendency”:(集中趋势)mean 均值 median 中位数 mode 众数 sum 算术和 选择分布指标“distribution”:skewness 偏度 kurtosis 峰度6) 统计图形输出设置单击“charts”按钮,将弹出如图3-6所示的对话框:图3-6 “charts”对话框 chart type 图形选择栏: none: 不输出图形; bar charts:
30、输出条形图; pie charts: 输出饼图; histograms: 输出柱状图。若选中“with normal curve”项,则在绘制柱状图中加绘一条正态分布曲线。 当用户选中条形图或饼图时,在“chart values”框的选项中可选择: frequencies:绘制频数图。 percentages:绘制频率图。7)设置频数表格式在图3-4对话框中,单击“format”按钮,打开如图3-7所示的对话框:图3-7 “format”对话框 设置排序的方法“order by”: ascending values:按变量值的升序排列。 descending valus:按变量值的降序排列。
31、ascending counts:按频数的升序排列。 descending counts:按频数的降序排列。 选择多变量输出设置“multiple variables ”: compare variables 选项,所有变量在一个图形中输出,以便进行比较。 organize output by variables选项,为每一个变量单独输出一个图。 设置在频数表中显示的组数选中此项,输入分组数,系统缺省为10组。设置完成后,点击“continue”按钮回到上一级对话框。8)提交执行在图3-4 对话框里单击“ok”按钮,spss在输出窗口的输出结果。9)分析解释结果(二)描述性分析(descrip
32、tives过程)descriptives过程可对变量进行描述性统计分析,计算并列出一系列相应的统计指标,其功能和频数分析过程类似,主要以计算数值型单变量的统计量为主,但没有图形功能。该过程还有个特殊功能就是可将原始数据转换成标准正态评分值并以变量的形式存入数据文件中,供以后分析。在主菜单栏单击“analyze”,在出现的下拉菜单里移动鼠标至“descriptive statistics”项上,在出现的次菜单里单击“descriptives”项,打开如图界面。【save standardized values as variables复选框】确定是否将原始数据的标准正态评分存为新变量。【opti
33、ons钮】弹出options对话框,大部分内容均在前面frequences过程的statistics对话框中见过,只有最下方的display order单选钮组是新的,提供了多个变量时的输出顺序。可以选择为变量列表顺序、字母顺序、均数升序或均数降序。(三)交叉列联表分析(crosstabs过程)。列联表是指两个或多个分类变量各水平的频数分布表,又称频数交叉表。spss的crosstabs过程,为二维或高维列联表分析提供了22种检验和相关性度量方法。其中卡方检验是分析列联表资料常用的假设检验方法。例子:山东烟台地区病虫测报站预测一代玉米螟卵高峰期。预报发生期y为3级(1级为6月20日前,2级为6
34、月21-25日,3级为6月25日后);预报因子5月份平均气温x1()分为3级(1级为16.5以下,2级为16.6-17.8,3级为17.8以上),6月上旬平均气温x2()分为3级(1级为20以下,2级为20.1-21.5,3级为21.5以上),6月上旬降雨量x3(mm)分为3级(1级为15mm以下,2级为15.1-30mm,3级为30mm以上),6月中旬降雨量x4(mm)分为3级(1级为29mm以下,2级为29.1-36mm,3级为36mm以上)。数据如下表。山东烟台历年观测数据分级表()年份 596061626364656667697071727374757677y1311311213212
35、23221x1322313233123111221x2123112211112311112x3311312132212123231x4311111111131121111注:摘自农业病虫统计测报 131页。 1) 输入分析数据在数据编辑器窗口打开“data1-3.sav”数据文件。数据文件中变量格式如下:2) 调用分析过程在菜单选中“analyze-descriptive- crosstabs”命令,弹出列联表分析对话框,如下图3) 设置分析变量选择行变量:将“五月气温x1,六月上气温x2,六月上降雨x3,六月中降雨x4”变量选入“rows:”行变量框中。选择列变量:将“玉米螟卵高峰发生期y”
36、变量选入 “columns:”列变量框中。4) 输出条形图和频数分布表 display clustered bar charts: 选中显示复式条形图。 suppress table: 选中则不输出多维频数分布表。5) 统计量输出点击“statistics”按钮,弹出统计分析对话框(如下图)。chi-square: 卡方检验。选中可以输出皮尔森卡方检验(pearson)、似然比卡方检验(likelihood-ratio)、连续性校正卡方检验(continuity correction)及fisher精确概率检验(fishers exact test)的结果。correlations: 选中输出
37、皮尔森(pearson)和spearman相关系数,用以说明行变量和列变量的相关程度。nominal: 两分类变量的关联度(association)测量contingency coefficient: 列联系数,其值越大关联性越强。 phi and cramers v:cramer列联系数,其值越大关联性越强。 lambda: 减少预测误差率,1表示预测效果最好,0表示预测效果最差。 uncertainty coefficient: 不定系数ordinal: 两有序分类变量(等级变量)的关联度测量gamma: 关联度,+1表示完全正关联,-1表示负关联,0表示无联。 somersd:列联度,其
38、取值范围和意义同上。 kendalls tau-b:nominal by interval: 一个定性变量和一个定量变量的关联度eta:关联度统计量。kappa:吻合度系数,其取值-1至+1,其值越大吻合程度越高。 risk:危险度分析。 mcnemar:配对计数资料的卡方检验。cochrans and mantel-haenszel statistics: 检验在协变量存在下,两个二分类变量是否独立。6) 设置列联表的显示单击“cells”按钮,弹出列联表显示内容对话框(如下图)。counts: 频数 observed: 观测频数。 expected: 期望频数。percentages: 百
39、分比 row: 占本行的百分比。 column: 占本列的百分比。 total: 占全部的百分比。residuals: 残差分析 unstandardized: 非标准化残差分析。 standardized: 标准化残差分析。 adj. standardized: 调整的标准化残差分析。noninteger weights: round cell counts: 临近列计算。 truncate cell counts:。 round case weights临近记录度量 truncate case weights no adjustments: 不调整。7)设置输出格式单击format按钮,弹
40、出列联表输出格式对话框(如下图)。row order: 频数 ascending: 行变量从小到大升序排列。 descending: 行变量从大到小降序排列。8)设置检验单击“exact”按钮,弹出精确检验对话框(如下图)。 asymptotic only 近似的,系统设置。monte carlo confidence level: 99% 置信度,系统默认99%。number of samples: 10000 样本数量,系统默认10000。exact time limit per test: 5 minutes 限时检验时间,系统默认值5分钟。9)提交执行设置完成后,在列联表分析对话框中,
41、点击ok 按钮,计算结果输出在结果窗口中。10)结果与分析在结果窗口中查看计算结果,主要输出内容如下。五月气温 * 玉米螟卵高峰发生期 crosstab 玉米螟卵高峰发生期 total 6月20日前 6月21-25日 6月25日以后 五月气温 16.5以下 count(频数)expected count(期望值)12.722.031.366.016.6-17.8 count(频数)expected count(期望值)22.732.011.366.017.8以上 count(频数)expected count(期望值)52.712.001.366.0total count(频数)expecte
42、d count88.066.044.01818.0 chi-square testsvaluedfasymp. sig. (2-sided)pearson chi-square皮尔森卡方检验7.750(a)4.101likelihood ratio似然比卡方检验8.5104.075linear-by-linear association6.2481.012n of valid cases18 a 9 cells (100.0%) have expected count less than 5. the minimum expected count is 1.33.(其余的省略)结果分析:从交叉
43、表(crosstab)对角线中看出,只有“五月气温与玉米螟卵高峰发生期”对角线上出现的频数大于期望值(52.7,32.0,31.3)。从卡方检验表得知,也只有“五月气温与玉米螟卵高峰发生期”能通过线性间的联合检验(linear-by-linear association),双尾检验p0.012。因此,玉米螟卵高峰发生期与五月气温有密切的关系,五月气温越高,发生越早。 三、练习题:1、打开数据文件descriptives.sav,是从某校选取的3个班级共16名学生的体检列表,要求以班级为单位列表计算年龄,体重和身高的统计量,包括极差,最小最大值,均值,标准差和方差。给出操作步骤和分析结果。2、某
44、医生用国产呋喃硝胺治疗十二指肠溃疡,以甲氰咪胍作对照组,问两种方法治疗效果有无差别处 理愈 合未愈合合计呋喃硝胺54862甲氰咪胍442064合 计9828126(提示:由于此处给出的直接是频数表,因此在建立数据集时可以直接输入三个变量行变量、列变量和指示每个格子中频数的变量,然后用weight cases对话框指定频数变量,最后调用crosstabs过程进行x2检验。假设三个变量分别名为r、c和w,则数据集结构和命令如下):rcw1.001.0054.001.002.0044.002.001.008.002.002.0020.00四、实验小结:实验中遇到的问题及解决办法、心得体会等等. 实验
45、三 均值检验一、 实验目的学习利用spss进行单样本、两独立样本以及成对样本的均值检验。二、 实验内容及步骤(一)单样本t检验(one-sample t test过程)实验内容:某地区10年测得16-18岁人口的平均血红蛋白值为10.25。现在抽查测量了该地区40个16-18岁人口的血红蛋白如表3.1,试分析该地区现在16-18岁人口的血红蛋白与10年前相比,是否有显著的差异?表3.1对象编号性别年龄血红蛋白值对象编号性别年龄血红蛋白值1234567891011121314151617181920女男女女男男女男女女男男男女女女男男女男18161817161816181817181816171
46、7171716161812.8315.5012.2510.0610.889.658.3611.668.547.7813.6610.5712.569.878.9911.3514.5612.408.0514.032122232425262728293031323334353637383940女男男女女女女男男男男女女女男男男男女男161618181718171616181616181818181717161611.3612.7815.098.678.5612.5611.5614.677.8812.3513.659.8710.0912.5516.0413.7811.6710.988.7811.35实
47、验步骤:1建立数据文件。打开数据文件。定义4个变量:id、gender、age和hb,分别表示编号、性别、年龄和血红蛋白值。2. 选择菜单“analyzecompare meansone-sample t test”。弹出“one-sample t test”对话框。 3在对话框左侧的变量列表中选择变量“血红蛋白”进入“test variable(s)” 框;在“test value” 编辑框中输入过去的平均血红蛋白值10.25. 4单击“ok”按钮,得到输出结果,对结果进行分析解释。(二)双样本t检验(independent-samples t test过程)实验内容:分别测得14例老年性慢
48、性支气管炎病人及11例健康人的尿中17酮类固醇排出量(mg/dl)如下,试比较两组均数有无差别。病 人2.90 5.41 5.48 4.60 4.03 5.10 4.97 4.24 4.36 2.72 2.37 2.09 7.10 5.92健康人5.18 8.79 3.14 6.46 3.72 6.64 5.60 4.57 7.71 4.99 4.01实验步骤: 1建立数据文件。 定义变量名:把实际观察值定义为x,再定义一个变量group来区分病人与健康人。输入原始数据,在变量group中,病人输入1,健康人输入2。 2. 选择菜单“analyzecompare meansindependen
49、t-samples t test”项,弹出“independent- samples t test”对话框。从对话框左侧的变量列表中选x,进入“test variable(s)”框,选择变量“group”,进入“grouping variable”框,点击“define groups”钮弹出“define groups”定义框,在group 1中输入1,在group 2中输入2。3单击“ok”按钮,得到输出结果,对结果进行分析解释。(三)成对样本t检验(paired-samples t test过程)实验内容:某单位研究饲料中缺乏维生素e与肝中维生素a含量的关系,将大白鼠按性别、体重等配为8对
50、,每对中两只大白鼠分别喂给正常饲料和维生素e缺乏饲料,一段时期后将之宰杀,测定其肝中维生素a含量(mmol/l)如下,问饲料中缺乏维生素e对鼠肝中维生素a含量有无影响?大白鼠对别肝中维生素a含量(mmol/l)正常饲料组维生素e缺乏饲料组1234567837.220.931.441.439.839.336.131.925.725.118.833.534.028.326.218.3实验步骤:1建立数据文件。定义变量名:正常饲料组测定值为x1,维生素e缺乏饲料组测定值为x2,输入原始数据。2选择菜单“analyzecompare meanspaired-samples t test”项,弹出“pa
51、ired - samples t test”对话框。从对话框左侧的变量列表中选择变量x1、x2进入variables框。 3单击“ok”按钮,得到输出结果,对结果进行分析解释。三、练习题:1、一个生产高性能汽车的公司生产直径为322mm的圆盘制动闸。公司的质量控制部门随机抽取不同机器生产的制动闸进行检验。共4台机器,每台机器抽取16支产品。见数据文件ttest1.sav,要求检验每个机器生产的产品均值和322在90%的置信水平下是否有显著差异。2、在体育课上记录14名学生乒乓球得分的数据,男女各7名。数据如下:男:82.00 80.00 85.00 85.00 78.00 87.00 82.0
52、0女:75.00 76.00 80.00 77.00 80.00 77.00 73.00比较在置信度为95%的情况下男女生得分是否有显著差别。3、某医疗结构针对具有家族心脏病史的病人研发了一种新药。为了检验这种新药的疗效是否显著,对16位病人进行为期半年的观察测试,测试指标为使用该药之前和之后的体重以及甘油三酯的水平的变化。见数据文件ptest.sav.四、实验小结:实验中遇到的问题及解决办法、心得体会等等.实验四 相关分析一、 实验目的学习利用spss进行相关分析、偏相关分析、距离分析。二、实验内容及实验步骤(一)两变量的相关分析(bivariate过程)实验内容:某地区10名健康儿童头发和全血中的硒含量(1000ppm)如下,试作发硒与血硒的相关分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 黄石市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)含答案详解(巩固)
- 达州市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)含答案详解(黄金题型)
- 2026年齐齐哈尔市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)完整答案详解
- 2025年大学生就业知识竞赛题库及答案
- 商洛市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)及答案详解(考点梳理)
- 邵阳市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)附答案详解(b卷)
- 张掖市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)及答案详解(有一套)
- 江西省农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)及答案详解(真题汇编)
- 西双版纳州农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)附答案详解(b卷)
- 郑州市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)及答案详解(各地真题)
- 有限空间作业专项施工方案
- 未来工程师的展望-展示专业能力共创未来趋势
- 事业机关食堂承包合同6篇
- 整式(第一课时)课件冀教版七年级数学上册
- 《四川省电动汽车充电设施建设技术标准》
- 厂房办公室装饰施工方案
- 浙江省天域全国名校协作体2026届高三上学期10月联考政治试题(含答案)
- 医养结合政策课件
- 省工程技术研究中心答辩
- 环卫机械安全培训内容课件
- 财务报表数据核对与审计清单
评论
0/150
提交评论