spss软件实验指导书_第1页
spss软件实验指导书_第2页
spss软件实验指导书_第3页
spss软件实验指导书_第4页
spss软件实验指导书_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、spss统计分析软件实验指 导 书经济与管理学院工商管理系统计模拟实习课程组2011年2月目 录1. 实验一 spss的数据基本操作2. 实验二 描述性统计分析3. 实验三 均值比较4. 实验四 相关分析和回归分析5. 实验五 聚类分析和判别分析6. 实验六 因子分析和主成分分析spss统计分析软件实验一、课程实验课所占学时30学时二、 实验适用专业经济管理类各专业三、 实验的任务、性质和目的统计计算,尤其是多元统计计算往往是十分复杂的,因此需要借助统计软件。本课程实验正是为了使学生系统地学习spss这一统计软件,培养学生根据实际问题建立spss数据文件、利用spss软件提供的各种统计功能进行

2、统计分析,并结合一定专业知识对分析结果给出合理解释的能力,从而为学生以后从事统计分析工作打下基础。 四、 实验方式与基本要求1由授课教师讲清上机实验的基本要求和注意事项;2由授课教师事先布置上机实验的内容,设计要求,操作步骤,并要求学生课前进行准备;3学生集中在机房上机;4要求学生每次完成所布置的任务,提交实验报告。五、 考核方式与评分办法1. 实验报告(60%)2. 上机检查(20%)3. 考勤(20%)42实验一 spss基本操作一、 实验目的1 熟悉spss的菜单和窗口界面,熟悉spss各种参数的设置;2掌握spss的数据管理功能。二、 实验内容及步骤(一) 数据的输入和保存1. sps

3、s界面当打开spss后,展现在我们面前的界面如下:请注意窗口顶部显示为“spss for windows data editor”,表明现在所看到的是spss的数据管理窗口。这是一个典型的windows软件界面,有菜单栏、工具栏。该界面和excel极为相似,很多操作也与excel类似,同学们可以自己试试。2.定义变量选择菜单data=>define variable。系统弹出定义变量对话框如下:对话框最上方为变量名,现在显示为“var00001”,这是系统的默认变量名;往下是变量情况描述,可以看到系统默认该变量为数值型,长度为8,有两位小数位,尚无缺失值,显示对齐方式为右对齐;第三部分为

4、四个设置更改按钮,分别可以设定变量类型、标签、缺失值和列显示格式;第四部分实际上是用来定义变量属于数值变量、有序分类变量还是无序分类变量,现在系统默认新变量为数值变量;最下方则依次是确定、取消和帮助按钮。假如有两组数据如下:group 1: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11group 2: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87先来建立分组变量group。请将变量名改为group,然后单击ok按钮。现在spss的数据管理窗口如下所

5、示:第一列的名称已经改为了“group”,这就是我们所定义的新变量“group”。现在我们来建立变量x。单击第一行第二列的单元格,然后选择菜单data=>define variable,同样,将变量名改为x,然后确认。此时spss的数据管理窗口如下所示:现在,第一、第二列的名称均为深色显示,表明这两列已经被定义为变量,其余各列的名称仍为灰色的“var”,表示尚未使用。同样地,各行的标号也为灰色,表明现在还未输入过数据,即该数据集内没有记录。3.输入数据我们先来输入变量x的值,请确认一行二列单元格为当前单元格,弃鼠标而用键盘,输入第一个数据0.84,此时界面显示如图a所示:请注意:在回车之

6、前,你输入的数据在数据栏内显示,而不是在单元格内显示,现在回车,界面如图b所示:首先,当前单元格下移,变成了二行二列单元格,而一行二列单元格的内容则被替换成了0.84;其次,第一行的标号变黑,表明该行已输入了数据;第三,一行一列单元格因为没有输入过数据,显示为“.”,这代表该数据为缺失值。4. 保存数据选择菜单file=>save,由于该数据从来没有被保存过,所以弹出save as对话框如下:单击保存类型列表框,可以看到spss所支持的各种数据类型,有dbf、foxpro、excel、access等,这里我们仍然将其存为spss自己的数据格式(*.sav文件)。在文件名框内键入li1_1

7、并回车,可以看到数据管理窗口左上角由untitled变为了现在的变量名li1_1。(二)数据的预分析1. 数据的简单描述首先我们需要知道数据的基本情况,如均数、标准差等。选择analyze=>descriptive statistics=>descriptives菜单,系统弹出描述对话框如下:该对话框可分为左右两大部分,左侧为所有可用的侯选变量列表,右侧为选入变量列表。我们只需要描述x,用鼠标选中x,单击中间的,变量x的标签就会移入右侧,注意这时ok按钮变黑,表明已经可以进行分析了,单击它,系统会弹出一个新的界面如下所示:该窗口上方的名称为spss for windows view

8、er,即(结果)浏览窗口,整个的结构和资源管理器类似,左侧为导航栏,右侧为具体的输出结果。结果表格给出了样本数、最小值、最大值、均数和标准差这几个常用的统计量。从中可以看到,24个数据总的均数为1.2846,标准差为0.4687。如果数据进行了分组,还可以看看分组的描述情况。这里要用到文件分割功能,请切换回数据管理窗口,选择data=>split file菜单,系统弹出文件分割对话框如下:选择单选按钮organize output by groups,将变量group选入右侧的选入变量框,单击ok钮,此时界面不会有任何改变,但请再做一次数据描述,你就可以看到现在数据是分group=1和g

9、roup=2两种情况在描述了!从描述可知两组的均数和标准差分别为1.5209、1.0846和0.4218、0.4221。2. 绘制直方图统计指标只能给出数据的大致情况,没有直方图那样直观,我们就来画个直方图瞧瞧!选择graphs=>histogram,系统会弹出绘制直方图对话框如下:将变量x选入variable选择框内,单击ok按钮。此时结果浏览窗口内将绘制出直方图。最后,我们还要取消变量分割,免得它影响以后的统计分析,再次调出变量分割对话框,选择单选按钮中的“analyze all cases, do not creat group”,单击ok按钮就可以了。(三)保存和导出分析结果1.

10、保存结果文件在结果浏览窗口中(注意:一定要在结果浏览窗口中)选择菜单file=>save,由于该结果也从来没有被保存过,所以弹出和前面保存数据时极为相似的一个save as对话框,和前面相比,他唯一的区别就是文件的保存类型只有view files(*.spo)一种。在文件名框中键入“li1_1”并回车,该结果文件就会按文件名li1_1.spo被存储。2. 导出分析结果文件倒是保存了,但问题还没有完全解决:我们从来写文章什么的都用的是文字处理软件,尤其是word,可word不能直接读取spo格式的文件,怎么办呢?没关系,spss提供了将结果导出为纯文本格式或网页格式的功能,在结果浏览窗口中

11、选择菜单file=>export,系统会弹出exprot output对话框如下:最上方的export下拉式列表可以选择输出的内容,可以为含图表的输出文档、无图表的输出文档和只有统计图表三种;中部的export file对话框则填入输出的目标文件名;左下方的export what单选框可以选择输出结果的哪些部分,可以是所有结果、所有可见结果或只输出选择的结果,一般选输出所有可见结果;右下方的输出文件类型下拉式列表已被我打开,可见里面有网页格式和纯文本格式两种,在一切按所需选择完毕后按ok钮,则结果文件就会输出为你想要的类型。实验二 描述性统计分析一、实验目的1、掌握数据集中趋势和离中趋势

12、的分析方法;2、熟练掌握各个分析过程的基本步骤以及彼此之间的联系和区别。二、实验内容及步骤(一)frequencies过程频数分布表是描述性统计中最常用的方法之一,frequencies过程就是专门为产生频数表而设计的。它不仅可以产生详细的频数表,还可以按要求给出某百分位点的数值,以及常用的条图,圆图等统计图。和国内常用的频数表不同,几乎所有统计软件给出的均是详细频数表,即并不按某种要求确定组段数和组距,而是按照数值精确列表。如果想用frequencies过程得到我们所熟悉的频数表,请先用第二章学过的recode过程产生一个新变量来代表所需的各组段。1.界面说明frequencies对话框的界

13、面如下所示:该界面在spss中实在太普通了,无须多言,重点介绍一下各部分的功能如下:【display frequency tables复选框】确定是否在结果中输出频数表。【statistics钮】单击后弹出statistics对话框如下,用于定义需要计算的其他描述统计量。现将各部分解释如下:percentile values复选框组 定义需要输出的百分位数,可计算四分位数(quartiles)、每隔指定百分位输出当前百分位数(cut points for   equal groups)、或直接指定某个百分位数(percentiles),如直接指定输出p2.5和p97.5。

14、central tendency复选框组 用于定义描述集中趋势的一组指标:均数(mean)、中位数(median)、众数(mode)、总和(sum)。 dispersion复选框组 用于定义描述离散趋势的一组指标:标准差(std.deviation)、方差(variance)、全距 (range)、最小值(minimum)、最大值(maximum)、标准误(s.e.mean)。 distribution复选框组 用于定义描述分布特征的两个指标:偏度系数(skewness)和峰度系数(kurtosis)。 values are group midpoints复选框 当你输出的数据是分组频数数据,

15、并且具体数值是组中值时,选中该复选框以通知spss,免得它犯错误。众数(mode)指所有数值中出现频率最高的一个值,在国内用的非常少。【charts钮】弹出charts对话框,用于设定所做的统计图。chart type单选钮组 定义统计图类型,有四种选择:无、条图(bar chart)、圆图(pie chart)、直方图histogram),其中直方图还可以选择是否加上正态曲线(with normal curve)。 chart values单选钮组 定义是按照频数还是按百分比做图(即影响纵坐标刻度)。【format钮】弹出format对话框,用于定义输出频数表的格式,不过用处不大,一般不管。

16、order by单选钮组 定义频数表的排列次序,有四个选项:ascending values为根据数值大小按升序从小到大作频数分布;descending values为根据数值大小按降序从大到小作频数分布;ascending counts为根据频数多少按升序从少到多作频数分布;descending counts为根据频数多少按降序从多到少作频数分布。 multiple variables单选钮组 如果选择了两个以上变量做频数表,则compare variables可以将他们的结果在同一个频数表过程输出结果中显示,便于互相比较,organize output by variables则将结果在不

17、同的频数表过程输出结果中显示。 suppress tables more than.复选框 当频数表的分组数大于下面设定数值时禁止它在结果中输出,这样可以避免产生巨型表格。2. 分析实例例1 某地101例健康男子血清总胆固醇值测定结果如下,请绘制频数表、直方图,计算均数、标准差、变异系数cv、中位数m、p2.5和p97.5。4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 4.12 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.

18、74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.86 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.

19、48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 3.05解:为节省篇幅,这里只给出精确频数表的做法,假设数据已经输好,变量名为x,具体解法如下:1. analyze=>descriptive statistics=>frequencies 2. variables框:选入x 3. 单击statistics钮: 4. 选中mean、std.deviation、median复选框 5. 单击percentiles:输入2.5:单击add:输入97.5:单击add: 6. 单击continue钮 7. 单击ch

20、arts钮: 8. 选中bar charts 9. 单击continue钮 10. 单击ok得出结果后手工计算出cv。上面做出的直方图分组太多,需要进一步编辑。3.结果解释上题除直方图外的的输出结果如下:frequencies最上方为表格名称,左上方为分析变量名,可见样本量n为101例,缺失值0例,均数mean=4.69,中位数median=4.61,标准差std=0.8616,p2.5=3.04,p97.5=6.45。系统对变量x作频数分布表(此处只列出了开头部分),vaild右侧为原始值,frequency为频数,percent为各组频数占总例数的百分比(包括缺失记录在内),valid p

21、ercent为各组频数占总例数的有效百分比,cum percent为各组频数占总例数的累积百分比。(二)descriptives过程descriptives过程是连续资料统计描述应用最多的一个过程,他可对变量进行描述性统计分析,计算并列出一系列相应的统计指标。这和其他过程相比并无不同。但该过程还有个特殊功能就是可将原始数据转换成标准正态评分值并以变量的形式存入数据库供以后分析。1.界面说明【save standardized values as variables复选框】确定是否将原始数据的标准正态评分存为新变量。【options钮】弹出options对话框,大部分内容均在前面frequenc

22、es过程的statistics对话框中见过,只有最下方的display order单选钮组是新的,可以选择为变量列表顺序、字母顺序、均数升序或均数降序。2.结果解释下面是一个典型的descriptives过程结果统计表:一望可知,这里的大部分内容都在上一节见过,因此就不再多解释了。讲了两个过程,也许大家已经发现了:结果中的统计专业单词多数在对话框中就已经出现,因此我们以后会详细解释对话框的内容,结果中相同的单词不再重复解释。(三)explore过程explore过程可对变量进行更为深入详尽的描述性统计分析,主要用于对资料的性质、分布特点等完全不清楚时,故又称之为探索性分析。它在一般描述性统计指

23、标的基础上,增加有关数据其他特征的文字与图形描述,如枝叶图、箱图等,显得更加详细、全面,有助于用户制定继续分析的方案。1.界面说明【display单选钮组】用于选择输出结果中是否包含统计描述、统计图或两者均包括。【dependent list框】用于选入需要分析的变量。【factor list框】如果想让所分析的变量按某种因素取值分组分析,则在这里选入分组变量。【label cases by框】选择一个变量,他的取值将作为每条记录的标签。最典型的情况是使用记录id号的变量。【statistics钮】弹出statistics对话框,用于选择所需要的描述统计量。有如下选项:descriptives

24、复选框:输出均数、中位数、众数、5%修正均数、标准误、方差、标准差、最小值、最大值、全距、四分位全距、峰度系数、峰度系数的标准误、偏度系数、偏度系数的标准误及指定的均数可信区间。 m-estimators复选框:作中心趋势的粗略最大似然确定,输出四个不同权重的最大似然确定数。 outliers复选框:输出五个最大值与五个最小值。 percentiles复选框:输出第5%、10%、25%、50%、75%、90%、95%位数。【plot钮】弹出plot对话框,用于选择所需要的统计图。有如下选项:boxplots单选框组:确定箱式图的绘制方式,可以是按组别分组绘制(factor levels tog

25、ether),也可以不分组一起绘制(depentends together),或者不绘制(none)。 descriptive复选框组:可以选择绘制茎叶图(stem-and-leaf)和直方图(histogram)。 normality plots with test复选框:绘制正态分布图并进行变量是否符合正态分布的检验。 spread vs. level with levene test单选框组:当选择了分组变量时,绘制spread-versus-level图(我还没有找到他的中文名字该叫什么),设置绘图时变量的转换方式,并进行组间方差齐性检验。【options钮】用于选择对缺失值的处理方式

26、,可以是不分析有任一缺失值的记录、不分析计算某统计量时有缺失值的记录,或报告缺失值。2.结果解释以例6.1的数据为例,按默认方式下的选择,explore过程的输出如下:explore首先是例行的处理记录缺失值情况报告,可见101例均为有效值。上表详细列出了常用的描述统计量,如果有标准误也会列出(如偏度和峰度系数)。xx stem-and-leaf plotfrequency stem & leaf     1.00        2 .  7  &

27、#160;  8.00        3 .  00123334     9.00        3 .  556689999    24.00        4 .  000001111222333333344444    25.00 &

28、#160;      4 .  5555556666677777777788899    17.00        5 .  01111111222333334     9.00        5 .  556778889     6.00  

29、60;     6 .  112333     1.00        6 .  5     1.00 extremes    (>=7.2) stem width:    1.0000 each leaf:       1 case(s)以上

30、是茎叶图,整数位为茎,小数位为叶。这样可以非常直观的看出数据的分布范围及形态,在国外非常流行。以上是箱式图,中间的黑粗线为均数,红框为四分位间距的范围,上下两个细线为最大、最小值。(四)crosstabs过程crosstabs过程用于对计数资料和有序分类资料进行统计描述和简单的统计推断。在分析时可以产生二维至n维列联表,并计算相应的百分数指标。统计推断则包括了我们常用的x2检验、kappa值,分层x2(x2m-h)。如果安装了相应模块,还可计算n维列联表的确切概率(fisher's exact test)值。crosstabs过程不能产生一维频数表(单变量频数表),该功能由freque

31、ncies过程实现。1.界面说明【rows框】用于选择行*列表中的行变量。【columns框】用于选择行*列表中的列变量。【layer框】layer指的是层,对话框中的许多设置都可以分层设定,在同一层中的变量使用相同的设置,而不同层中的变量分别使用各自层的设置。如果要让不同的变量做不同的分析,则将其选入layer框,并用previous和next钮设为不同层。layer在这里用的比较少,在多元回归中我们将进行详细的解释。【display clustered bar charts复选框】显示重叠条图。【suppress table复选框】禁止在结果中输出行*列表。【exact钮】针对2*2以上的

32、行*列表设定计算确切概率的方法,可以是不计算(asymptotic only)、蒙特卡罗模拟(monte carlo)或确切计算(exact)。蒙特卡罗模拟默认进行10000次模拟,给出99%可信区间;确切计算默认计算时间限制在5分钟内。这些默认值均可更改。如果你在安装spss时没有安装exact模块,则此处对话框中不会出现exact钮。【statistics钮】弹出statistics对话框,用于定义所需计算的统计量。chi-square复选框:计算x2值。 correlations复选框:计算行、列两变量的pearson相关系数和spearman等级相关系数。 norminal复选框组:选

33、择是否输出反映分类资料相关性的指标,很少使用。a. contingency coefficient复选框:即列联系数,其值界于01之间;b. phi and cramer's v复选框:这两者也是基于x2值的,phi在四格表x2检验中界于-11之间,在r*c表x2检验中界于01之间;cramer's v 则界于01之间;c. lambda复选框:在自变量预测中用于反映比例缩减误差,其值为1时表明自变量预测应变量好,为0时表明自变量预测应变量差;d. uncertainty coefficient复选框:不确定系数,以熵为标准的比例缩减误差,其值接近1时表明后一变量的信息很大程度

34、来自前一变量,其值接近0时表明后一变量的信息与前一变量无关。ordinal复选框组:选择是否输出反映有序分类资料相关性的指标,很少使用。a. gamma复选框:界于01之间,所有观察实际数集中于左上角和右下角时,其值为1;b. somers'd复选框:为独立变量上不存在同分的偶对中,同序对子数超过异序对子数的比例;c. kendall's tau-b复选框:界于-11之间;d. kendall's tau-c复选框:界于-11之间;eta复选框:计算eta值,其平方值可认为是应变量受不同因素影响所致方差的比例; kappa复选框:计算kappa值,即内部一致性系数; r

35、isk复选框:计算比数比or值; mcnemanr复选框:进行mcnemanr检验(一种非参检验); cochran's and mantel-haenszel statistics复选框:计算x2m-h统计量(分层x2,也有写为x2cmh的),可在下方输出h0假设的or值,默认为1。【cells钮】弹出cells对话框,用于定义列联表单元格中需要计算的指标:counts复选框组:是否输出实际观察数(observed)和理论数(expected); percentages复选框组:是否输出行百分数(row)、列百分数(column)以及合计百分数(total); residuals复选

36、框组:选择残差的显示方式,可以是实际数与理论数的差值(unstandardized)、标化后的差值(standardized,实际数与理论数的差值除理论数),或者由标准误确立的单元格残差(adj. standardized);【format钮】用于选择行变量是升序还是降序排列。2.分析实例例2 某医生用国产呋喃硝胺治疗十二指肠溃疡,以甲氰咪胍作对照组,问两种方法治疗效果有无差别?处 理愈 合未愈合合计呋喃硝胺54862甲氰咪胍442064合 计9828126解:由于此处给出的直接是频数表,因此在建立数据集时可以直接输入三个变量行变量、列变量和指示每个格子中频数的变量,然后用weight cas

37、es对话框指定频数变量,最后调用crosstabs过程进行x2检验。假设三个变量分别名为r、c和w,则数据集结构和命令如下:r cw1.00 1.00 54.001.00 2.00 44.002.00 1.00 8.002.00 2.00 20.001. data=>weight cases 2. weight cases by单选框:选中 3. freqency variable:选入w 4. 单击ok钮 5. analyze=>descriptive statistics=>cros

38、stabs 6. rows框:选入r 7. columns框:c 8. statistics钮:chi-square复选框:选中:单击continue钮 9. 单击ok钮、3.结果解释上题的结果如下:crosstabs首先是处理记录缺失值情况报告,可见126例均为有效值。上面为列出的四格表,实际使用时可以在其中加入变量值标签,使看起来更清楚。上表给出了一堆检验结果,从左到右为:检验统计量值(value)、自由度(df)、双侧近似概率(asymp.sig.2-sided)、双侧精确概率(exact sig.2-sided)、单侧精确概率(exact sig.1-sided);从上到下为:pear

39、son卡方(pearson chi-square即常用的卡方检验)、连续性校正的卡方值(continuity correction)、对数似然比方法计算的卡方(likelihood ratio)、fisher's确切概率法(fisher's exact test)、线性相关的卡方值(linear by linear association)、有效记录数(n of valid cases)。另外,continuity correction和pearson卡方值处分别标注有a和b,表格下方为相应的注解:a.只为2*2表计算。b.0%个格子的期望频数小于5,最小的期望频数为13.78

40、。因此,这里无须校正,直接采用第一行的检验结果,即x2=6.133,p=0.013。实验三 均值比较一、 实验目的学习利用spss进行单样本、两独立样本以及成对样本的均值检验。二、 实验内容及步骤(一)描述统计(means过程)实验内容:某医师测得血红蛋白值(g%)如表3.1,试利用means过程作基本的描述性统计分析。表3.1对象编号性别年龄血红蛋白值对象编号性别年龄血红蛋白值1234567891011121314151617181920女男女女男男女男女女男男男女女女男男女男181618171618161818171818161717171716161812.8315.5012.2510.

41、0610.889.658.3611.668.547.7813.6610.5712.569.878.9911.3514.5612.408.0514.032122232425262728293031323334353637383940女男男女女女女男男男男女女女男男男男女男161618181718171616181616181818181717161611.3612.7815.098.678.5612.5611.5614.677.8812.3513.659.8710.0912.5516.0413.7811.6710.988.7811.35实验步骤:1建立数据文件。定义4个变量:id、gender、

42、age和hb,分别表示编号、性别、年龄和血红蛋白值。2. 选择菜单“analyzecompare meansmeans”,弹出“means”对话框。在对话框左侧的变量列表中,选择变量“血红蛋白值”进入“dependent list”列表框,选择变量“性别”进入“independent list”,单击“next”按钮,选择变量“年龄”进入“independent list”。3单击“options”按钮,在弹出的“选择描述统计量”对话框中设置输出的描述统计量。4单击“ok”按钮,得到输出结果。(二)单样本t检验(one-sample t test过程)实验内容:某地区10年测得16-18岁人口

43、的平均血红蛋白值为10.25。现在抽查测量了该地区40个16-18岁人口的血红蛋白如表1,试分析该地区现在16-18岁人口的血红蛋白与10年前相比,是否有显著的差异?实验步骤:1打开数据文件。2. 选择菜单“analyzecompare meansone-sample t test”。弹出“one-sample t test”对话框。 3在对话框左侧的变量列表中选择变量“血红蛋白”进入“test variable(s)” 框;在“test value” 编辑框中输入过去的平均血红蛋白值10.25. 4单击“ok”按钮,得到输出结果。(三)双样本t检验(independent-samples t

44、 test过程)实验内容:分别测得14例老年性慢性支气管炎病人及11例健康人的尿中17酮类固醇排出量(mg/dl)如下,试比较两组均数有无差别。 病 人2.90 5.41 5.48 4.60 4.03 5.10 4.97 4.24 4.36 2.72 2.37 2.09 7.10 5.92健康人5.18 8.79 3.14 6.46 3.72 6.64 5.60 4.57 7.71 4.99 4.01实验步骤: 1建立数据文件。 定义变量名:把实际观察值定义为x,再定义一个变量group来区分病人与健康人。输入原始数据,在变量group中,病人输入1,健康人输入2。 2. 选择菜单“

45、analyzecompare meansindependent-samples t test”项,弹出“independent- samples t test”对话框。从对话框左侧的变量列表中选x,进入“test variable(s)”框,选择变量“group”,进入“grouping variable”框,点击“define groups”钮弹出“define groups”定义框,在group 1中输入1,在group 2中输入2。3单击“ok”按钮,得到输出结果。(四)成对样本t检验(paired-samples t test过程)实验内容:某单位研究饲料中缺乏维生素e与肝中维生素a含

46、量的关系,将大白鼠按性别、体重等配为8对,每对中两只大白鼠分别喂给正常饲料和维生素e缺乏饲料,一段时期后将之宰杀,测定其肝中维生素a含量(mmol/l)如下,问饲料中缺乏维生素e对鼠肝中维生素a含量有无影响?大白鼠对别肝中维生素a含量(mmol/l)正常饲料组维生素e缺乏饲料组1234567837.220.931.441.439.839.336.131.925.725.118.833.534.028.326.218.3实验步骤:1建立数据文件。定义变量名:正常饲料组测定值为x1,维生素e缺乏饲料组测定值为x2,输入原始数据。2选择菜单“analyzecompare meanspaired-sa

47、mples t test”项,弹出“paired - samples t test”对话框。从对话框左侧的变量列表中选择变量x1、x2进入variables框。 3单击“ok”按钮,得到输出结果。实验四 相关分析一、 实验目的学习利用spss进行相关分析、偏相关分析、距离分析、线性回归分析和曲线回归。二、实验内容及实验步骤(一)两变量的相关分析(bivariate过程)实验内容:某地区10名健康儿童头发和全血中的硒含量(1000ppm)如下,试作发硒与血硒的相关分析。编号发硒血硒123456789107466886991736696587313101311169714510实验步骤:1建立数据

48、文件。定义变量名:发硒为x,血硒为y,按顺序输入相应数值。2选择菜单“analyzecorrelatebivariate” ,弹出“bivariate correlation”对话框。在对话框左侧的变量列表中选x、y,使之进入“variables”框;再在“correlation coefficients” 框中选择pearson相关系数(r);在“test of significance”框中选相关系数的 “two-tailed”(双侧)检验。选中复选框“flag significant correlations”设置是否突出显示显著相关。3单击“options”按钮,弹出“bivariat

49、e correlation: options”对话框,选择“means and standard deviations”和“cross-product deviations and covariances”项,输出x、y的均数与标准差以及xy交叉乘积的标准差与协方差。4单击“ok”按钮,得到输出结果。(二)偏相关分析(partial 过程)实验内容:某地29名13岁男童身高(cm)、体重(kg)和肺活量(ml)的数据如下表, 试对该资料作控制体重影响作用的身高与肺活量相关分析。编号身高(cm)体重(kg)肺活量(ml)编号身高(cm)体重(kg)肺活量(ml)12345678910111213

50、1415135.1139.9163.6146.5156.2156.4167.8149.7145.0148.5165.5135.0153.3152.0160.532.030.446.233.537.135.541.531.033.037.249.527.641.032.047.21750200027502500275020002750150025002250300012502750175022501617181920212223242526272829153.0147.6157.5155.1160.5143.0149.4160.8159.0158.2150.0144.5154.6156.547.

51、240.543.344.737.531.533.940.438.537.536.034.739.532.017502000225027502000175022502750250020001750225025001750实验步骤:1建立数据文件。定义变量名:身高为height,体重为weight,肺活量为vc,按顺序输入相应数据。2选择菜单“analyzecorrelatepartial” ,弹出“partial correlations”对话框。在对话框左侧的变量列表中选变量height、vc 进入variables框,选择要控制的变量weight进入“controlling for”框中,以

52、在控制体重的影响下对变量身高与肺活量进行偏相关分析;在“test of significance”框中选双侧检验。3单击“options”按钮,弹出“partial correlations: options”对话框。在“statistics”复选框组中选择要输出的统计量。4单击“ok”按钮,得到输出结果。(三)距离分析(distances过程)实验内容:某医师对10份标准血红蛋白样品作三次平行检测,结果如下,问检测结果是否一致? 样品号12345678第一次第二次第三次12.3612.4012.1812.1412.2012.2212.3112.2812.3512.3212.2512

53、.2112.1212.2212.1012.2812.3412.2512.2412.3112.2012.4112.3012.46实验步骤:1建立数据文件。定义变量名:第一次测量值为hb1,第二次测量值为hb2,第三次测量值为hb3,输入相应数据。2选择菜单“analyzecorrelatedistance” ,弹出“distance”对话框。在对话框左侧的变量列表中选变量hb1、hb2、hb3,进入“variables” 框。在“compute distances”框中选择“between variables”,作变量之间的距离相关分析。在“measure”栏中选择“similarities”相

54、似性测距。单击“measure” 按钮,系统弹出“distance: similarity measure”对话框,选择“pearson correlation” 为测量距离。3单击“ok”按钮,得到输出结果。(四)线性回归分析(linear过程)实验内容:某医师测得10名3岁儿童的身高(cm)、体重(kg)和体表面积(cm2)资料如下。试用多元回归方法确定以身高、体重为自变量,体表面积为应变量的回归方程。儿童编号体表面积(y)身高(x1)体重(x2)123456789105.3825.2995.3585.2925.6026.0145.8306.1026.0756.41188.087.688.

55、589.087.789.588.890.490.691.211.011.812.012.313.113.714.414.915.216.0实验步骤:1建立数据文件。定义变量名:体表面积为y,保留3位小数;身高、体重分别为x1、x2,1位小数。输入原始数据。2选择菜单“analyzeregressionlinear” ,弹出“linear regression”对话框。从对话框左侧的变量列表中选择变量y,使之进入“dependent”框,选择变量x1、x2,进入“indepentdent(s)”框;在“method”处下拉菜单,选用enter法。3单击“statistics”按钮选择是否作变量的描述性统计、回归方程应变量的可信区间估计等分析;单击“plots”按钮选择对标准化y预测值作变量分布图;单击“sav

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论